convertir pdf en texte modifiable

convertir pdf en texte modifiable

Bonjour

La question est un peu lapidaire… Ce sont des humains qui répondent sur ce site… :slight_smile:

Avec un pdf hybride le document s’ouvre directement dans Writer et est donc modifiable.

Dans les autres cas, le pdf va s’ouvrir dans le module Draw, chaque paragraphe devenant une zone de texte. Ceci ne permet “localement” que de petites modifications.

S’il s’agit de récupérer sous forme de texte une solution est de recourir à un scan+ocr.

Cordialement

@Acropole j’ai bien reçu votre réponse privée via la “modération” et je vous remercie de cette attention. Je me doutais que l’interface pouvait susciter ces quiproquo :slight_smile:

Cordialement

Oui apparemment il existe un OCR LibreOCR qui est une extension installable dans LibreOffice par contre c’est la galère sous MacOS… cela nécessite l’environnement Java qui fait dans les 80Mo… une fois JRE installé il demande Java Development Kit qui fait dans les 250Mo mais au préalable il faudra biensûr créer un compte Oracle… sympa l’extension OCR qui ne pèse que 888ko mais nécessite toute l’usine à gaz.

Edit: En fait LibreOCR ne sert à rien. J’ai absolument pas compris comment ça marche. Manque le bouton pour l’activer pour qu’il scanne l’image en recherche de zone de texte… en fait y a absolument aucune aide pour savoir comment le faire fonctionner une fois l’extension installée
Bref, tout ça pour ça… Je viens de trouver la solution a mon problème… l’OCR en ligne… j’y avais pas pensé… on ne peut pas personnaliser les zones mais bon j’aurais dejà un rendu de base.

Me reste plus qu’à supprimer toutes les merdes que j’ai installées inutilement.