OCRFeeder et Tessaract [Réglé]
Le logiciel de ne reconnaît pas le texte
Logiciels / Bureautique

Ysabeau Membre non connecté
-
- Voir le profil du membre Ysabeau
- Inscrit le : 09/08/2015
- Site internet
- Groupes :
-
Ambassadeur
je voudrais utiliser OCRFeeder pour reconnaître le texte de PDF en texte ou en image
Quel que soit le moteur d'OCR, le texte n’est pas reconnu. J'ai pourtant, pour Tesseract, installé le module de langue fr. OCRFeeder semble oublier la langue.
gscan2pdf ne fonctionne pas (il a l'air de ne rien faire du tout) et l'installation d'un flatpak a échoué.
Il y a un truc que je n'ai pas fait ?
Merci.
OS préféré Mageia, environnements de bureau LXDE et XFCE, CMS préféré SPIP, suite bureautique préférée LibreOffice, logiciel de dessin préféré Inkscape.

steven Membre non connecté
-
- Voir le profil du membre steven
- Inscrit le : 18/05/2018
No Comment ...
Merci de ne pas 'rebondir' sur mes post's
Censor => 2025





Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Sauf qu'en effet, ça ne marche pas dans Mageia 9.
Code TEXT :
ERROR - Open file, Error extracting images from PDF
Il n'est pas évident de trouver ce qui cloche, il faudra un rapport de bogue.
Je te remercie de m'avoir fait découvrir OCRFeeder, qui marche bien pour moi.
L'installation a appelé:
gtkspell3-3.0.10-3.mga9.x86_64 lib64art_lgpl2-2.3.21-13.mga9.x86_64 lib64gtkspell3-gir3.0-3.0.10-3.mga9.x86_64 lib64gtkspell3_0-3.0.10-3.mga9.x86_64
ocrfeeder-0.8.5-1.mga9.noarch python-odf-doc-1.4.1-4.mga9.noarch python-odf-tools-1.4.1-4.mga9.noarch python3-defusedxml-0.7.1-3.mga9.noarch
python3-odf-1.4.1-4.mga9.noarch python3-reportlab-3.6.13-1.mga9.x86_64 python3-sane-2.9.1-5.mga9.x86_64
Yves

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Papoteur :
J'ai l'expérience d'OCR qui m'ont bien servis, y compris en français. Le plus pratique est en effet d'ouvrir les documents dans gscan2pdf et de lancer la ROC dessus.
Sauf qu'en effet, ça ne marche pas dans Mageia 9.
Sauf qu'en effet, ça ne marche pas dans Mageia 9.
Code TEXT :
ERROR - Open file, Error extracting images from PDF
Finalement, il suffit d'installer poppler.
Yves

Ysabeau Membre non connecté
-
- Voir le profil du membre Ysabeau
- Inscrit le : 09/08/2015
- Site internet
- Groupes :
-
Ambassadeur
Si l'un fonctionne pour toi et pas l'autre, et réciproquement. Je me demande si ce n'est pas une question d'interface. Il me semble que tu es sous KDE, et moi Xfce. C'est pas forcément neutre.
OS préféré Mageia, environnements de bureau LXDE et XFCE, CMS préféré SPIP, suite bureautique préférée LibreOffice, logiciel de dessin préféré Inkscape.

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
C'est peut être aussi un question de dépendance pour OCRFeeder.
Yves

Ysabeau Membre non connecté
-
- Voir le profil du membre Ysabeau
- Inscrit le : 09/08/2015
- Site internet
- Groupes :
-
Ambassadeur
En fait pour gscan2pdf j'ai dû installer le paquet tesseract-fra (paquet de données de langue) qui ne l'était pas.
OS préféré Mageia, environnements de bureau LXDE et XFCE, CMS préféré SPIP, suite bureautique préférée LibreOffice, logiciel de dessin préféré Inkscape.
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie