ocr sous mageia

Troumad Membre non connecté
-
- Voir le profil du membre Troumad
- Inscrit le : 16/10/2010
- Site internet
- Groupes :
Tout d'abord, j'ai voulu faire une recherche avec ocr sur le forum et comme ce sigle n'a que 3 lettres, c'est infaisable.
Je viens de faire un test avec Tesseract , c'est la cata ! En plus, je n'ai pas trouvé d'interface graphique !
On conseille aussi cuneiform, mais je n'ai pas trouvé de rpm.
Amicalement Votre
Bernard SIAUD Alias Troumad
Bernard SIAUD Alias Troumad

mammig Membre non connecté
-
- Voir le profil du membre mammig
- Inscrit le : 10/06/2011
- Groupes :
-
Membre d'Honneur
il n'y a pas de paquet "cuneiform" pour mageia ( mais tu peux en faire la demande sur le bugzilla )
Il y a bien longtemps, il a été question d'ocr sur ce forum :
http://www.mageialinux-online.org/forum/topic-5442+resolu-reconnaissance-de-caracteres.php
et sur d'autres forum :
http://forum.framasoft.org/viewtopic.php?f=12&t=25619
http://www.lea-linux.org/documentations/index.php/Logith%C3%A8que:OCR
ici tu trouveras un comparatif ( en anglais ) de divers ocr :
http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison
il n'y a que gocr qui a été packagé pour Mageia
et un article expliquant une solution qui semble fonctionner
http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/
cette solution utilise Xsane, imagemagick et tesseract qui font tous parti des packages de Mageia
Tu peux aussi essayer ce site qui utilise tesseract :
http://www.free-ocr.com/
La plupart de ces articles sont assez anciens, j'espère que tu y trouveras ton bonheur


Troumad Membre non connecté
-
- Voir le profil du membre Troumad
- Inscrit le : 16/10/2010
- Site internet
- Groupes :
mammig :
Le problème ne vient donc pas de tesseract, mais de chez moi :(EN plus chez moi, il ne veut qu'un format tiff :
Code :
tesseract derro1.png derro1 -l eng
Tesseract Open Source OCR Engine with LibTiff
name_to_image_type:Error:Unrecognized image type:derro1.png
IMAGE::read_header:Error:Can't read this image type:derro1.png
Read of file derro1.png failed.
Amicalement Votre
Bernard SIAUD Alias Troumad
Bernard SIAUD Alias Troumad

mammig Membre non connecté
-
- Voir le profil du membre mammig
- Inscrit le : 10/06/2011
- Groupes :
-
Membre d'Honneur
as-tu essayer de convertir ton image en tiff avec un logiciel comme gimp ?
le site fait peut-être une convertion des fichiers images en tiff ou en autre chose avant de les donner à tesseract
http://code.google.com/p/tesseract-ocr/
oui c'est ça, il ne fonctionne qu'avec du tiff non compressé.
Le site doit utiliser un programme qui traduit les formats des images en tiff.
libtiff te permet de donner à tesseract du tiff compressé.

Yann Membre non connecté
-
- Voir le profil du membre Yann
- Inscrit le : 10/11/2007
- Groupes :
amicalement, Yann.
Mageia 9 64 XFCE sur mon bureau et sur mon portable.
Mageia 9 64 XFCE sur mon bureau et sur mon portable.

Troumad Membre non connecté
-
- Voir le profil du membre Troumad
- Inscrit le : 16/10/2010
- Site internet
- Groupes :
gscan2pdf sert à faire un pdf à partir d'images ou à faire de la reconnaissance de caractères ? Je n'arrive pas à trouver comment faire de l'OCR avec !
Édité par Troumad Le 08/07/2011 à 15h48
Amicalement Votre
Bernard SIAUD Alias Troumad
Bernard SIAUD Alias Troumad

Yann Membre non connecté
-
- Voir le profil du membre Yann
- Inscrit le : 10/11/2007
- Groupes :
Tu commences par scanner ton texte puis menu outil / roc.
amicalement, Yann.
Mageia 9 64 XFCE sur mon bureau et sur mon portable.
Mageia 9 64 XFCE sur mon bureau et sur mon portable.
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie