Tesseract

Visiteur
Visiteur
Test de qualité de la reconnaissance.
Je sais que ce n'est pas le mode optimal (blanc sur noir).

Code :
urpmi tesseract-fra
tesseract test.png output -l fra
Résultats :
1. openSUSE Tumbleweed - le meilleur de tous.
2. Mageia 9 - la note 10 a cassé la reconnaissance du mot « capitale ».
3. Ubuntu 22.04 (Tesseract 4) - très mauvais : le mot « capitale » est complètement déformé, ainsi que la ligne inférieure pour une raison quelconque.
Édité par Visiteur Le 13/10/2024 à 05h41

gerard-ll Membre non connecté
-
- Voir le profil du membre gerard-ll
- Inscrit le : 09/12/2011
- Groupes :
artenaki :Test de qualité de la reconnaissance.
Salut artenaki, ah c'est pas mal quand même comme logiciel!
Ça peut servir.
Je suis étonné de la qualité de la reconnaissance des caractères quand même.
Pal mal Mageia!
@+
Gérard
@+
Gérard

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
man :Tesseract 4 ajoute un nouveau moteur d'OCR basé sur un réseau neuronal (LSTM) qui se concentre sur la reconnaissance des lignes, mais prend toujours en charge le moteur d'OCR de Tesseract 3 qui fonctionne en reconnaissant les modèles de caractères. La compatibilité avec Tesseract 3 est activée par --oem 0. Cela nécessite également des fichiers de données entraînées qui supportent l'ancien moteur, par exemple ceux du référentiel tessdata (https://github.com/tesseract-ocr/tessdata).
As-tu testé l'option --oem 0 ?
Yves

Visiteur
Visiteur
Code :
tesseract test.png output -l fra --oem 0
Error: Tesseract (legacy) engine requested, but components are not present in /usr/share/tessdata/fra.traineddata!!
Failed loading language 'fra'
Tesseract couldn't load any languages!
Could not initialize tesseract.
mageia 9 --oem 0:
Citation :Paris est situé dans la partie centrale du bassin parisien. Cet ensemble géologique est
une cuvette orientée nordflordouesflsud—sud—est limitée par des massifs hercyniens
(Ardenne, Hunsrück, Vosges, Morvan, Massif central et Massif armoricain), sur laquelle
sont accumulés des terrains sédimentaires. Le centre de cette cuveue est situé dans la
Brie a Courgivaux au sud de Chateauïhierry, 80 km a l'est de la capitale“. La
géologie de Paris et de ses alentours représente une synthèse de cet ensemble.
Les premiers sédimenœ (grès et schistes) ont été déposés sur le socle cristallin par une
mer peu profonde au Cambrien, au silurien et au dévonien (de 540 a458 milli ns
d'années). Apres une émersion au Carbonifère et au permien (de 355 51452 millions
d'années), les mers chaudes ont envahi le bassin déposant des micro—organismes
formant des Douches calcaires, se sont retirées puis sont revenues. Ces phases de
tvansgvessions marines, d‘émersion, enneooupées d'épisodes lawstres ont tonne sous
le sol de Paris, auoessus des plus anciennes strates profondément enlouies, des
couches successives de calcaires, de sables, de gypse et de marnes d‘une épaisseur
mtale d‘environ 2 500 mètres en plusieurs cycles.
mageia 9 (not oem):
Citation :Paris est situé dans la partie centrale du bassin parisien. Cet ensemble géologique est
une cuvette orientée nord-nord-ouest/sud-sud-est limitée par des massifs hercyniens
(Ardenne, Hunsrück, Vosges, Morvan, Massif central et Massif armoricain), sur laquelle
sont accumulés des terrains sédimentaires. Le centre de cette cuvette est situé dans la
Brie à Courgivaux au sud de Château-Thierry, 80 km à l'est de la capilalelo_ La
géologie de Paris et de ses alentours représente une synthèse de cet ensemble.
Les premiers sédiments (grès et schistes) ont été déposés sur le socle cristallin par une
mer peu profonde au cambrien, au silurien et au dévonien (de -540 à -358 millions
d'années). Après une émersion au Carbonifère et au permien (de -358 à —252 millions
d'années), les mers chaudes ont envahi le bassin déposant des micro-organismes
formant des couches calcaires, se sont retirées puis sont revenues. Ces phases de
transgressions marines, d’émersion, entrecoupées d'épisodes lacustres ont formé sous
le sol de Paris, au-dessus des plus anciennes strates profondément enfouies, des
couches successives de calcaires, de sables, de gypse et de marnes d’une épaisseur
totale d'environ 2 500 mètres en plusieurs cycles.
opensuse (not oem):
Citation :Paris est situé dans la partie centrale du bassin parisien. Cet ensemble géologique est
une cuvette orientée nord-nord-ouest/sud-sud-est limitée par des massifs hercyniens
(Ardenne, Hunsrück, Vosges, Morvan, Massif central et Massif armoricain), sur laquelle
sont accumulés des terrains sédimentaires. Le centre de cette cuvette est situé dans la
Brie à Courgivaux au sud de Château-Thierry, 80 km à l'est de la capitale °. La
géologie de Paris et de ses alentours représente une synthèse de cet ensemble.
Les premiers sédiments (grès et schistes) ont été déposés sur le socle cristallin par une
mer peu profonde au cambrien, au silurien et au dévonien (de -540 à -358 millions
d'années). Après une émersion au Carbonifère et au permien (de -358 à -252 millions
d'années), les mers chaudes ont envahi le bassin déposant des micro-organismes
formant des couches calcaires, se sont retirées puis sont revenues. Ces phases de
transgressions marines, d'émersion, entrecoupées d'épisodes lacustres ont formé sous
le sol de Paris, au-dessus des plus anciennes strates profondément enfouies, des
couches successives de calcaires, de sables, de gypse et de marnes d'une épaisseur
totale d'environ 2 500 mètres en plusieurs cycles.
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie