subtitleripper [Réglé]
subtitleripper n'existe plus sous Mga9 ?
Retours d'expériences

steven Membre non connecté
-
- Voir le profil du membre steven
- Inscrit le : 18/05/2018
C'est moi ou subtitleripper n'existe plus sous mga9 ?
* qui existais sous Mga8 https://rpmfind.net/linux/rpm2html/search.php?query=subtitleripper
Merci
No Comment ...
Merci de ne pas 'rebondir' sur mes post's
Censor => 2025





Visiteur
Visiteur
Pour copier et convertir les sous-titres de DVD en TXT, je recommande SubRip sous Wine.
Il existe également un script natif basé sur tesseract en mode automatique...
Pour une copie simple (sans reconnaissance en texte), par exemple MakeMKV (+ peut-être mkvextract de MKVToolnix), dvdbackup ou simple copy.

Yuusha Membre non connecté
-
- Voir le profil du membre Yuusha
- Inscrit le : 04/07/2017
- Groupes :
-
Modérateur
-
Administrateur
-
Forgeron
subtitleripper a été supprimé car il utilisait transcode qui a lui-même été supprimé. transcode a été supprimé car il ne se construisait plus et, si je comprends bien, le dépôt upstream n'existe plus.

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Yuusha :Bonjour,
subtitleripper a été supprimé car il utilisait transcode qui a lui-même été supprimé. transcode a été supprimé car il ne se construisait plus et, si je comprends bien, le dépôt upstream n'existe plus.
Je rajoute que subtitleripper nn'a pas été mis à jour depuis ... 2003 !
Il va falloir sélectionner un autre outil.
Il y en a une collection, de ce que je comprends, mais n'étant pas utilisateur, je ne ferai pas de recommandation. Sauf à dire qu'une solution avec Wine n'est pas la meilleure.
Yves

steven Membre non connecté
-
- Voir le profil du membre steven
- Inscrit le : 18/05/2018
Papoteur :Yuusha :Bonjour,
subtitleripper a été supprimé car il utilisait transcode qui a lui-même été supprimé. transcode a été supprimé car il ne se construisait plus et, si je comprends bien, le dépôt upstream n'existe plus.
Je rajoute que subtitleripper nn'a pas été mis à jour depuis ... 2003 !
Il va falloir sélectionner un autre outil.
Il y en a une collection, de ce que je comprends, mais n'étant pas utilisateur, je ne ferai pas de recommandation. Sauf à dire qu'une solution avec Wine n'est pas la meilleure.
Merci a tous

> Sauf à dire qu'une solution avec Wine n'est pas la meilleure.
* Là, je suis assez d'accord. d'autant qu'il me semble que subrip n’était deja plus tout jeune non plus, il me semble 8|
En tout cas, merci a tous

Je passe en reglé

No Comment ...
Merci de ne pas 'rebondir' sur mes post's
Censor => 2025





Visiteur
Visiteur
Papoteur :une solution avec Wine n'est pas la meilleure
Oui, sur chaque nouveau DVD, vous devrez entraîner le programme (entrer tous les caractères alphabétiques). Puis corriger manuellement les « I » et les « l » confondus.
Le script tesseract le fait automatiquement, mais tesseract peut faire preuve d'intelligence inutile (c'est-à-dire remplacer le mot par un autre).
https://www.rigacci.org/wiki/doku.php/doc/appunti/linux/video/subtitleripper
https://github.com/ruediger/VobSub2SRT

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Il y a une dizaine de demandes de tirage dans le pipeline...
Yves

Visiteur
Visiteur
Ce fork https://github.com/bubonic/VobSub2SRT compile (au moins avec tesseract 4, je ne sais pas pour 5).
steven, je peux compiler vobsub2srt pour toi. Pour Mageia 9.
Des informations utiles peuvent être trouvées ici :
https://aur.archlinux.org/packages/vobsub2srt-git
https://aur.archlinux.org/cgit/aur.git/tree/PKGBUILD?h=vobsub2srt-git

Visiteur
Visiteur
J'ai compilé vobsub2srt-1.0-1.x86_64.rpm (Mageia 9) pour toi. Packed avec RPMCreator.
Dépendances :
Code :
sudo urpmi lib64tesseract5 lib64tiff6
vobsub2srt-1.0-1.x86_64.rpm

Visiteur
Visiteur
mkvextract ne veut pas extraire les sous-titres idx/sub. vobcopy ne fonctionne pas avec le dossier VIDEO_TS local.
Instruction correcte :
Code :
cd VIDEO_TS
ffmpeg -fflags +genpts -fflags +igndts -probesize 500M -analyzeduration 500M -i concat:"VTS_01_1.VOB|VTS_01_2.VOB|VTS_01_3.VOB|VTS_01_4.VOB|VTS_01_5.VOB" -map 0:1 -map 0:2 -map 0:3 -c copy -y video.VOB
mencoder video.VOB -vobsubout subs -vobsuboutindex 0 -ovc copy -oac copy -o /dev/null
vobsub2srt --ifo ./VTS_01_0.IFO --tesseract-lang eng subs
Don't use ffmpeg. Just merge the VOB files with cat.
Édité par Visiteur Le 12/10/2024 à 00h49

Visiteur
Visiteur
Si tu installes Xubuntu 22.04 dans VirtualBox, je te donnerai une bonne build...
Il peut s'agir d'une incompatibilité avec tesseract 5.
Édité par Visiteur Le 09/10/2024 à 03h41

Visiteur
Visiteur
J'ai une mauvaise nouvelle pour vous. J'ai fait quelques tests en installant Mageia 8 dans Docker. La version de tesseract n'a rien à voir avec cela. Mageia [8/9] a un mauvais tesseract, Ubuntu [22.04 Jammy] a un bon tesseract. Je parle de la façon dont tesseract est compilé, ou de la qualité de ses modèles de langage.
Tests :
a. tesseract 5, mageia 9 - mauvais
b. tesseract 4, mageia 8 - mauvais
Cependant, il y a des différences entre a et b, des erreurs différentes dans les fichiers srt
c. tesseract 4, ubuntu 22.04 - bon
d. tesseract 4, ubuntu 22.04 (binaire vobsub2srt fourni par mageia 8) - bon
md5sum c et d correspondent
vobsub2srt.zip

Visiteur
Visiteur
Pour le tesseract 5 :
urpmi tesseract-fra
https://packages.ubuntu.com/noble/all/tesseract-ocr-fra/download (24.04)
/usr/share/tesseract-ocr/5/tessdata/fra.traineddata
VV
/usr/share/tessdata/fra.traineddata (Mageia 9)
Édité par Visiteur Le 09/10/2024 à 21h49

Visiteur
Visiteur
Et cela sans tenir compte des langues.
Code :
tesseract --version
tesseract 5.4.1
leptonica-1.84.1
libgif 5.2.2 : libjpeg 8d (libjpeg-turbo 3.0.2) : libpng 1.6.43 : libtiff 4.7.0 : zlib 1.3.1 : libwebp 1.4.0 : libopenjp2 2.5.2
Found OpenMP 201511
Found libarchive 3.7.6 zlib/1.3.1 liblzma/5.6.2 bz2lib/1.0.8 liblz4/1.10.0 libzstd/1.5.6
Found libcurl/8.10.1 OpenSSL/3.1.4 zlib/1.3.1.zlib-ng brotli/1.1.0 zstd/1.5.6 libidn2/2.3.7 libpsl/0.21.5 libssh/0.10.6/openssl/zlib nghttp2/1.62.1 OpenLDAP/2.6.8

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
artenaki :Oui, Ubuntu a de bons modèles (au moins pour la Russie). Copiez-les vous-même. Si vous n'êtes pas satisfait de la qualité de la reconnaissance srt.
Pour le tesseract 5 :
urpmi tesseract-fra
https://packages.ubuntu.com/noble/all/tesseract-ocr-fra/download (24.04)
/usr/share/tesseract-ocr/5/tessdata/fra.traineddata
VV
/usr/share/tessdata/fra.traineddata (Mageia 9)
A priori, la version de Ubuntu est la 4.1.0 en ce qui concerne les données, la même que celle de Mageia, et la dernière disponible sur github ...
Alors je ne comprends pas pourquoi ce changement pourrait améliorer les choses.
https://github.com/tesseract-ocr/tessdata
Yves
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie