Reconnaissance vocale pour Libreoffice

Dicter son texte à Writer Logiciels / Bureautique

Papoteur Membre non connecté

Modérateur Équipe Mageia Administrateur Forgeron

Le 25/04/2021 à 19h34

Salut Squid,
je te fournis mes notes d'il y a quelque temps. Je n'étais pas arrivé à qqch de concluant.
La piste est pocket_sphinx qui est un outil pour traiter un fichier son avec en référence un modèle.
On a nocomprendo intégré dans Mageia 8, mais c'est plus destiné à de la commande vocale. Ça vaut toutefois la peine de regarder.

Caché :

L'outil essentiel est pocketsphinx.
Il semble que la version Mageia est trop vieille.
pocketsphinx_continuous -dict /usr/share/pocketsphinx/model/lm/fr_FR/frenchWords62K.dic -hmm /usr/share/pocketsphinx/model/lm/fr_FR/french_f0/ -lm /usr/share/pocketsphinx/model/lm/fr_FR/french3g62K.lm.dmp -inmic yes
fonctionne, mais le résultat n'est pas terrible.
Vérifier le niveau du micro. OK

Freespeech est une interface à pocketsphinx.
git clone https://github.com/themanyone/freespeech-vr.git
Une autre :
https://github.com/Uberi/speech_recognition
ladspa-plugins-swh

Remplaçant : https://linuxfr.org/users/be-root/journaux/nocomprendo-la-commande-vocale-pour-linux

https://bakerstreetsystems.com/blog/post/training-cmu-sphinx-speech-recognition-software-ubuntu-1404
Construction d'un modèle perso avec Sphinx
Installer
sphinxbase, lib64sphinxbase-devel
git clone https://github.com/cmusphinx/sphinxtrain.git
cd sphinxtrain
./configure
make
sudo make install
Dans un répertoire nouveau
bw
map_adapt
mk_s2sendump
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/French/cmusphinx-fr-ptm-5.2.tar.gz/download

sphinx_fe -argfile /home/yves/dev/model-voix/cmusphinx-fr-ptm-5.2/feat.params -samprate 16000 -c sample.fileids -di . -do . -ei wav -eo mfc -mswav yes
./bw \
-hmmdir cmusphinx-fr-ptm-5.2 \
-moddeffn cmusphinx-fr-ptm-5.2/mdef \
-ts2cbfn .ptm. \
-feat 1s_c_d_dd \
-svspec 0-12/13-25/26-38 \
-cmn current \
-agc none \
-dictfn frenchWords62K.dic \
-ctlfn sample.fileids \
-lsnfn sample.transcription \
-accumdir .

./map_adapt \
-moddeffn cmusphinx-fr-ptm-5.2/mdef \
-ts2cbfn .ptm. \
-meanfn cmusphinx-fr-ptm-5.2/means \
-varfn cmusphinx-fr-ptm-5.2/variances \
-mixwfn cmusphinx-fr-ptm-5.2/mixture_weights \
-tmatfn cmusphinx-fr-ptm-5.2/transition_matrices \
-accumdir . \
-mapmeanfn mon-modele/means \
-mapvarfn mon-modele/variances \
-mapmixwfn mon-modele/mixture_weights \
-maptmatfn mon-modele/transition_matrices

pocketsphinx_continuous -hmm monmodele -lm en-us.lm.bin -dict cmudict-en-us.dict -infile sidewalk.wav > sidewalk.txt
pocketsphinx_continuous -hmm mon-modele -lm french3g62K.lm.dmp -dict frenchWords62K.dic -infile 1.wav > 1.txt

Yves

Répondre

Vous n'êtes pas autorisé à écrire dans cette catégorie

Notre Mission	Liens du site	Nous joindre	MLO est hébergé par
MLO est le forum francophone de la distribution Mageia et vous propose également un portail dédié aux débutants. MLO vous apporte un support sur la distribution grâce à son forum et vous offre des nouvelles de la distribution, des logiciels libres et de l'Open Source en général. Notre site a aussi pour but de vous montrer que Mageia est un système d'exploitation complet et facile à prendre en main. Vous apprendrez à installer simplement et à administrer efficacement votre système en un temps record.	Forum Documentation News du libre Mageia	Contacter MLO Mastodon MLO Flux RSS	MLO est un projet soutenu par Nos partenaires et amis
MLO est mis à disposition selon les termes de la licence Creative Commons.

squid-f Membre non connecté

m@rco123 Membre non connecté

OPS56 Membre non connecté

squid-f Membre non connecté

OPS56 Membre non connecté

squid-f Membre non connecté

Papoteur Membre non connecté

squid-f Membre non connecté

Visiteur

squid-f Membre non connecté

endorfin64 Membre non connecté

endorfin64 Membre non connecté