Reconnaissance vocale pour Libreoffice
Dicter son texte à Writer
Logiciels / Bureautique

squid-f Membre non connecté
-
- Voir le profil du membre squid-f
- Inscrit le : 03/04/2016
- Groupes :
-
Membre d'Honneur

Je cherche un logiciel ou extension pour dicter un texte qui sera transcrit pas Libreoffice Writer.
Est-ce que cela existe sous Linux (et Mageia bien-sûr) ?
Je viens de faire quelques recherches sur le web. Je n'ai trouvé que peu de chose et que pour Windows.
Est-ce que KDE connect apporterait d'autres options via un smartphone, par exemple ?
Merci

A+
« Plus les hommes seront éclairés et plus ils seront libres. » ~ Voltaire

m@rco123 Membre non connecté
-
- Voir le profil du membre m@rco123
- Inscrit le : 15/05/2009
- Groupes :
https://www.youtube.com/watch?v=oQg6j2_QSzg
J'ai trouvé ca ... à voir !
Lenovo 110-17acl
cg Mullins [Radeon R3 Graphics] / ssd SanDisk 250Go
Mageia 9 plasma 64b
packard ls11hr
cg intel 810 / ssd SanDisk 128Go
Mageia 9 plasma 64b
cg Mullins [Radeon R3 Graphics] / ssd SanDisk 250Go
Mageia 9 plasma 64b
packard ls11hr
cg intel 810 / ssd SanDisk 128Go
Mageia 9 plasma 64b

OPS56 Membre non connecté
-
- Voir le profil du membre OPS56
- Inscrit le : 18/11/2008
- Groupes :
l'interface libre office des écoles, le fait très bien.
J'ai fait un post sur le sujet, il y a peu de temps.
@+

Dell G3-15 Intel Corei7 - 16Go Ram - Nvidia GTX1660 Ti (Tri boot Mageia 9- 64 bits / Linux Mint 20 Cinamon/ Windows 10)
Core i5 760 - 8Go Ram - Nvidia Gforce 450 - (Triple boot Mageia 9-64 bits - Plasma 5 / Mint 20 Cinamon / Open Suse Tumbleweed - Plasma 5)

squid-f Membre non connecté
-
- Voir le profil du membre squid-f
- Inscrit le : 03/04/2016
- Groupes :
-
Membre d'Honneur
Merci OPS56 : je cherche à pouvoir dicter le texte non pas l'écouter. J'ai l'impression que ton post est plus une assistance pour faire lire le texte écrit au clavier. Mais je vais fouiller aussi pour sûr.
A+
« Plus les hommes seront éclairés et plus ils seront libres. » ~ Voltaire

OPS56 Membre non connecté
-
- Voir le profil du membre OPS56
- Inscrit le : 18/11/2008
- Groupes :
squid-f :
Merci m@rco123 : cela à l'air de pouvoir faire l'affaire. Je vais fouiller.
Merci OPS56 : je cherche à pouvoir dicter le texte non pas l'écouter. J'ai l'impression que ton post est plus une assistance pour faire lire le texte écrit au clavier. Mais je vais fouiller aussi pour sûr.
A+
Merci OPS56 : je cherche à pouvoir dicter le texte non pas l'écouter. J'ai l'impression que ton post est plus une assistance pour faire lire le texte écrit au clavier. Mais je vais fouiller aussi pour sûr.
A+
Oui désolé, j'ai lu trop vite et je n'avais pas compris.
Dans ce sens là, je n'ai pas de solution, désolé.

@+

Dell G3-15 Intel Corei7 - 16Go Ram - Nvidia GTX1660 Ti (Tri boot Mageia 9- 64 bits / Linux Mint 20 Cinamon/ Windows 10)
Core i5 760 - 8Go Ram - Nvidia Gforce 450 - (Triple boot Mageia 9-64 bits - Plasma 5 / Mint 20 Cinamon / Open Suse Tumbleweed - Plasma 5)

squid-f Membre non connecté
-
- Voir le profil du membre squid-f
- Inscrit le : 03/04/2016
- Groupes :
-
Membre d'Honneur
Si quelqu'un a une autre idée, je prends

Merci

« Plus les hommes seront éclairés et plus ils seront libres. » ~ Voltaire

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
je te fournis mes notes d'il y a quelque temps. Je n'étais pas arrivé à qqch de concluant.
La piste est pocket_sphinx qui est un outil pour traiter un fichier son avec en référence un modèle.
On a nocomprendo intégré dans Mageia 8, mais c'est plus destiné à de la commande vocale. Ça vaut toutefois la peine de regarder.
Caché :
L'outil essentiel est pocketsphinx.
Il semble que la version Mageia est trop vieille.
pocketsphinx_continuous -dict /usr/share/pocketsphinx/model/lm/fr_FR/frenchWords62K.dic -hmm /usr/share/pocketsphinx/model/lm/fr_FR/french_f0/ -lm /usr/share/pocketsphinx/model/lm/fr_FR/french3g62K.lm.dmp -inmic yes
fonctionne, mais le résultat n'est pas terrible.
Vérifier le niveau du micro. OK
Freespeech est une interface à pocketsphinx.
git clone https://github.com/themanyone/freespeech-vr.git
Une autre :
https://github.com/Uberi/speech_recognition
ladspa-plugins-swh
Remplaçant : https://linuxfr.org/users/be-root/journaux/nocomprendo-la-commande-vocale-pour-linux
https://bakerstreetsystems.com/blog/post/training-cmu-sphinx-speech-recognition-software-ubuntu-1404
Construction d'un modèle perso avec Sphinx
Installer
sphinxbase, lib64sphinxbase-devel
git clone https://github.com/cmusphinx/sphinxtrain.git
cd sphinxtrain
./configure
make
sudo make install
Dans un répertoire nouveau
bw
map_adapt
mk_s2sendump
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/French/cmusphinx-fr-ptm-5.2.tar.gz/download
sphinx_fe -argfile /home/yves/dev/model-voix/cmusphinx-fr-ptm-5.2/feat.params -samprate 16000 -c sample.fileids -di . -do . -ei wav -eo mfc -mswav yes
./bw \
-hmmdir cmusphinx-fr-ptm-5.2 \
-moddeffn cmusphinx-fr-ptm-5.2/mdef \
-ts2cbfn .ptm. \
-feat 1s_c_d_dd \
-svspec 0-12/13-25/26-38 \
-cmn current \
-agc none \
-dictfn frenchWords62K.dic \
-ctlfn sample.fileids \
-lsnfn sample.transcription \
-accumdir .
./map_adapt \
-moddeffn cmusphinx-fr-ptm-5.2/mdef \
-ts2cbfn .ptm. \
-meanfn cmusphinx-fr-ptm-5.2/means \
-varfn cmusphinx-fr-ptm-5.2/variances \
-mixwfn cmusphinx-fr-ptm-5.2/mixture_weights \
-tmatfn cmusphinx-fr-ptm-5.2/transition_matrices \
-accumdir . \
-mapmeanfn mon-modele/means \
-mapvarfn mon-modele/variances \
-mapmixwfn mon-modele/mixture_weights \
-maptmatfn mon-modele/transition_matrices
pocketsphinx_continuous -hmm monmodele -lm en-us.lm.bin -dict cmudict-en-us.dict -infile sidewalk.wav > sidewalk.txt
pocketsphinx_continuous -hmm mon-modele -lm french3g62K.lm.dmp -dict frenchWords62K.dic -infile 1.wav > 1.txt
L'outil essentiel est pocketsphinx.
Il semble que la version Mageia est trop vieille.
pocketsphinx_continuous -dict /usr/share/pocketsphinx/model/lm/fr_FR/frenchWords62K.dic -hmm /usr/share/pocketsphinx/model/lm/fr_FR/french_f0/ -lm /usr/share/pocketsphinx/model/lm/fr_FR/french3g62K.lm.dmp -inmic yes
fonctionne, mais le résultat n'est pas terrible.
Vérifier le niveau du micro. OK
Freespeech est une interface à pocketsphinx.
git clone https://github.com/themanyone/freespeech-vr.git
Une autre :
https://github.com/Uberi/speech_recognition
ladspa-plugins-swh
Remplaçant : https://linuxfr.org/users/be-root/journaux/nocomprendo-la-commande-vocale-pour-linux
https://bakerstreetsystems.com/blog/post/training-cmu-sphinx-speech-recognition-software-ubuntu-1404
Construction d'un modèle perso avec Sphinx
Installer
sphinxbase, lib64sphinxbase-devel
git clone https://github.com/cmusphinx/sphinxtrain.git
cd sphinxtrain
./configure
make
sudo make install
Dans un répertoire nouveau
bw
map_adapt
mk_s2sendump
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/French/cmusphinx-fr-ptm-5.2.tar.gz/download
sphinx_fe -argfile /home/yves/dev/model-voix/cmusphinx-fr-ptm-5.2/feat.params -samprate 16000 -c sample.fileids -di . -do . -ei wav -eo mfc -mswav yes
./bw \
-hmmdir cmusphinx-fr-ptm-5.2 \
-moddeffn cmusphinx-fr-ptm-5.2/mdef \
-ts2cbfn .ptm. \
-feat 1s_c_d_dd \
-svspec 0-12/13-25/26-38 \
-cmn current \
-agc none \
-dictfn frenchWords62K.dic \
-ctlfn sample.fileids \
-lsnfn sample.transcription \
-accumdir .
./map_adapt \
-moddeffn cmusphinx-fr-ptm-5.2/mdef \
-ts2cbfn .ptm. \
-meanfn cmusphinx-fr-ptm-5.2/means \
-varfn cmusphinx-fr-ptm-5.2/variances \
-mixwfn cmusphinx-fr-ptm-5.2/mixture_weights \
-tmatfn cmusphinx-fr-ptm-5.2/transition_matrices \
-accumdir . \
-mapmeanfn mon-modele/means \
-mapvarfn mon-modele/variances \
-mapmixwfn mon-modele/mixture_weights \
-maptmatfn mon-modele/transition_matrices
pocketsphinx_continuous -hmm monmodele -lm en-us.lm.bin -dict cmudict-en-us.dict -infile sidewalk.wav > sidewalk.txt
pocketsphinx_continuous -hmm mon-modele -lm french3g62K.lm.dmp -dict frenchWords62K.dic -infile 1.wav > 1.txt
Yves

squid-f Membre non connecté
-
- Voir le profil du membre squid-f
- Inscrit le : 03/04/2016
- Groupes :
-
Membre d'Honneur
Cela fait des pistes intéressantes à suivre.
A l'air de l'AI, il semble qu'il y ait peu d'offre, mise à part Google et Microsoft... (mouais, Apple aussi).
A+
« Plus les hommes seront éclairés et plus ils seront libres. » ~ Voltaire

Visiteur
Visiteur

squid-f Membre non connecté
-
- Voir le profil du membre squid-f
- Inscrit le : 03/04/2016
- Groupes :
-
Membre d'Honneur
Oui, j’ai aussi trouvé des solutions de ce type. Je cherche maintenant quelque chose d’intégré à Libreoffice, pour éviter les copier / coller.
A+
« Plus les hommes seront éclairés et plus ils seront libres. » ~ Voltaire

endorfin64 Membre non connecté
-
- Voir le profil du membre endorfin64
- Inscrit le : 10/06/2020
- Groupes :
squid-f :
Merci papoteur
Cela fait des pistes intéressantes à suivre.
A l'air de l'AI, il semble qu'il y ait peu d'offre, mise à part Google et Microsoft... (mouais, Apple aussi).
A+
Cela fait des pistes intéressantes à suivre.
A l'air de l'AI, il semble qu'il y ait peu d'offre, mise à part Google et Microsoft... (mouais, Apple aussi).
A+
Arf ! En dehors des grands noms que tu viens de citer ça va être compliqué. Il faut leur reconnaître une certaine avance techno dans ce domaine s'il on souhaite un résultat digne de ce nom !
Mageia 8 / KDE Plasma / i7-2620M CPU @ 2.70GHz / 8Go RAM



endorfin64 Membre non connecté
-
- Voir le profil du membre endorfin64
- Inscrit le : 10/06/2020
- Groupes :
artenox :
Une fois de plus, merci pour le lien Artenox

Mageia 8 / KDE Plasma / i7-2620M CPU @ 2.70GHz / 8Go RAM


Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie