NoComprendo

david.david Membre non connecté
-
- Voir le profil du membre david.david
- Inscrit le : 11/02/2008
- Groupes :
-
Membre d'Honneur
Reprise du message précédent
be.root :@david.david
Si le répertoire `/opt/vosk-models` pose trop de problème.s Je peux déplacer ça dans l'espace utilisateur.
Les fichiers de langage sont gros, c'est dommage de les dupliquer à plusieurs endroits sur le disque.
J'ai gardé le répertoire utilisé par Papoteur dans elograf.
Mais `/usr/share/vosk-models` serait plus approprié.
Le mieux même serait d'utiliser le répertoire utilisateur dans : "~/.nocomprendo/vosk-models" (/home/@user@/.nocomprendo/vosk-models) ou quelque chose du genre. Car si on installe quelque chose dans "/usr/share/vosk-models/" ben à la désinstallation de nocomprendo ce répertoire ne sera pas supprimé car au moment l'installation il n'y a pas de fichier dedans le répertoire est vide vu qu'ils sont téléchargé et installé par l'utilisateur après l'installation.
ASUS K73S (portable) :
Intel Core i3-2350M_2.3GHz, 8 GO RAM DDR3, écran LED 17" (1600x900), CG Intel HD intégrée + CG Nvidia GeForce 610M_1GB dédiée (Technologie Optimus), SSD Samsung 860 EVO 500GB + SSD Samsung 850 EVO 500GB.
Mageia 8 - x86_64bits/ KDE Plasma-5.20.4 (DVD édition), c' est de la bombe, vive MAGEIA et toute l'équipe du STAFF MLO.
de david.david <david.david@mageialinux-online.org>
.Venez nous rejoindre sur le salon IRC de MLO
Intel Core i3-2350M_2.3GHz, 8 GO RAM DDR3, écran LED 17" (1600x900), CG Intel HD intégrée + CG Nvidia GeForce 610M_1GB dédiée (Technologie Optimus), SSD Samsung 860 EVO 500GB + SSD Samsung 850 EVO 500GB.
Mageia 8 - x86_64bits/ KDE Plasma-5.20.4 (DVD édition), c' est de la bombe, vive MAGEIA et toute l'équipe du STAFF MLO.
de david.david <david.david@mageialinux-online.org>


be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
On peut vouloir supprimer NoComprendo, mais pas elograf et garder les fichiers.
Voilà la question.

david.david Membre non connecté
-
- Voir le profil du membre david.david
- Inscrit le : 11/02/2008
- Groupes :
-
Membre d'Honneur
be.root :Dans ce cas, les fichiers de langage ne pourront pas être partagés avec elograf ou nerd_dictation.
On peut vouloir supprimer NoComprendo, mais pas elograf et garder les fichiers.
Voilà la question.
Dans ce cas si ce sont des fichiers partagés alors oui surement la bonne solution le "/usr/share/vosk-models/" ou alors "~/.vosk-models/"
mais faut que elograf et/ou nerd_dictation utilisent aussi ce répertoire.
ASUS K73S (portable) :
Intel Core i3-2350M_2.3GHz, 8 GO RAM DDR3, écran LED 17" (1600x900), CG Intel HD intégrée + CG Nvidia GeForce 610M_1GB dédiée (Technologie Optimus), SSD Samsung 860 EVO 500GB + SSD Samsung 850 EVO 500GB.
Mageia 8 - x86_64bits/ KDE Plasma-5.20.4 (DVD édition), c' est de la bombe, vive MAGEIA et toute l'équipe du STAFF MLO.
de david.david <david.david@mageialinux-online.org>
.Venez nous rejoindre sur le salon IRC de MLO
Intel Core i3-2350M_2.3GHz, 8 GO RAM DDR3, écran LED 17" (1600x900), CG Intel HD intégrée + CG Nvidia GeForce 610M_1GB dédiée (Technologie Optimus), SSD Samsung 860 EVO 500GB + SSD Samsung 850 EVO 500GB.
Mageia 8 - x86_64bits/ KDE Plasma-5.20.4 (DVD édition), c' est de la bombe, vive MAGEIA et toute l'équipe du STAFF MLO.
de david.david <david.david@mageialinux-online.org>


nic80 Membre non connecté
-
- Voir le profil du membre nic80
- Inscrit le : 06/08/2018
- Groupes :
-
Modérateur
Si ce sont des ressources partagées, alors peut être qu' un paquet avec des modèles serait approprié ( mais bon faire un paquet par modèle/langue serait chronophage. Mais ce c' est peut être pas possible si les modèles sont changeants.
Je ne sais pas comment fonctionne les modèles ( et je n' ai ni testé NoComprendo ni Elograf).

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
david.david :be.root :Dans ce cas, les fichiers de langage ne pourront pas être partagés avec elograf ou nerd_dictation.
On peut vouloir supprimer NoComprendo, mais pas elograf et garder les fichiers.
Voilà la question.
Dans ce cas si ce sont des fichiers partagés alors oui surement la bonne solution le "/usr/share/vosk-models/" ou alors "~/.vosk-models/"
mais faut que elograf et/ou nerd_dictation utilisent aussi ce répertoire.
C'est le cas, maintenant. L'utilisateur a le choix, dans elograf, de télécharger le modèle dans son home ou dans le système avec pkexec pour pouvoir écrire dans /usr/share/vosk-models.
Yves

n3838 Membre non connecté
-
- Voir le profil du membre n3838
- Inscrit le : 25/01/2025
- Groupes :
Papoteur :Le bleu et le noir se confondent pour un type de daltonisme.
Je crois que le mieux serait de déléguer l'icône au thème. C'est ce que je fais avec elograf. Avec une version spécifique quand rien n'est trouvé dans le thème.
Lorsque j'utilise Elograf, ll'icone "microphone désactivé" ressort mal sur les bureaux à thème foncé, celle-ci étant foncée également:

Je crois qu'il est possible de faire en sorte que l'icone change automatiquement de teinte en fonction du système (icone dite symbolique), mais je ne sais pas comment cela s'implante en pratique...
https://wiki.gnome.org/Design/OS/SymbolicIcons
Édité par n3838 Le 30/01/2025 à 12h33

Ysabeau Membre non connecté
-
- Voir le profil du membre Ysabeau
- Inscrit le : 09/08/2015
- Site internet
- Groupes :
-
Ambassadeur
Je me demande toutefois, si on ne pourrait pas utiliser certaines fonctionnalités Unicode (cela dépend des icônes).
OS préféré Mageia, environnements de bureau LXDE et XFCE, CMS préféré SPIP, suite bureautique préférée LibreOffice, logiciel de dessin préféré Inkscape.

n3838 Membre non connecté
-
- Voir le profil du membre n3838
- Inscrit le : 25/01/2025
- Groupes :

n3838 Membre non connecté
-
- Voir le profil du membre n3838
- Inscrit le : 25/01/2025
- Groupes :
En monochrome:

Ou en couleur:

Les 2 icones tout à droite, avec le crayon en plus, ce serait pour symboliser lorsque le mode "dictée" est activé, je ne sais pas si ce serait quelque chose d'utile à implémenter ou non dans l'application

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Même si les couleurs peuvent poser des problèmes aux daltoniens. Les pictogrammes à l'intérieur sont clairs.
On verra ce que cela donne en icônes réduites dans la barre des tâches.
Je testerai ça dès que j'en aurai fini avec la gestion des répertoires utilisateur et système pour vosk.
Je pense rajouter des thèmes pour gérer les différents jeux d'icônes.

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Comme je l'ai déjà indiqué, en tant qu'utilisateur, je suis focalisé sur la dictée.
Voici mes remarques constructives.
Avec un gros modèle sélectionné, le temps d'ouverture est long. On se demande si l'application est réellement lancée. Il faudrait un écran de démarrage.
J'ai eu de soucis avec le réglage du micro. Pulseaudio est toujours autant abscons pour moi. Le seul signe était que rien ne marchait puisque le son n'arrivait pas. Peut-être ajouter un vu-mètre pour aider au diagnostic ?
Après ça, j'ai testé la dictée dans libreoffice. Le résultat de base est mauvais, mais c'est parce que j'avais mis le mode transparent. En mode opaque, c'est beaucoup mieux.
Chaque nouveau groupe commence par une majuscule. Ce n'est pas toujours pertinent. Je n'ai pas vu de paramètre de réglage pour cela.
J'ai testé aussi l'insertion d'une formule de politesse. Impeccable. Et je vois que c'est éditable : je commence à être particulièrement intéressé.
Je n'ai pas encore testé de manière extensive. La question que je me pose est l'interférence entre le texte à dicter et les éléments de commande.
Sur un autre aspect, j'ai cherché à régler le délai entre caractères pour le clavier. A la fermeture de la fenêtre de paramètres, l'application s'est arrêtée. Elle ne répondait plus. Je n'ai pas réussi à reproduire ce problème.
Un autre aspect qu'il faut noter est la taille mémoire occupée par l'application. Avec le gros modèle français, l'application occupe 2,7 Go en mémoire. Quand j'utilise nerd-dictation ou sprec, c'est du même ordre de grandeur.
Yves

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Oui, les gros modèles marchent mieux mais prennent beaucoup de place.
Avec le gros modèle français, NoComprendo occupe plus de 3Go, avec le petit, moins de 150Mo.
Mais la qualité est moins bonne. Surtout pour la dictée.
Nerd_dictation avec le même modèle prend aussi 3Go. Le modèle est entièrement chargé en mémoire, on y peut rien.
J'ai fait des essais d'écran de démarrage avec le QSplashScreen de Qt. Les résultats ont été décevants.
Peut-être que ma machine démarre trop vite. On n'avait pas le temps de le voir.
J'essaierai de nouveau.
J'ai des soucis de micro avec elograf.
Quand je lance elograf, il s'installe dans la barre des tâches.
Quand je démarre elograf en cliquant dessus, un second icône identique à celui d'elograf, apparaît à côté.
Si on clique par erreur sur ce second icône, ça coupe l'entrée du micro. J'ai eu plusieurs fois ce problème.
Dans pulseaudio, ça correspond au bouton "Muet" (haut-parleur avec la croix) enfoncé dans l'onglet "Périphériques d'entré". Je trouve qu'il n'est pas très lisible.
Quand NoComprendo est lancé, il faut vérifier le même bouton sur l'onglet "Enregistrement".
Le mode de dictée transparent correspond au mode de fonctionnement de nerd_dictation.
C'est très amusant de voir le texte s'écrire, revenir en arrière et parfois tout effacer avant de tout ré-écrire.
Mais ça ne marchait pas toujours très bien, j'ai rajouté le mode opaque qui est assez satisfaisant.
Maintenant il y a un réglage fin des tempos d'appui des touches du clavier. On peut les baisser pas mal et ça amèliore le fonctionnement du mode transparent.
La prochaine version aura des pré-réglages plus bas qu'actuellement.
Les noms de groupe avec une majuscule. C'était un goût personnel, ça sera facile à supprimer.
Pour ce qui est de l'interférence entre commandes vocales et dictée, j'ai trouvé que ça se passait bien.
On peut déjà désactiver les groupes de commandes inutiles. Ça créera moins d'interférences.
Bruno

n3838 Membre non connecté
-
- Voir le profil du membre n3838
- Inscrit le : 25/01/2025
- Groupes :
Pour mon petit ordinateur, il s'écoule 8 secondes environ entre le lancement de l'application et l'affichage de l'interface de celle-ci.
Serait-il intéressant d'ajouter:
- une option pour démarrer l'application en mode réduit, de sorte à ce que l'interface n'apparaisse pas au démarrage,
- ainsi qu'une option pour activer automatiquement le microphone au démarrage ?
Cela permettrait par exemple, pour un utilisateur qui ajoute nocomprendo à ses applications de démarrage système, d'avoir le logiciel prêt à l'emploi dès l'allumage de l'ordinateur.
Est ce qu'il y a une raison pour laquelle seuls les modèles Vosk peuvent être utilisés ? Je pense notamment aux modèles faster-whisper pour lesquels on obtient également d'excellents résultats, et qui ont l'avantage de gérer la ponctuation.

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
n3838 :Je confirme qu'il conviendrait d'augmenter le délai par défaut entre la frappe de 2 touches, j'ai eu quelques soucis par moments lors de la dictée de longs messages notamment, en augmentant à 3 ms au lieu de 2 ms je n'ai pour l'instant pas rencontré de souci.
C'est avec quelle application ? La plus sensible est à mon expérience Libreoffice.
Citation :Serait-il intéressant d'ajouter:
- une option pour démarrer l'application en mode réduit, de sorte à ce que l'interface n'apparaisse pas au démarrage,
- ainsi qu'une option pour activer automatiquement le microphone au démarrage ?
Cela permettrait par exemple, pour un utilisateur qui ajoute nocomprendo à ses applications de démarrage système, d'avoir le logiciel prêt à l'emploi dès l'allumage de l'ordinateur.
Oui, pour elograf, on m'a demandé ça, j'ai ajouté l'option -s pour démarrer directement en mode dictée (si le modèle est paramétré).
Citation :
Est ce qu'il y a une raison pour laquelle seuls les modèles Vosk peuvent être utilisés ? Je pense notamment aux modèles faster-whisper pour lesquels on obtient également d'excellents résultats, et qui ont l'avantage de gérer la ponctuation.
Ah ah ! oui, les modèles ne sont interprétable qu'avec la bibliothèque adéquate. Pour les modèles whisper, au moment où j'avais regardé :
Il n'y avait qu'un modèle, obèse, pour toutes les langues. faire un modèle par langue permet de réduire la charge.
Par ailleurs, il n'y avait pas de mode fonctionnement en direct, ce n'était que du traitement par tronçons. Ça a pu changer, ou j'avais pu mal interpréter les choses.
Si c'est un traitement en ligne, c'est un no-go. On parle ici de fonctionnement en pur local.
Yves

n3838 Membre non connecté
-
- Voir le profil du membre n3838
- Inscrit le : 25/01/2025
- Groupes :
L'application Speech Note permet de tester plusieurs modèles différents, je comprend donc que le développeur a intégré plusieurs bibliothèques à son application. Dans tous les cas c'est en local, quelque soit le modèle, ce qui est, du moins pour moi, un point incontournable. Effectivement de ce que je vois les seuls qui proposent un mode de fonctionnement en direct sont les modèles proposés par Vosk et April-ASR. Vosk reste plus fidèle dans la qualité de sa retranscription. Le modèle April-ASR consomme moins de mémoire mais, dans l'état actuel des choses, je ne le trouve pas particulièrement intéressant.

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Il me semble que le démarrage en mode réduit existait dans les versions 1.x. Je vais regarder pourquoi ça n'y est plus..
Petit exercice aujourd'hui. J'ai récité phrase par phrase en soignant bien l'articulation un poème très connu.
À ma gauche mon pécé de développement habituel (i6 3GHz) avec le modèle 'fr'.
À ma droite un vieux portable (i3 2Ghz) avec le modèle 'small-fr'
Voilà le résultat :
Modèle fr
---------
La cigale ayant chanté tout l'été.
Se trouve à fort dépourvu quand la bise fut venu.
Pas un seul petit morceau de mouches de vermisseau.
Elle a crier famine chez la fourmi sa voisine.
La priant de lui prêter quelques grains pour subsister jusqu'à la saison nouvelle.
Je vous paierai lui dit-elle avant toute fois l'animal intérêts et principal.
La fourmi n'est pas prêteuse c'est lassant moindre défaut.
Que faisiez-vous autant chaud dit-elle à cette empreinte de.
Nuitée joue à tout moment je chantais ne vous déplaise.
Vous chantiez j'en suis fort aise eh bien dansez maintenant.
Modèle small-fr
---------------
La cigale ayant chanté l'été.
Se trouva fort dépourvu dans la bise fut rude.
Vincent les petits morceaux de manche ou de vermisseau.
Elle alla crier famine chez la fourmi sa voisine.
La priant de lui prêter quelques grand pour subsister jusqu'à la saison.
Je vous paierai lui dit-elle avant l'autre fois d'animal intérêts et principal.
La fourmi n'est pas prête de c'est la moindre défaut.
Que faisiez-vous autant chaud dit-elle à cette empreinte.
Nuit et jour à tout-venant le jeu chantelle ne vous déplaise.
Vous chantiez j'en suis fort aise eh bien dansez maintenant.
Texte original
--------------
La cigale ayant chanté tout l'été.
Se trouva fort dépourvue quand la bise fut venue.
Pas un seul petit morceau de mouche de vermisseau.
Elle alla crier famine chez la fourmi sa voisine.
La priant de lui prêter quelques grains pour subsister jusqu'à la saison nouvelle.
Je vous paierai lui dit-elle, avant l'août, fois d'animal, intérêt et principal.
La fourmi n'est pas prêteuse c'est là son moindre défaut.
Que faisiez-vous au temps chaud ? Dit-elle à cette emprunteuse.
Nuit et jour à tout venant. Je chantais ne vous déplaise.
Vous chantiez ? j'en suis fort aise. Eh bien dansez maintenant.
Le petit modèle s'en sort parfois mieux (Nuit et jour/Nuitée joue).
Par contre "l'août", c'était trop dur. La formulation n'est plus très actuelle.
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie