NoComprendo

be.root Membre non connecté

Le 11/12/2024 à 17h25

J'ai préparé un paquet pour que tout le monde puisse faire des essais, même les non-techniciens. J'espère qu'il y aura quelques personnes prêtes à me donner un avis.

Quelques recommandations avant de démarrer pour la première fois.
Pour fonctionner le programme a besoin d'un modèle de langage, qu'il faut télécharger sur internet.
Pour les francophones, je conseille d'utiliser le modèle "fr" (vosk-model-fr-0.22), plutôt que le modèle "small-fr". Le premier fonctionne beaucoup mieux que le second.
C'est un peu plus long à charger mais le résultat est de meilleure qualité.
Avec le petit modèle, il vous faudra redéfinir certaines commandes, je vous expliquerai pourquoi plus loin.

Le problème de droit dont nous avons parlé dans les échanges précédents devrait être transparent pour l'utilisateur.
À la première utilisation, NoComprendo devrait détecter que les droits ne sont pas appliqués et demandera de redémarrer l'ordinateur.

Derrière le bouton information, il y a quelques explications sur le fonctionnement général du programme. Lisez au moins la page "Utilisation", il y a quelques principes généraux à comprendre avant de se lancer, surtout en mode dictée où les commandes vocales restent actives.

La commande vocale a l'ambition de remplacer le clavier et la souris par la voix, la plupart d'entre nous n'ont pas besoin de toutes ces possibilités.
Si vous êtes dans ce cas, désactiver les groupes "Clavier", "Souris" et "Edition". Vous pourrez tester les commandes simples de lancement d'application, de dictée, de synthèse vocale et les méta-commandes.
Si une commande vocale ne vous convient pas, modifiez-la en enregistrant une autre phrase à la place.

NoComprendo associe un jeu de commandes avec un modèle de langage. Si vous passez du modèle "fr" au modèle "small-fr", les commandes se ressembleront beaucoup mais seront un peu différentes. Elles n'ont pas toutes été vérifiées avec le petit modèle.
Le moteur de reconnaissance vocale cherche à comprendre des phrases plutôt que des mots. Il va tenter d'effectuer des accords de verbes et des mises au pluriel. Chaque modèle possède des probabilités différentes qu'un mot soit en relation avec un autre mot.
Un modèle peut donner des verbes conjugués à l'infinitif, là où un autre le conjuguera (Copier/Copiez/Copié).
Les exemples donnés avec le petit modèle n'ont pas tous été testés. Si la conjugaison est erronée, réenregistrer la commande.

Je vous rappelle que reconnaissance et synthèse vocale sont réalisées off-line. Ces bibliothèques ne sont pas développées par ma pomme. Elles pourront évoluer dans le futur indépendamment de NoComprendo.

J'avais l'intention de fournir un jeu de commandes en anglais, mais cela s'est avéré impossible. My english is trop nul.
Je suis prêt à recueillir et à intégrer des jeux de commandes fait par de vrais anglophones.

Bon alors, ça se trouve où ?
Ben ici : http://be.root.free.fr/soft/nocomprendo/nocomprendo-1.80-1.mga9.x86_64.rpm

Bonne visite.
Bruno

Édité par be.root Le 11/12/2024 à 17h27

n3838 Membre non connecté

Le 25/01/2025 à 17h41

#328690

Bonjour,

Premier, et pour le coup, probablement l'un de mes seuls messages sur ce forum, pour faire un retour sur ce logiciel que je trouve assez fantastique.
Juste pour poser un peu de contexte, n'ayant utilisé jusqu'à lors que windows ou macos, j'ai installé il y a peu linux mint sur mon ordinateur, afin de bidouiller un peu. Autant dire que je ne connais pas grand chose sur le sujet.

Je me suis intéressé au fait d'avoir un modèle de transcription vocale sur mon ordinateur, pour voir ce qu'il était possible de faire en local sur une petite machine, l'objectif final étant de pouvoir débiter à haut débit du texte, et que celui-ci soit retranscrit quasi-instantanément sans erreurs, afin de pouvoir prendre des notes rapidement.

J'ai alors découvert plusieurs logiciels: speech note, qui permet d'utiliser beaucoup de modèles différents, dont Whisper d'OpenAI ; nerd-dictation, avec Elograf pour en disposer plus facilement.

J'ai réussi à installer, non sans peine, ce jour même, NoComprendo, qui utilise Vosk tout comme nerd-dictation.
Et je dois dire que ce logiciel fonctionne vachement bien, raison pour laquelle j'écris ce post, tout d'abord pour féliciter son créateur. Je n'avais jamais jusqu'à lors utilisé de logiciels d'accessibilité similaire, donc je ne sais pas trop quelles alternatives on peut trouver sur les autres systèmes d'exploitation, mais le tout me semble relativement complet.

Les commandes clavier et souris sont très pratiques à utiliser (notamment le système de grille pour indiquer où placer la souris), de même que les commandes pour ouvrir les applications.

En ce qui concerne la dictée, il est, et c'est malheureusement je pense inhérent au modèle utilisé, difficile d'avoir quelque chose de parfaitement fiable, d'autant plus si on se met à parler rapidement ou si on utilise du vocabulaire technique. La gestion de la ponctuation n'est pas non plus évidente, j'avais eu des problèmes similaires avec Elograf. Mais c'est surement là où l'on peut s'attendre à avoir le plus d'améliorations, lorsque de nouveaux modèles plus performants seront disponibles.

J'ai trouvé quelques petits soucis néanmoins:
- La fonction pour lire le texte copié ne fonctionne pas, peut-être que je dois au préalable installer un modèle pour cela ?
- Juste pour taper dans les détails, un défaut purement esthétique: l'icone dans la barre des tâches n'est pas très esthétique et s'intègre mal à la barre puisque le logo n'est pas transparent mais sur fond blanc
- Avec la dictée, lorsque j'énonce "formule de politesse", ça écrit très rapidement, et donne ce résultat étrange:

Citation :
Da
s l'atte
te d'u
e répo
se de votre part, je vous prie, Mo
sieur, Madame, de bie
vouloir recevoir mes plus respectueuses salutatio
s.

Sinon la dictée fonctionne normalement.

Encore un grand merci et un grand bravo au créateur de NoComprendo, ainsi qu'à ceux des autres logiciels sus-mentionnés !

be.root Membre non connecté

Le 26/01/2025 à 17h53

#328711

Merci beaucoup pour ce compte-rendu.
C'est le premier vrai retour que j'ai sur NoComprendo. Il est plutôt flatteur.

La qualité de la reconnaissance vocale et aussi de la dictée ne sont pas de mon ressort.
Elle dépend uniquement de la bibliothèque Vosk et de la bonne articulation du locuteur.
Vosk commet pas mal d'erreurs de grammaire. Personnellement, je termine toujours par un petit tour sous grammalecte.

Elograf et nerd_dictation ne gèrent pas du tout la ponctuation.
C'est l'intérêt d'avoir une couche de commande vocale au-dessus de la dictée. On peut programmer des commandes spécifiques à la ponctuation.

Quelles difficultés as tu rencontré pour installer NoComprendo ?
Est-ce que c'était depuis le paquet Mageia ou en l'installant à la main ?

Pour les petits soucis :
- L'icône dans la barre des tâches a un fond transparent. C'est un problème qui m'avait échappé. Ce sera bientôt corrigé.
Si le dessin est moche c'est parce que je ne suis pas un artiste. C'est une icône bricolée à partir de bouts d'autres icônes.
Je rêve qu'on me propose un beau dessin pour remplacer celui-ci. Avis aux artistes.
- La partie synthèse vocale a besoin de deux composants logiciels : vox et svox-pico.
L'installation par le paquet Mageia permet de vérifier les dépendances. Pour les autres distributions il faut installer et vérifier manuellement.
- Pour le texte haché de la formule de politesse. Dotool permet un réglage fin du délai entre deux touches consécutives du clavier et du temps de maintien appuyé. Comme je n'avais eu aucun problème, j'ai laissé les réglages par défaut.
Je vais permettre l'accès à ces réglages depuis la fenêtre de configuration. On verra si ça résout le problème.

J'espère que ton message donnera envie à une seconde personne de tester NoComprendo.
Courage, continuons.

Dès qu'une version corrigée sera disponible, je posterai un message ici.

Bruno

n3838 Membre non connecté

Le 27/01/2025 à 17h11

#328727

Bonjour, merci pour ce retour rapide !

Effectivement la qualité de la reconnaissance vocale de vosk n'est pas la plus aboutie qui soit, mais dans l'état actuel des choses elle est déjà plutôt performante, et le fait de bien articuler réduit grandement le nombre d'erreurs.

J'ai installé le logiciel en le compilant à partir du fichier tar.gz, simplement, n'ayant jamais compilé un logiciel de ma vie, et n'ayant mon système linux que depuis quelques semaines, j'ai dû faire quelques essais avant de réussir à tout faire fonctionner. Installation de l'environnement Qt6, des librairies nécessaires, changer dans le Makefile le chemin d'accès de libvosk.so, créer un répertoire pour les modèles vosk et attribuer les permissions, ajouter le chemin de l'exécutable nocomprendo dans la variable PATH... que de choses difficiles (c'est ironique bien sûr) au premier abord pour un novice comme moi.

Effectivement en installant à partir d'apt les paquets libttspico-utils et vox, la synthèse vocale fonctionne.

Sur la version 2.2 la formule de politesse fonctionne correctement sans modification supplémentaire.

Je ne suis pas un artiste non plus, mais je me permet de suggérer une idée d'icone pour l'application, de même que les icônes de statut en bas à droite dans la barre des tâches. A mon sens celles-ci devraient être simplifiées, alors j'ai utilisé l'apparence d'un micro, dont la couleur indique le statut, vert quand le logiciel écoute, orange quand l'écoute est suspendue, rouge quand l'écoute est arrêtée, avec des ondes sonores autour du micro lorsque la voix est captée. La couleur bleue, c'est parce que ça permet de s'intégrer aussi bien sur les bureaux à thème clair qu'à thème sombre, et que c'est joli, le bleu. J'ai crée tout ça rapidement, et ce n'est bien sûr qu'une suggestion.

nocomprendo-64

Répondre

Vous n'êtes pas autorisé à écrire dans cette catégorie

Notre Mission	Liens du site	Nous joindre	MLO est hébergé par
MLO est le forum francophone de la distribution Mageia et vous propose également un portail dédié aux débutants. MLO vous apporte un support sur la distribution grâce à son forum et vous offre des nouvelles de la distribution, des logiciels libres et de l'Open Source en général. Notre site a aussi pour but de vous montrer que Mageia est un système d'exploitation complet et facile à prendre en main. Vous apprendrez à installer simplement et à administrer efficacement votre système en un temps record.	Forum Documentation News du libre Mageia	Contacter MLO Mastodon MLO Flux RSS	MLO est un projet soutenu par Nos partenaires et amis
MLO est mis à disposition selon les termes de la licence Creative Commons.

be.root Membre non connecté

Papoteur Membre non connecté

be.root Membre non connecté

be.root Membre non connecté

be.root Membre non connecté

be.root Membre non connecté

be.root Membre non connecté

gerard-ll Membre non connecté

be.root Membre non connecté

scroll44 Membre non connecté

n3838 Membre non connecté

be.root Membre non connecté

be.root Membre non connecté

n3838 Membre non connecté

n3838 Membre non connecté

be.root Membre non connecté