NoComprendo

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Reprise du message précédent
Je dois reconnaître que je ne m'y connais pas grand-chose en règles udev.J'ai passé un peu de temps à lire (relire) la doc, mais je n'y comprends toujours rien.
Dans notre cas, je ne saurais pas adapter la règle ci-dessus pour uinput. Que mettre pour SUBSYSTEMS, idVendor, idProduct ?
J'applique la méthode donnée dans le manuel dotool, et ça marche de mon côté.
Papoteur :Je ne comprends pas le sens de la dernière phrase. J'ai essayé en mettant la règle dans 80-dotool.rules puis dans 72-dotool.rules, le résultat est le même. Que veut dire "lexically precede" ?
Je comprends que la règle doit précéder la règle 73. Et d'après la documentation, les règles /etc/udev/rules.d/ sont exécutées avant les règles /usr/lib/udev/rules.d/.
72 me semble un bon choix, mais quelle règle a tu mis ?
Bruno

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
/usr/lib/udev/rules.d/80-dotool.rules :
# This allows users in group input to use dotool without root permissions. KERNEL=="uinput", MODE="0660", OPTIONS+="static_node=uinput", TAG+="uaccess"
Édité par Papoteur Le 03/12/2024 à 18h13
Yves

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
J'ai fait des essais avec le modèle small-fr.
Les résultats sont décevants et les commandes vocales qui fonctionnent avec fr, ne marchent pas toujours avec small-fr.
Il y a souvent des différences dans les accords des verbes (Copier/Copiez).
Un exemple : si vous dites "Tout sélectionner", le modèle fr traduira "Tout sélectionner", le modèle small-fr traduit "Tout sélectionnés". J'ai aussi vu "Tous sélectionnés".
J'ai donc choisi d'associer les groupes de commandes au modèle et non pas à la langue. En pratique, il sera préférable d'utiliser un seul modèle et de s'y tenir.
J'ai intégré un peu de synthèse vocale suite aux messages d'artenaki : Vocalisation d'un texte sélectionné avec Pico.
Le texte contenu dans le presse-papier peut être vocalisé dans les différentes langues disponibles dans pico (deux dialectes d'anglais, français, allemand, italien et espagnol).
On peut lire un texte en anglais depuis NoComprendo en français. Pas de problèmes.
Bruno

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
J'ai refait des tests dans une VM, en repartant à chaque fois d'une Mageia 9 à jour.
L'application des règles udev de dotool (le droit de simuler le clavier et la souris) fonctionne bien, mais n'est effective qu'après un redémarrage de l'ordinateur.
J'ai supprimé la méthode donnée dans le manuel dotool, qui obligeait à demander le mot de passe root.
Il y a maintenant un contrôle d'erreur minimum sur dotool, avec un message qui propose de redémarrer la machine s'il y a un problème avec le clavier virtuel.
Ça devrait rendre "l'expérience utilisateur" plus fluide pour ne pas faire fuir les gens lors d'un premier test qui se passerait mal.
Il y a maintenant un contrôle d'erreurs au téléchargement et au dézippage des modèles de langage. J'ai la chance d'avoir une VM trop petite où il n'y a pas la place de faire les deux opérations. Pratique pour faire des tests de disque plein.

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Quelques recommandations avant de démarrer pour la première fois.
Pour fonctionner le programme a besoin d'un modèle de langage, qu'il faut télécharger sur internet.
Pour les francophones, je conseille d'utiliser le modèle "fr" (vosk-model-fr-0.22), plutôt que le modèle "small-fr". Le premier fonctionne beaucoup mieux que le second.
C'est un peu plus long à charger mais le résultat est de meilleure qualité.
Avec le petit modèle, il vous faudra redéfinir certaines commandes, je vous expliquerai pourquoi plus loin.
Le problème de droit dont nous avons parlé dans les échanges précédents devrait être transparent pour l'utilisateur.
À la première utilisation, NoComprendo devrait détecter que les droits ne sont pas appliqués et demandera de redémarrer l'ordinateur.
Derrière le bouton information, il y a quelques explications sur le fonctionnement général du programme. Lisez au moins la page "Utilisation", il y a quelques principes généraux à comprendre avant de se lancer, surtout en mode dictée où les commandes vocales restent actives.
La commande vocale a l'ambition de remplacer le clavier et la souris par la voix, la plupart d'entre nous n'ont pas besoin de toutes ces possibilités.
Si vous êtes dans ce cas, désactiver les groupes "Clavier", "Souris" et "Edition". Vous pourrez tester les commandes simples de lancement d'application, de dictée, de synthèse vocale et les méta-commandes.
Si une commande vocale ne vous convient pas, modifiez-la en enregistrant une autre phrase à la place.
NoComprendo associe un jeu de commandes avec un modèle de langage. Si vous passez du modèle "fr" au modèle "small-fr", les commandes se ressembleront beaucoup mais seront un peu différentes. Elles n'ont pas toutes été vérifiées avec le petit modèle.
Le moteur de reconnaissance vocale cherche à comprendre des phrases plutôt que des mots. Il va tenter d'effectuer des accords de verbes et des mises au pluriel. Chaque modèle possède des probabilités différentes qu'un mot soit en relation avec un autre mot.
Un modèle peut donner des verbes conjugués à l'infinitif, là où un autre le conjuguera (Copier/Copiez/Copié).
Les exemples donnés avec le petit modèle n'ont pas tous été testés. Si la conjugaison est erronée, réenregistrer la commande.
Je vous rappelle que reconnaissance et synthèse vocale sont réalisées off-line. Ces bibliothèques ne sont pas développées par ma pomme. Elles pourront évoluer dans le futur indépendamment de NoComprendo.
J'avais l'intention de fournir un jeu de commandes en anglais, mais cela s'est avéré impossible. My english is trop nul.
Je suis prêt à recueillir et à intégrer des jeux de commandes fait par de vrais anglophones.
Bon alors, ça se trouve où ?
Ben ici : http://be.root.free.fr/soft/nocomprendo/nocomprendo-1.80-1.mga9.x86_64.rpm
Bonne visite.
Bruno
Édité par be.root Le 11/12/2024 à 17h27

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Vous y trouverez une présentation générale, quelques copies d'écran, des liens de téléchargement, et la copie de l'aide intégrée de l'application.
Promenez-vous dans l'aide pour découvrir les différentes possibilités offertes, avant de tester une installation.
NoComprendo
Bruno

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
L'absence totale de réponse m'a profondément démotivé.
Il n'y a pas besoin d'être amputé des deux bras pour utiliser de la commande vocale. Il y a plein d'autres usages.
Et je pensais qu'intégrer la dictée vocale pouvait intéresser un autre public.
Pour trouver une version à jour, il faut cliquer là : NoComprendo téléchargement.
Bruno

gerard-ll Membre non connecté
-
- Voir le profil du membre gerard-ll
- Inscrit le : 09/12/2011
- Groupes :
be.root :Ça fait quinze jours que j'ai demandé sur ce forum un avis sur mon logiciel.
L'absence totale de réponse m'a profondément démotivé.
Salut be.root, en ces périodes de Noël c'est normal qu'il y ait moins de réponses à mon avis.
Bon courage alors pour la suite de ton programme

Pal mal Mageia!
@+
Gérard
@+
Gérard

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024

scroll44 Membre non connecté
-
- Voir le profil du membre scroll44
- Inscrit le : 24/09/2022
- Groupes :
Édité par scroll44 Le 08/01/2025 à 15h32

n3838 Membre non connecté
-
- Voir le profil du membre n3838
- Inscrit le : 25/01/2025
- Groupes :
Premier, et pour le coup, probablement l'un de mes seuls messages sur ce forum, pour faire un retour sur ce logiciel que je trouve assez fantastique.
Juste pour poser un peu de contexte, n'ayant utilisé jusqu'à lors que windows ou macos, j'ai installé il y a peu linux mint sur mon ordinateur, afin de bidouiller un peu. Autant dire que je ne connais pas grand chose sur le sujet.
Je me suis intéressé au fait d'avoir un modèle de transcription vocale sur mon ordinateur, pour voir ce qu'il était possible de faire en local sur une petite machine, l'objectif final étant de pouvoir débiter à haut débit du texte, et que celui-ci soit retranscrit quasi-instantanément sans erreurs, afin de pouvoir prendre des notes rapidement.
J'ai alors découvert plusieurs logiciels: speech note, qui permet d'utiliser beaucoup de modèles différents, dont Whisper d'OpenAI ; nerd-dictation, avec Elograf pour en disposer plus facilement.
J'ai réussi à installer, non sans peine, ce jour même, NoComprendo, qui utilise Vosk tout comme nerd-dictation.
Et je dois dire que ce logiciel fonctionne vachement bien, raison pour laquelle j'écris ce post, tout d'abord pour féliciter son créateur. Je n'avais jamais jusqu'à lors utilisé de logiciels d'accessibilité similaire, donc je ne sais pas trop quelles alternatives on peut trouver sur les autres systèmes d'exploitation, mais le tout me semble relativement complet.
Les commandes clavier et souris sont très pratiques à utiliser (notamment le système de grille pour indiquer où placer la souris), de même que les commandes pour ouvrir les applications.
En ce qui concerne la dictée, il est, et c'est malheureusement je pense inhérent au modèle utilisé, difficile d'avoir quelque chose de parfaitement fiable, d'autant plus si on se met à parler rapidement ou si on utilise du vocabulaire technique. La gestion de la ponctuation n'est pas non plus évidente, j'avais eu des problèmes similaires avec Elograf. Mais c'est surement là où l'on peut s'attendre à avoir le plus d'améliorations, lorsque de nouveaux modèles plus performants seront disponibles.
J'ai trouvé quelques petits soucis néanmoins:
- La fonction pour lire le texte copié ne fonctionne pas, peut-être que je dois au préalable installer un modèle pour cela ?
- Juste pour taper dans les détails, un défaut purement esthétique: l'icone dans la barre des tâches n'est pas très esthétique et s'intègre mal à la barre puisque le logo n'est pas transparent mais sur fond blanc
- Avec la dictée, lorsque j'énonce "formule de politesse", ça écrit très rapidement, et donne ce résultat étrange:
Citation :Da
s l'atte
te d'u
e répo
se de votre part, je vous prie, Mo
sieur, Madame, de bie
vouloir recevoir mes plus respectueuses salutatio
s.
Sinon la dictée fonctionne normalement.
Encore un grand merci et un grand bravo au créateur de NoComprendo, ainsi qu'à ceux des autres logiciels sus-mentionnés !

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
C'est le premier vrai retour que j'ai sur NoComprendo. Il est plutôt flatteur.
La qualité de la reconnaissance vocale et aussi de la dictée ne sont pas de mon ressort.
Elle dépend uniquement de la bibliothèque Vosk et de la bonne articulation du locuteur.
Vosk commet pas mal d'erreurs de grammaire. Personnellement, je termine toujours par un petit tour sous grammalecte.
Elograf et nerd_dictation ne gèrent pas du tout la ponctuation.
C'est l'intérêt d'avoir une couche de commande vocale au-dessus de la dictée. On peut programmer des commandes spécifiques à la ponctuation.
Quelles difficultés as tu rencontré pour installer NoComprendo ?
Est-ce que c'était depuis le paquet Mageia ou en l'installant à la main ?
Pour les petits soucis :
- L'icône dans la barre des tâches a un fond transparent. C'est un problème qui m'avait échappé. Ce sera bientôt corrigé.
Si le dessin est moche c'est parce que je ne suis pas un artiste. C'est une icône bricolée à partir de bouts d'autres icônes.
Je rêve qu'on me propose un beau dessin pour remplacer celui-ci. Avis aux artistes.
- La partie synthèse vocale a besoin de deux composants logiciels : vox et svox-pico.
L'installation par le paquet Mageia permet de vérifier les dépendances. Pour les autres distributions il faut installer et vérifier manuellement.
- Pour le texte haché de la formule de politesse. Dotool permet un réglage fin du délai entre deux touches consécutives du clavier et du temps de maintien appuyé. Comme je n'avais eu aucun problème, j'ai laissé les réglages par défaut.
Je vais permettre l'accès à ces réglages depuis la fenêtre de configuration. On verra si ça résout le problème.
J'espère que ton message donnera envie à une seconde personne de tester NoComprendo.
Courage, continuons.
Dès qu'une version corrigée sera disponible, je posterai un message ici.
Bruno

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Finalement le problème de la formule de politesse venait d'un bug que j'ai introduit tardivement dans l'application.
J'ai quand même rajouté un réglage fin du délai d'émission des touches du clavier. Cela pourra être utile sur des machines un peu poussives.
La version 2.2 est à télécharger ici :
http://be.root.free.fr/?soft=nocomprendo&menu=download
Toute l'application fonctionne aussi en anglais. L'interface est entièrement traduite.
Ce sont les groupes de commandes fournis en exemples qui manquent.
Bruno

n3838 Membre non connecté
-
- Voir le profil du membre n3838
- Inscrit le : 25/01/2025
- Groupes :
Effectivement la qualité de la reconnaissance vocale de vosk n'est pas la plus aboutie qui soit, mais dans l'état actuel des choses elle est déjà plutôt performante, et le fait de bien articuler réduit grandement le nombre d'erreurs.
J'ai installé le logiciel en le compilant à partir du fichier tar.gz, simplement, n'ayant jamais compilé un logiciel de ma vie, et n'ayant mon système linux que depuis quelques semaines, j'ai dû faire quelques essais avant de réussir à tout faire fonctionner. Installation de l'environnement Qt6, des librairies nécessaires, changer dans le Makefile le chemin d'accès de libvosk.so, créer un répertoire pour les modèles vosk et attribuer les permissions, ajouter le chemin de l'exécutable nocomprendo dans la variable PATH... que de choses difficiles (c'est ironique bien sûr) au premier abord pour un novice comme moi.
Effectivement en installant à partir d'apt les paquets libttspico-utils et vox, la synthèse vocale fonctionne.
Sur la version 2.2 la formule de politesse fonctionne correctement sans modification supplémentaire.
Je ne suis pas un artiste non plus, mais je me permet de suggérer une idée d'icone pour l'application, de même que les icônes de statut en bas à droite dans la barre des tâches. A mon sens celles-ci devraient être simplifiées, alors j'ai utilisé l'apparence d'un micro, dont la couleur indique le statut, vert quand le logiciel écoute, orange quand l'écoute est suspendue, rouge quand l'écoute est arrêtée, avec des ondes sonores autour du micro lorsque la voix est captée. La couleur bleue, c'est parce que ça permet de s'intégrer aussi bien sur les bureaux à thème clair qu'à thème sombre, et que c'est joli, le bleu. J'ai crée tout ça rapidement, et ce n'est bien sûr qu'une suggestion.







n3838 Membre non connecté
-
- Voir le profil du membre n3838
- Inscrit le : 25/01/2025
- Groupes :
- au premier démarrage de l'application, en faisant un clic droit dans la barre des tâches, on ne peut pas cliquer sur "démarrer", mais uniquement sur "arrêter", bien que cela démarre bien la reconnaissance vocale ;
- après avoir utilisé la commande "déplace la souris", la dictée vocale ne fonctionne plus: les commandes "prend note" et "je commence à dicter" semblent fonctionner et l'interface du logiciel montre que la dictée vocale est activée, mais ce que l'on dicte ensuite n'est pas tapé au clavier. Noter que cela fonctonne à nouvea après avoir désactivé/réactivé la dictée vocale à partir de l'interface du logiciel.

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Je les ai déjà adopté. Il me faudrait une license NC-by-... et je pourrai mettre ton nom au générique.
J'ai constaté les 2 bugs, j'ai les mêmes à la maison. Ça devrait être rapidement réglé.
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie