NoComprendo

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Reprise du message précédent
L'option pour activer automatiquement le microphone au démarrage existe déjà dans "Général/Démarrage automatique".Il me semble que le démarrage en mode réduit existait dans les versions 1.x. Je vais regarder pourquoi ça n'y est plus..
Petit exercice aujourd'hui. J'ai récité phrase par phrase en soignant bien l'articulation un poème très connu.
À ma gauche mon pécé de développement habituel (i6 3GHz) avec le modèle 'fr'.
À ma droite un vieux portable (i3 2Ghz) avec le modèle 'small-fr'
Voilà le résultat :
Modèle fr
---------
La cigale ayant chanté tout l'été.
Se trouve à fort dépourvu quand la bise fut venu.
Pas un seul petit morceau de mouches de vermisseau.
Elle a crier famine chez la fourmi sa voisine.
La priant de lui prêter quelques grains pour subsister jusqu'à la saison nouvelle.
Je vous paierai lui dit-elle avant toute fois l'animal intérêts et principal.
La fourmi n'est pas prêteuse c'est lassant moindre défaut.
Que faisiez-vous autant chaud dit-elle à cette empreinte de.
Nuitée joue à tout moment je chantais ne vous déplaise.
Vous chantiez j'en suis fort aise eh bien dansez maintenant.
Modèle small-fr
---------------
La cigale ayant chanté l'été.
Se trouva fort dépourvu dans la bise fut rude.
Vincent les petits morceaux de manche ou de vermisseau.
Elle alla crier famine chez la fourmi sa voisine.
La priant de lui prêter quelques grand pour subsister jusqu'à la saison.
Je vous paierai lui dit-elle avant l'autre fois d'animal intérêts et principal.
La fourmi n'est pas prête de c'est la moindre défaut.
Que faisiez-vous autant chaud dit-elle à cette empreinte.
Nuit et jour à tout-venant le jeu chantelle ne vous déplaise.
Vous chantiez j'en suis fort aise eh bien dansez maintenant.
Texte original
--------------
La cigale ayant chanté tout l'été.
Se trouva fort dépourvue quand la bise fut venue.
Pas un seul petit morceau de mouche de vermisseau.
Elle alla crier famine chez la fourmi sa voisine.
La priant de lui prêter quelques grains pour subsister jusqu'à la saison nouvelle.
Je vous paierai lui dit-elle, avant l'août, fois d'animal, intérêt et principal.
La fourmi n'est pas prêteuse c'est là son moindre défaut.
Que faisiez-vous au temps chaud ? Dit-elle à cette emprunteuse.
Nuit et jour à tout venant. Je chantais ne vous déplaise.
Vous chantiez ? j'en suis fort aise. Eh bien dansez maintenant.
Le petit modèle s'en sort parfois mieux (Nuit et jour/Nuitée joue).
Par contre "l'août", c'était trop dur. La formulation n'est plus très actuelle.

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Je vois que tu progresses sur le dépôt invent.
J'ai vu que tu as constaté un problème avec dotool pour le Ç. J'avoue que je n'y ai jamais été confronté, puisque vosk envoie des minuscules uniquement et que je n'avais pas ajouté de traitement pour mettre des majuscules.
Quel comportement observes-tu ? Le caractère est "mangé"' ?
Souhaites-tu que je pose la question au développeur ? Il est assez réactif.
En principe, le caractère est accessible au clavier en ayant "Maj. verrouillé" actif.
Mettrais-tu une option pour ne pas activer la mise en majuscule. Quand je dicte en réfléchissant, j'ai trop de majuscules qui arrivent.
Yves

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
J'ai mis quelques explications en anglais dans le README du dépôt : https://invent.kde.org/beroot/nocomprendo#limitations
Il y a les mêmes en français dans l'aide et sur mon site : http://be.root.free.fr/?soft=nocomprendo&menu=help
Je vais le reformuler ici parce que c'est un problème important.
La bibliothèque vosk ne renvoie que du texte en minuscule. J'ai fait le choix de mettre en majuscule le premier caractère de tout ce qui était reçu.
Pour les énoncés des commandes c'est plus joli. Et pour la dictée il est souvent préférable de démarrer avec une majuscule.
Du coup les "é" ou les "ç" en début de phrase sont mis en majuscule.
Quand dotool reçoit un caractère (utf8 je suppose), il cherche la touche du clavier qu'il doit simuler mais n'envoie pas ce caractère mais un numéro de touche.
Si dotool ne sait pas "mapper" ce caractère, il envoie un message d'erreur que l'on peut voir depuis NoComprendo si on le lance depuis la console (depuis la version 2.5).
Ces caractères en majuscules ne sont pas toujours accessibles sur un clavier.
Je ne connaissais pas le truc pour accéder au "Ç". Je viens de vérifier que ça marche bien.
Je ne suis pas sûr que ce caractère soit présent dans le mapping du clavier par défaut : /usr/share/X11/xkb/symbols/fr
Je n'ai pas de problème avec les "É" mais je sais que n3838 en a.
Dotool a une variable DOTOOL_XKB_VARIANT pour gérer différents types de claviers français. Je pense qu'il faudrait l'intégrer.
Mais je ne sais pas comment détecter quelle variante est utilisée. Si tu as une idée ?
Pour la majuscule en début de phase dictée.
Ça ne devrait pas être trop difficile à mettre en choix dans la configuration.
J'ai pris l'habitude de préparer une phase complète dans ma tête et d’articuler d'une seule traite.
Je comprends bien que si on hésite tous les trois mots, ce n'est pas la bonne façon de faire.
Tu n'es pas le premier à m'en parler.
Quelques mots sur la version 2.5.
Les répertoires vosks utilisateur et système sont maintenant bien séparés comme dans elograf.
System space: /usr/share/vosk-models/
User space: ~/.config/vosk-models
Il y a quatre thèmes d'icônes pour la barre des tâches.
Le réglage fin des délais des touches du clavier.
Un splash screen pour les démarrages un peu lent.
Et la possibilité de démarrer la fenêtre réduite.
J'ai surement oublié des trucs tellement qu'il y en a eu.
Bonne visite : http://be.root.free.fr/?soft=nocomprendo&menu=download
Merci à n3838 pour les icônes et le splash screen en svg.
Bruno
PS: Je crois que le mode dictée transparent est un peu buggé. J'y jetterai un œil bientôt.

langoumoisin Membre non connecté
-
- Voir le profil du membre langoumoisin
- Inscrit le : 09/02/2025
be.root :
Je vais ajouter la procédure d'installation pour debian, unbuntu, mint et d'autres dans le readme.
Ça me fera peut-être gagner quelques nouveaux testeurs et retours d'utilisateurs.
Bonjour ! Je suis sous Linux Mint (MATE) et je suis très curieux de tester Elograf. Je recherche depuis longtemps une solution pour la dictée vocale car j'ai des difficultés avec le clavier par moments (Parkinson précoce). En plus, mon épouse me nargue avec son Windows 11 et prétend qu'il lui suffit d'une combinaison de touches pour obtenir une transcription correcte d'un texte dicté. :-(
Pourrais-tu expliquer la procédure d'installation ou pointer vers le readme qui va bien car je n'arrive pas à l'installer sur ma machine !
D'avance merci !

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
La procédure m'a été fournie par des utilisateurs qui l'ont réussie. Je ne l'ai jamais testée, je suis sous Mageia.
La principale difficulté, c'est qu'il n'y a pas de paquet dotool fourni. Il faut l'installer avec pip depuis le git.
Si ça se passe bien (ou mal), fait nous un petit retour.

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Encore une remarque.
A chaque démarrage, l'entrée micro est systématiquement l'entrée audio interne. Pas de chance, ce n'est pas celle que j'utilise, j'ai un casque audio avec entrée micro. Je peux corriger avec pavucontrol.
Après un passage dans la configuration, rebelote, l'entrée est de nouveau sur l'audio interne. Ça te parle ?
Par ailleurs, le délai pour considérer une fin de phrase est-il défini par la librairie vosk, en interne, ou il y a-t-il une possibilité de réglage ? J'aimerais le rallonger.
Je suis avec la version 2.3.
PS: Un autre point également est que la configuration indique que l'OSD n'est pas utilisé, mais celui-ci est quand même affiché.
Édité par Papoteur Le 10/02/2025 à 18h01
Yves

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Dirais-je même pire, un simple start/stop de l'état de NoComprendo refait basculer sur l'entrée audio interne par défaut.
Ce n'est pas très pratique.
En général pulseaudio se comporte plutôt bien avec les sorties.
Clementine commute tout seul sur mon casque bluetooth s'il est présent, sinon reste sur la sortie audio par défaut.
Mais est-ce que c'est Clementine qui se souvient ou pulseaudio.
Je vais aller faire un tour dans la doc pulseaudio pour voir ce qui se raconte sur le sujet.
Pour les délais d'attente de vosk. C'est prévu depuis le début, il y a une fonction dans l'api qui s'appelle vosk_recognizer_set_endpointer_delays.
Le seul problème c'est que cette fonction n'est pas présente dans libvosk.so. Ça plante au moment du link :
/bin/ld: comprendo.o: in function `Comprendo::Comprendo(QObject*)':
/home/bruno/devel/be.root/nocomprendo/comprendo.cpp:63: undefined reference to `vosk_recognizer_set_endpointer_delays'
collect2: error: ld returned 1 exit status
Sûrement une histoire de version pas encore à jour de libvosk.so.
vosk_api.h vient du git alphacephei : parce-qu'il n'était pas présent dans le paquet vosk de Mageia, je l'ai rajouté à la main. C'était même une de mes premières questions dans ce fil de discussion.
------------------------
La version 2.6 apporte le choix entre majuscules et minuscules en début de phrase dictée.
J'ai ajouté un choix de clavier dans la configuration. Je n'ai pas encore bien compris comment tout cela fonctionne.
Pour l'instant, je propose toutes les variantes de clavier disponibles pour la langue en cours.
J'aimerais pouvoir réduire l'offre à celles disponibles dans l'icône de clavier de la barre des tâches. Mais je ne sais pas du tout comment faire.
Il y a de nombreuses variantes de clavier disponibles avec leurs noms de code.
Il n'est pas facile de faire le lien avec les claviers installés dont les noms sont en français.
J'ai fait une expérience assez intéressante.
J'ai installé et sélectionné la disposition du clavier bépo dans la configuration du système puis j'ai sélectionné le clavier bépo dans NoComprendo.
Comme tous les caractères français sont disponibles dans le clavier bépo, il n'y a eu aucun problème, tout le texte que j'ai dit a été écrit correctement.
Cependant, le clavier était complètement inutilisable pendant cette période avec la disposition bépo. Les utilisateurs du bépo ont de la chance.
Ce n'est pas encore définitif. Je suis toujours en train de chercher.
NoComprendo, c'est comme l'IA. Si tu ne t'en sers pas, tu seras vite dépassé par tous ceux qui s'en servent.

Allez vite tester la version 2.6.
Bruno

langoumoisin Membre non connecté
-
- Voir le profil du membre langoumoisin
- Inscrit le : 09/02/2025
be.root :
Si ça se passe bien (ou mal), fait nous un petit retour.
Merci

La procédure fonctionne apparemment.
J'ai juste buté sur un paquet oublié lors de l'installation de qt6 :
Il faudrait rajouter le paquet : qt6-l10n-tools aux paquets à installer ( sudo apt install qt6-base-dev qt6-multimedia-dev qt6-tools-dev ) sinon, make se plaint d'un /usr/lib/qt6/bin/lrelease manquant à l'étape de la compilation.
Pas de souci ensuite, je pense que je vais pouvoir m'en servir

Édité par langoumoisin Le 10/02/2025 à 18h17

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
bonne nouvelle également, le splash screen (comment dit-on en français ?).
par contre j'ai eu un souci apparemment une fenêtre demandait le choix de la langue. Mais ce choix était masqué par l'écran de démarrage, sans moyen de déplacer l'un ou l'autre pour rendre la fenêtre visible !
Du coup il faut maintenant reprendre les phrases clés, puisqu'elle ne reprennent pas automatiquement une majuscule au début.
Yves

be.root Membre non connecté
-
- Voir le profil du membre be.root
- Inscrit le : 10/11/2024
Le paquet manquant a été ajouté dans le wiki.
/usr/lib/qt6/bin/lrelease est l'outil de Qt qui produit la traduction vers le français. Il doit être installé avec les paquets de développement de Qt.
Tu as bien NoComprendo en français ?
Sinon, je peux mettre la traduction dans le dépôt.
@Papoteur
C'est curieux le splashscreen qui cache le choix de la langue. Je n'ai pas réussi à le reproduire.
C'est très embêtant lors de la première installation.
Je vais essayer une correction.
À propos du réglage des silences dans vosk. S'il y a un problème de linkage, c'est que la librairie n'est pas à jour de l'api.
Ce sera ajouté plus tard quand la fonction sera disponible.

langoumoisin Membre non connecté
-
- Voir le profil du membre langoumoisin
- Inscrit le : 09/02/2025


vincent Membre non connecté
-
- Voir le profil du membre vincent
- Inscrit le : 12/02/2025
J'essaye d'installer la version 2.7 (sous Neon testing, version 2404, plasma 6.3) mais j'ai une erreur lorsque je lance la commande "sudo make install" :
make: *** Aucune règle pour fabriquer la cible « themes/color-dark/listen-dictate.svg », nécessaire pour « qrc_nocomprendo.cpp ». Arrêt.
J'ai essayé la version 2.5 : compile et s'installe sans erreur.
J'ai suivi la procédure pour debian, nickel ! (Une petite coquille à la fin de la commande 'sudo find / -name "libvosk.so' qui n'a pas le guillemet de fin).
Une fois lancée, je n'arrive pas à communiquer avec, que ce soit les commandes ou la dictée.
J'imagine que le problème vient de l'entrée micro, à voir avec la 2.7

Pour info, nerd dictation fonctionne bien sur la machine avec dotool, hormis les problèmes d'accents dû au clavier qwerty.
Un grand merci à vous et aux contributeurs !!!
kde neon testing 2404 sur Chuwi HI10 max

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
vincent :Pour info, nerd dictation fonctionne bien sur la machine avec dotool, hormis les problèmes d'accents dû au clavier qwerty.
Merci pour ton retour.
Tu devrais pouvoir régler le souci de dotool en mettant ceci au début de la ligne de commande : DOTOOL_XKB_LAYOUT=fr
Pour l'entrée micro, il faudrait lancer pavu control, une fois la reconnaissance lancée, onglet Enregistrement et choisir la bonne entrée.
Yves
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie