MGA7 Freeze ou perte GUI, MGA8 aussi
MGA7 Plasma/Nvidia ou XFCE/Nouveau et MGA8 XFCE/Cinnamon
Système et matériels / Installation et configuration

kalagani Membre non connecté
-
- Voir le profil du membre kalagani
- Inscrit le : 10/03/2012
- Groupes :
au bout de quelques heures de fonctionnement, le PC se "freeze" sans trop que je sache la raison.
Ces "freeze" ne sont pas définitifs et en étant patient j'arrive à déplacer la souris en plusieurs fois pour atteindre le menu d'arrêt.
Lequel finit par se faire au bout d'un certain temps.
Quand je redémarre le PC, plus de "freeze"!!!
Entre 2 "freezes" j'ai lancé la mémorisation
Code BASH :
dmesg -kw > dmesg_kw.txt
Après redémarrage la consultation semble indiquer un pb avec NVRM
Caché :
Code BASH :
more dmesg_kw.txt |grep -i nvrm [ 29.852428] NVRM: loading NVIDIA UNIX x86_64 Kernel Module 340.108 Wed Dec 11 11:06:58 PST 2019 [ 61.085379] NVRM: Your system is not currently configured to drive a VGA console [ 61.085396] NVRM: on the primary VGA device. The NVIDIA Linux graphics driver [ 61.085396] NVRM: requires the use of a text-mode VGA console. Use of other console [ 61.085396] NVRM: drivers including, but not limited to, vesafb, may result in [ 61.085396] NVRM: corruption and stability problems, and is not supported. [13286.398674] NVRM: GPU at PCI:0000:18:00: GPU-0fb5325b-a5b7-9c5e-1d2f-4e209300e06c [13286.398683] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13287.514169] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13287.581064] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13287.651043] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13287.731313] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13287.802564] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13287.876612] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13287.942252] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13288.015379] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13288.074375] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13288.953463] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13289.788566] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13290.796575] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13291.795367] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13292.800280] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13293.788063] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13294.787855] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13295.788566] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13296.789291] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13297.787604] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13298.787742] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13299.790229] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13300.795821] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13301.796787] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13302.794407] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13303.789332] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13304.785520] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13305.788385] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13306.790331] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13307.788635] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13308.787969] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13309.789907] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13310.789858] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13311.791803] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13312.796109] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13313.794677] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001 [13314.789590] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0013, Class 00005097, Offset 00001408, Data 00000001
Une recherche via un journalctl -xb (autour de l'heure des "freezes") montre tout un tas de failed
Caché :
Code BASH :
journalctl -xb |grep -i failed sept. 01 19:10:27 localhost.localdomain kernel: acpi PNP0A08:00: _OSC failed (AE_NOT_FOUND); disabling ASPM sept. 01 19:10:27 localhost.localdomain kernel: pci 0000:18:00.0: BAR 6: failed to assign [mem size 0x00020000 pref] sept. 01 19:10:27 localhost.localdomain kernel: pci 0001:6b:00.0: BAR 6: failed to assign [mem size 0x00100000 pref] sept. 01 19:10:34 localhost.localdomain lvm[800]: /dev/sda: open failed: Aucun médium trouvé sept. 01 19:10:34 localhost.localdomain lvm[800]: /dev/sdb: open failed: Aucun médium trouvé sept. 01 19:10:34 localhost.localdomain lvm[801]: /dev/sda: open failed: Aucun médium trouvé sept. 01 19:10:34 localhost.localdomain lvm[801]: /dev/sdb: open failed: Aucun médium trouvé sept. 01 19:10:34 localhost.localdomain lvm[802]: /dev/sda: open failed: Aucun médium trouvé sept. 01 19:10:34 localhost.localdomain lvm[802]: /dev/sdb: open failed: Aucun médium trouvé sept. 01 19:10:44 localhost.localdomain systemd[1]: network.service: Failed with result 'exit-code'. -- Subject: Unit failed -- The unit network.service has entered the 'failed' state with result 'exit-code'. sept. 01 19:10:44 localhost.localdomain systemd[1]: Failed to start LSB: Bring up/down networking. -- L'unité (unit) network.service a échoué, avec le résultat failed. sept. 01 19:11:12 localhost.localdomain dbus-daemon[4715]: [session uid=1000 pid=4715] Activated service 'org.kde.kwalletd' failed: Failed to execute program org.kde.kwalletd: No such file or directory sept. 01 19:11:19 localhost.localdomain dbus-daemon[5846]: [system] Failed to reset fd limit before activating service: org.freedesktop.DBus.Error.AccessDenied: Failed to restore old fd limit: Operation not permitted sept. 01 19:11:19 localhost.localdomain dbus-daemon[5854]: [system] Failed to reset fd limit before activating service: org.freedesktop.DBus.Error.AccessDenied: Failed to restore old fd limit: Operation not permitted sept. 01 19:11:19 localhost.localdomain org_kde_powerdevil[5813]: powerdevil: org.kde.powerdevil.backlighthelper.brightness failed sept. 01 19:11:20 localhost.localdomain net_applet[5817]: failed to acquire monitor on DBus: org.freedesktop.DBus.Error.ServiceUnknown: The name org.mageia.monitoring was not provided by any .service files sept. 01 19:11:21 localhost.localdomain kdeinit5[5894]: kf5.kio.kio_tags: tag fetch failed: "Failed to open the database" sept. 01 19:11:27 localhost.localdomain akonadi_indexing_agent[5970]: org.kde.pim.akonadi_indexer_agent: Failed to fetch items: "Collection does not exist" sept. 01 19:11:27 localhost.localdomain akonadi_indexing_agent[5970]: org.kde.pim.akonadi_indexer_agent: Indexing failed: "" sept. 01 19:11:45 localhost.localdomain dbus-daemon[1120]: [system] Failed to activate service 'org.bluez': timed out (service_start_timeout=25000ms)
Je ne sais pas trop interpréter tout cela...une idée?
PS: config sous 5.7.19-desktop-1.mga7 avec KDE/Plasma...et pas de souvenir de "freeze" quand j'étais il y a encore 3semaines sous MGA5...
PS2: un autre freeze MGA7 Freeze mga7 noyaux 5.4.2, 5.4.6, 5.4.7 d'où j'ai tiré le dmesg -kw mais là qui semblait lié à un module lié à Intel
PS3: 2022/01/20 Freeze Mageia8 faut sauter ici, avec réouverture bug26537
Édité par kalagani Le 20/01/2022 à 18h33
PC1: HPxw9400 Mageia8 Xfce/Cinnamon (ex Plasma car "Freeze")
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma

Yuusha Membre non connecté
-
- Voir le profil du membre Yuusha
- Inscrit le : 04/07/2017
- Groupes :
-
Modérateur
-
Administrateur
-
Forgeron
Quelle est l'occupation de la mémoire au moment des freeze ? Y aurai-t’il une application qui écrirait sur le disque à ce moment ?

kalagani Membre non connecté
-
- Voir le profil du membre kalagani
- Inscrit le : 10/03/2012
- Groupes :
Yuusha :
...
Quelle est l'occupation de la mémoire au moment des freeze ? Y aurai-t’il une application qui écrirait sur le disque à ce moment ?
Quelle est l'occupation de la mémoire au moment des freeze ? Y aurai-t’il une application qui écrirait sur le disque à ce moment ?
Pendant les "freezes", je ne peux quasiment rien lancer tellement tout est figé d'où le dmesg -kw vers un fichier pour consulter ce dernier au redémarrage!
As tu une ou des commandes à lancer un peu de la même manière vers un fichier pour consultation à postériori?
Édité par kalagani Le 01/09/2020 à 21h28
PC1: HPxw9400 Mageia8 Xfce/Cinnamon (ex Plasma car "Freeze")
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Pour les messages NVRM, une recherche découvre une document de NVIDIA: https://docs.nvidia.com/pdf/XID_Errors.pdf
Voici une traduction de l'intro :
NVIDIA :
Ce document explique ce que sont les messages Xid et a pour but d'aider les administrateurs système, les développeurs et les FAE à comprendre la signification de ces messages afin d'aider à analyser et à résoudre les problèmes liés aux GPU.
1.1. Qu'est-ce qu'un message Xid ?
Le message Xid est un rapport d'erreur du pilote NVIDIA qui est imprimé dans le journal du noyau ou le journal des événements du système d'exploitation. Les messages Xid indiquent qu'une erreur générale du GPU s'est produite, le plus souvent due à une programmation incorrecte du GPU par le pilote ou à la corruption des commandes envoyées au GPU. Ces messages peuvent indiquer un problème matériel, un problème logiciel NVIDIA ou un problème d'application utilisateur. Ces messages fournissent des informations de diagnostic qui peuvent être utilisées à la fois par les utilisateurs et par NVIDIA pour aider au débogage des problèmes signalés. La signification de chaque message est cohérente d'une version à l'autre du pilote.
1.1. Qu'est-ce qu'un message Xid ?
Le message Xid est un rapport d'erreur du pilote NVIDIA qui est imprimé dans le journal du noyau ou le journal des événements du système d'exploitation. Les messages Xid indiquent qu'une erreur générale du GPU s'est produite, le plus souvent due à une programmation incorrecte du GPU par le pilote ou à la corruption des commandes envoyées au GPU. Ces messages peuvent indiquer un problème matériel, un problème logiciel NVIDIA ou un problème d'application utilisateur. Ces messages fournissent des informations de diagnostic qui peuvent être utilisées à la fois par les utilisateurs et par NVIDIA pour aider au débogage des problèmes signalés. La signification de chaque message est cohérente d'une version à l'autre du pilote.
D'après ce document, l'erreur 13 est une "Graphics Engine Exception", une erreur du moteur graphique.
Sur cette erreur :
NVIDIA :
4.1. XID 13 : GR : SW Notifier l'erreur
Cet événement est enregistré pour les défauts généraux de l'application de l'utilisateur. Il s'agit généralement d'une erreur hors limites où l'utilisateur a dépassé la fin d'un tableau, mais il peut également s'agir d'une instruction illégale, d'un registre illégal ou d'un autre cas. Dans de rares cas, il est possible qu'une défaillance matérielle ou des bogues logiciels du système se matérialisent sous la forme d'un XID 13. Lorsque cet événement est consigné, NVIDIA recommande ce qui suit :
Remarque : l'outil cuda-memcheck permet d'instrumenter l'application en cours d'exécution et de signaler quelle ligne de code a effectué la lecture illégale.
Cet événement est enregistré pour les défauts généraux de l'application de l'utilisateur. Il s'agit généralement d'une erreur hors limites où l'utilisateur a dépassé la fin d'un tableau, mais il peut également s'agir d'une instruction illégale, d'un registre illégal ou d'un autre cas. Dans de rares cas, il est possible qu'une défaillance matérielle ou des bogues logiciels du système se matérialisent sous la forme d'un XID 13. Lorsque cet événement est consigné, NVIDIA recommande ce qui suit :
- Exécutez l'application dans cuda-gdb ou cuda-memcheck , ou
- Exécutez l'application avec CUDA_DEVICE_WAITS_ON_EXCEPTION=1 et attachez ensuite avec cuda-gdb, ou
- Si les deux précédents reviennent sans résultat, déposez un bogue pour éliminer un éventuel bogue du pilote ou du matériel NVIDIA.
Remarque : l'outil cuda-memcheck permet d'instrumenter l'application en cours d'exécution et de signaler quelle ligne de code a effectué la lecture illégale.
Yves

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Yves

kalagani Membre non connecté
-
- Voir le profil du membre kalagani
- Inscrit le : 10/03/2012
- Groupes :
j'ai donc installé nvidia-cuda-toolkit-devel
et dans les dépendances demandées, surprise 2 kernel-server
nvidia-cuda-toolkit-devel-10.1.168-1.2.mga7.nonfree.x86_64
- gcc-c++-8.4.0-1.mga7.x86_64
- kernel-server-5.3.11-1.mga7-1-1.mga7.x86_64
- kernel-server-5.7.19-1.mga7-1-1.mga7.x86_64
- kernel-server-latest-5.7.19-1.mga7.x86_64
- nvidia-cuda-toolkit-10.1.168-1.2.mga7.nonfree.x86_64
alors que je suis en kernel-desktop!!!!
Rapide recherche dans mes historiques MGA4 et MGA5 -> j'ai toujours été en kernel-server car mon PC s'y prête:
station de travail HPxw9400 avec 2 processeurs, 32Go de mémoire, 4 DD SAS...
Bizarre qu'à l'installation de MGA7 cela n'a pas été reconnu...
Du coup au redémarrage, pas de reconstruction du driver nvidia car manquait le RPM de dev du kernel
Une fois ce dernier installé, reconstruction/installation du driver OK-> mais il a aussi fallu jouer avec le CCM pour enfin avoir le driver nvidia "running" et pas l'équivalent libre "nouveau".
Le PC est maintenant dans les mêmes conditions de Freeze (excepté kernel-server ald kernel-desktop) que précédemment...
Faut maintenant attendre quelques heures avant les freezes...
En attendant j'ai essayé de lancer cuda-memcheck mais je bute sur le nom de l'application à checker
(Cuda Toolkit Documentation)
Code BASH :
cuda-memcheck nvidia340 cuda-memcheck nvidia340-340.108-7.mga7.nonfree cuda-memcheck dkms-nvidia340-340.108-7.mga7.nonfree cuda-memcheck nvidia
à chaque commande, même résultat...sans résultat
Code BASH :
========= CUDA-MEMCHECK ========= Internal error ========= No CUDA-MEMCHECK results found
Édité par kalagani Le 03/09/2020 à 09h04
PC1: HPxw9400 Mageia8 Xfce/Cinnamon (ex Plasma car "Freeze")
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Je vois que l'utilitaire permet de déboguer une APPLICATION, ce qui nécessite de savoir quelle application doit être déboguée, puis de lancer celle-ci avec le débogueur.
Là, je n'ai pas l'impression que l'application fautive soit identifiée. Pourrais-tu regarder les lignes autour des messages d'erreur pour voir s'il y aurait plus d'informations ?
Honnêtement, je crains que cette voie ne soit pas la bonne.
En explorant des rapports de bogues divers, une cause évoquée est celle d'une défaillance matérielle : surchauffe, mauvaise connexion, ... La surchauffe est plausible avec le fait que le phénomène survienne au bout d'un certain temps.
Yves

Yuusha Membre non connecté
-
- Voir le profil du membre Yuusha
- Inscrit le : 04/07/2017
- Groupes :
-
Modérateur
-
Administrateur
-
Forgeron
Le plus simple est de lancer htop (à installer via le CCM) à la connexion. Puis tu regardes toutes les 10-20 minutes ce qu'il se passe. Si au bout d'1h, ta consommation de mémoire ne fait qu'augmenter sans raison, c'est qu'il y a un problème à ce niveau là.

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Voici la proposition de jybz :
Code BASH :
while true; do LC_ALL=C free -h | grep '^Mem' >>~/stateMem ; sleep 1m ; done
à lancer dans une console.
On récupère un fichier stateMem qui contient des lignes de l'occupation mémoire toutes les minutes. On peut voir l'évolution a posteriori.
Yves

steven Membre non connecté
-
- Voir le profil du membre steven
- Inscrit le : 18/05/2018
au bout de quelques heures de fonctionnement, le PC se "freeze" sans trop que je sache la raison.
Ces "freeze" ne sont pas définitifs et en étant patient j'arrive à déplacer la souris en plusieurs fois pour atteindre le menu d'arrêt.
Lequel finit par se faire au bout d'un certain temps.
Quand je redémarre le PC, plus de "freeze"!!!
etrange cà,
on dirais le symptome de chaleur...
ce que j'ai mis en gras correspond a ce symptome...
Perso je regarderais du coté des ventilos (process et video VOIR Alime...)
par ce que quand la température (par non activité) redescend...
Il "defreeze"...
Moi je ne peu m'empecher de me poser la question....
enfin, moi, ce que j'en dis....

No Comment ...
Merci de ne pas 'rebondir' sur mes post's
Censor => 2025





kalagani Membre non connecté
-
- Voir le profil du membre kalagani
- Inscrit le : 10/03/2012
- Groupes :
kalagani :
Faut maintenant attendre quelques heures avant les freezes...
et bien c'est arrivé au bout de 4h avec le kernel 5.7.19-server-1.mga7
Par souci d'homogénéité, j'ai viré tous les anciens kernel desktop, puis redémarré sur un autre kernel server le 5.1.14-server-1.mga7
Gelé au bout de 2h cette fois, le fichier trace dmesg indique la même chose que précédemment (NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001...)
Caché :
Code BASH :
[ 34.731007] NVRM: loading NVIDIA UNIX x86_64 Kernel Module 340.108 Wed Dec 11 11:06:58 PST 2019 [ 73.854314] NVRM: Your system is not currently configured to drive a VGA console [ 73.854318] NVRM: on the primary VGA device. The NVIDIA Linux graphics driver [ 73.854319] NVRM: requires the use of a text-mode VGA console. Use of other console [ 73.854320] NVRM: drivers including, but not limited to, vesafb, may result in [ 73.854321] NVRM: corruption and stability problems, and is not supported. [16222.677365] NVRM: GPU at PCI:0000:18:00: GPU-0fb5325b-a5b7-9c5e-1d2f-4e209300e06c [16222.677406] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00f6f5f4 [16223.981004] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16225.399762] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16226.679396] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16228.623541] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16230.035221] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16231.646855] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16233.082677] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16234.424677] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16236.071006] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16237.411581] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000 [16238.747842] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000
Mais j'abandonne l'idée de debug avec cuda_memcheck
A propos de surchauffe, j' y ai pensé, mais sur redémarrage immédiat après les gels, le pb devrait subsister et le gel intervenir de nouveau...et bien ce n'est pas ce qui se passe, faut de nouveau attendre 2 à 4h...Et il y a encore 3 semaines sous MGA5, je n'avais pas ce pb!
Par contre j'ai l'impression que ces gels débutent quand je balade la souris en bas quand je veux changer de tache...(PC sous KDE/Plasma)
Pour faire un log mémoire, je viens aussi de me rappeler de la commande free (ici log toutes les 5sec)
Code BASH :
free -t -s 5 > free5s.log
Je ne connaissais pas htop, mais en // du log dmesg, je vérifiais avec top l'usage mémoire...
Et surprise, PC gelé sur le terminal de top, j'ai vu apparaitre en tête de gondole le process Xorg avec les champs
%CPU entre 99% et 100% et %MEM à 1 permanent, si dégel ces 2 champs repassent à des valeurs plus basses,
Pourtant les RAM (32Go) et SWAP (8Go) ne montraient pas d'emplafonnement...
idem le presque 100% de CPU ne traduisait pas l'occupation totale des 2 processeurs double core, mais juste l'emplafonnement sur 1 seul des core
Les 4 cores visible via l'option 1 une fois top lancé
J'ai un peu de mal à interpréter cela...
ici actuellement, sans gel
Caché :
Code BASH :
top top - 11:16:56 up 1:27, 3 users, load average: 0,51, 0,50, 0,53 Tâches: 236 total, 1 en cours, 235 en veille, 0 arrêté, 0 zombie %Cpu0 : 2,0 ut, 7,6 sy, 0,7 ni, 89,7 id, 0,0 wa, 0,0 hi, 0,0 si, 0,0 st %Cpu1 : 2,7 ut, 10,4 sy, 0,3 ni, 85,2 id, 1,3 wa, 0,0 hi, 0,0 si, 0,0 st %Cpu2 : 1,7 ut, 7,8 sy, 1,0 ni, 89,2 id, 0,3 wa, 0,0 hi, 0,0 si, 0,0 st %Cpu3 : 1,3 ut, 11,2 sy, 0,0 ni, 85,1 id, 2,3 wa, 0,0 hi, 0,0 si, 0,0 st MiB Mem : 32165,0 total, 26885,3 libr, 3002,0 util, 2277,7 tamp/cache MiB Éch : 8206,0 total, 8206,0 libr, 0,0 util. 28578,6 dispo Mem PID UTIL. PR NI VIRT RES SHR S %CPU %MEM TEMPS+ COM. 1257 root 35 15 11120 8384 2444 S 10,6 0,0 1:31.01 preload 19256 patrick 20 0 359260 99780 75608 S 2,6 0,3 0:13.37 konsole 3739 root 20 0 279568 146304 91384 S 1,7 0,4 1:34.74 Xorg 19393 patrick 20 0 2712900 446800 150564 S 1,7 1,4 2:39.41 thunderbird 19194 patrick 20 0 2692832 95396 69604 S 0,7 0,3 0:19.81 kwin_x11 19417 patrick 20 0 4356 2832 2596 S 0,7 0,0 0:18.54 gam_server 28227 patrick 20 0 15208 3812 2992 R 0,7 0,0 0:00.08 top 820 root 20 0 13092 3108 1964 S 0,3 0,0 0:40.52 mount.ntfs-3g 823 root 20 0 12744 2620 1916 S 0,3 0,0 0:18.24 mount.ntfs-3g 11794 root 20 0 0 0 0 I 0,3 0,0 0:00.05 kworker/u34:1-events_unbound 14084 root 20 0 0 0 0 I 0,3 0,0 0:00.93 kworker/0:1-events 14086 root 20 0 0 0 0 I 0,3 0,0 0:00.68 kworker/1:0-events 19162 patrick 20 0 330256 69060 49060 S 0,3 0,2 0:00.97 kaccess 19200 patrick 20 0 1555276 280868 153632 S 0,3 0,9 0:16.95 plasmashell 19279 patrick 20 0 434544 106496 80952 S 0,3 0,3 0:03.59 dolphin 19439 patrick 20 0 382848 106876 40212 S 0,3 0,3 0:21.10 net_applet 25869 root 20 0 0 0 0 I 0,3 0,0 0:00.23 kworker/1:2-events 27963 root 20 0 0 0 0 I 0,3 0,0 0:01.14 kworker/2:8-events 27980 patrick 20 0 3591820 396724 190580 S 0,3 1,2 4:49.31 firefox 28062 patrick 20 0 2540140 187660 131152 S 0,3 0,6 0:07.06 Web Content 1 root 20 0 173532 10616 7272 S 0,0 0,0 0:03.25 systemd 2 root 20 0 0 0 0 S 0,0 0,0 0:00.01 kthreadd 3 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_gp 4 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 rcu_par_gp 6 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 kworker/0:0H-kblockd 9 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 mm_percpu_wq 10 root 20 0 0 0 0 S 0,0 0,0 0:00.15 ksoftirqd/0 11 root 20 0 0 0 0 I 0,0 0,0 0:01.37 rcu_sched 12 root rt 0 0 0 0 S 0,0 0,0 0:00.02 migration/0 13 root -51 0 0 0 0 S 0,0 0,0 0:00.00 idle_inject/0 14 root 20 0 0 0 0 S 0,0 0,0 0:00.00 cpuhp/0 15 root 20 0 0 0 0 S 0,0 0,0 0:00.00 cpuhp/1 16 root -51 0 0 0 0 S 0,0 0,0 0:00.00 idle_inject/1 17 root rt 0 0 0 0 S 0,0 0,0 0:01.07 migration/1 18 root 20 0 0 0 0 S 0,0 0,0 0:00.10 ksoftirqd/1 20 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 kworker/1:0H-kblockd 22 root 20 0 0 0 0 S 0,0 0,0 0:00.00 cpuhp/2 23 root -51 0 0 0 0 S 0,0 0,0 0:00.00 idle_inject/2 24 root rt 0 0 0 0 S 0,0 0,0 0:01.22 migration/2 25 root 20 0 0 0 0 S 0,0 0,0 0:00.14 ksoftirqd/2 27 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 kworker/2:0H-kblockd 28 root 20 0 0 0 0 S 0,0 0,0 0:00.00 cpuhp/3 29 root -51 0 0 0 0 S 0,0 0,0 0:00.00 idle_inject/3 30 root rt 0 0 0 0 S 0,0 0,0 0:00.01 migration/3 31 root 20 0 0 0 0 S 0,0 0,0 0:00.09 ksoftirqd/3 33 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 kworker/3:0H-kblockd 34 root 20 0 0 0 0 S 0,0 0,0 0:00.00 kdevtmpfs 35 root 0 -20 0 0 0 I 0,0 0,0 0:00.00 netns 36 root 20 0 0 0 0 S 0,0 0,0 0:00.00 rcu_tasks_kthre
Je me rappelle avoir eu des ralentissements il y a longtemps avec GoogleEarth que j'avais résolu
en supprimant l'Option "AddARGBGLXVisuals" dans le fichier /etc/X11/xorg.conf
Là dans le CCM, j'ai enlevé l'option Extension Composite, pensant supprimer ce champ...mais non, il est toujours.
Je vais déjà voir si gel en traçant spécifiquement le PID de Xorg
Code BASH :
top -p 3739 top - 10:46:46 up 57 min, 3 users, load average: 0,34, 0,35, 0,44 Tâches: 1 total, 0 en cours, 1 en veille, 0 arrêté, 0 zombie %Cpu0 : 2,4 ut, 1,0 sy, 0,0 ni, 96,6 id, 0,0 wa, 0,0 hi, 0,0 si, 0,0 st %Cpu1 : 1,3 ut, 1,7 sy, 0,0 ni, 95,7 id, 1,3 wa, 0,0 hi, 0,0 si, 0,0 st %Cpu2 : 1,4 ut, 1,4 sy, 0,0 ni, 95,9 id, 1,4 wa, 0,0 hi, 0,0 si, 0,0 st %Cpu3 : 0,7 ut, 0,7 sy, 0,0 ni, 96,3 id, 2,4 wa, 0,0 hi, 0,0 si, 0,0 st MiB Mem : 32165,0 total, 26897,7 libr, 3013,2 util, 2254,1 tamp/cache MiB Éch : 8206,0 total, 8206,0 libr, 0,0 util. 28544,1 dispo Mem PID UTIL. PR NI VIRT RES SHR S %CPU %MEM TEMPS+ COM. 3739 root 20 0 283284 150364 95444 S 1,3 0,5 0:48.58 Xorg
Édité par kalagani Le 04/09/2020 à 12h31
PC1: HPxw9400 Mageia8 Xfce/Cinnamon (ex Plasma car "Freeze")
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma

steven Membre non connecté
-
- Voir le profil du membre steven
- Inscrit le : 18/05/2018

tu devrais regarder ta carte video....
(drivers, connection (physique inclus), etc )
J'sais pas y a un truc qui merde....
quand je lis :
[ 73.854314] NVRM: [b]Your system is not currently configured to drive a VGA console[/b]
[ 73.854318] NVRM: on the primary VGA device. The NVIDIA Linux graphics driver
[ 73.854319] NVRM: requires the use of a text-mode VGA console. Use of other console
[ 73.854320] NVRM: drivers including, but not limited to, vesafb, may result in
[ 73.854321] NVRM: corruption and stability problems, and is not supported.
[16222.677365] NVRM: GPU at PCI:0000:18:00: GPU-0fb5325b-a5b7-9c5e-1d2f-4e209300e06c
[16222.677406] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00f6f5f4
[16223.981004] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000
moi ca me..... "defrise" (si tu me passe l'expression...)
j'ai l'impression que soit
possibilitées -
1 - ta carte video est en entrain de te faire ses adieux.. (je doute... quoi que...)
2 - drivers pourri... (je pense plus...)
pourquoi ?
- drivers including, but not limited to, vesafb
* pas de limit ??? bjr l'overstak est le "buffer"
- Your system is not currently configured to drive a VGA console[/b]
traduction : "votre system n'est actuellement pas configuré pour driver VGA ....
[ 73.854318] NVRM: on the primary VGA device. The NVIDIA Linux graphics driver
Le drivers NVIDIA
[ 73.854319] NVRM: requires the use of a text-mode VGA console. Use of other console
demande / insiste pour que tu utilise le mode VGA, alors utilise une autre console.....
conclusions :
- Mauvais drivers ( le system le déclare corrupt)
- et mauvaise config video (il veut du VGA a la place et tu lui donne du nvidia corrompu.....)
en tout cas, voilà ce que je comprend
bonne chance

No Comment ...
Merci de ne pas 'rebondir' sur mes post's
Censor => 2025





kalagani Membre non connecté
-
- Voir le profil du membre kalagani
- Inscrit le : 10/03/2012
- Groupes :
steven :
...
quand je lis :
[ 73.854314] NVRM: [b]Your system is not currently configured to drive a VGA console[/b]
[ 73.854318] NVRM: on the primary VGA device. The NVIDIA Linux graphics driver
[ 73.854319] NVRM: requires the use of a text-mode VGA console. Use of other console
[ 73.854320] NVRM: drivers including, but not limited to, vesafb, may result in
[ 73.854321] NVRM: corruption and stability problems, and is not supported.
[16222.677365] NVRM: GPU at PCI:0000:18:00: GPU-0fb5325b-a5b7-9c5e-1d2f-4e209300e06c
[16222.677406] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00f6f5f4
[16223.981004] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000
quand je lis :
[ 73.854314] NVRM: [b]Your system is not currently configured to drive a VGA console[/b]
[ 73.854318] NVRM: on the primary VGA device. The NVIDIA Linux graphics driver
[ 73.854319] NVRM: requires the use of a text-mode VGA console. Use of other console
[ 73.854320] NVRM: drivers including, but not limited to, vesafb, may result in
[ 73.854321] NVRM: corruption and stability problems, and is not supported.
[16222.677365] NVRM: GPU at PCI:0000:18:00: GPU-0fb5325b-a5b7-9c5e-1d2f-4e209300e06c
[16222.677406] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00f6f5f4
[16223.981004] NVRM: Xid (PCI:0000:18:00): 13, Graphics Exception: ChID 0001, Class 0000502d, Offset 00000860, Data 00000000
c'est le résultat avec un filtre grep -i NVRM
à propos des 5 premières lignes, j'ai bien sûr cherché sur Internet...pour conclure que c'était plus un Warning qu'une erreur
et quand ça gèle ce sont les 3 dernières lignes qui interviennentet d'après le time stamp beaucoup plus tard...
Là sur mon PC (qui n'a pas gelé) dont je surveille avec top le PID de Xorg, j'ai les mêmes 5 premières lignes au démarrage
Code BASH :
dmesg |grep -i nvrm [ 35.181160] NVRM: loading NVIDIA UNIX x86_64 Kernel Module 340.108 Wed Dec 11 11:06:58 PST 2019 [ 73.778805] NVRM: Your system is not currently configured to drive a VGA console [ 73.778808] NVRM: on the primary VGA device. The NVIDIA Linux graphics driver [ 73.778809] NVRM: requires the use of a text-mode VGA console. Use of other console [ 73.778810] NVRM: drivers including, but not limited to, vesafb, may result in [ 73.778811] NVRM: corruption and stability problems, and is not supported.
steven :
...j'ai l'impression que soit
possibilitées -
1 - ta carte video est en entrain de te faire ses adieux.. (je doute... quoi que...)
2 - drivers pourri... (je pense plus...)
...
- et mauvaise config video (il veut du VGA a la place et tu lui donne du nvidia corrompu.....)
possibilitées -
1 - ta carte video est en entrain de te faire ses adieux.. (je doute... quoi que...)
2 - drivers pourri... (je pense plus...)
...
- et mauvaise config video (il veut du VGA a la place et tu lui donne du nvidia corrompu.....)
1, oui possible, mais ce serait une coïncidence, juste après avoir installé MGA7????
2, fourni par le dépôt x11-driver-video-nvidia340-340.108-7.mga7.nonfree
avec MGA5 c'était x11-driver-video-nvidia340-340.101-1.mga5.nonfree
ou comme tu écris et que je soupçonne aussi mauvaise config
c'est pourquoi dans le CCM->Configurer le serveur d'affichage
comme écrit plus haut j'ai décoché la case par défaut
Activer la transparence (extension Composite)
et depuis ~ 4 heures pas de gel...mais je n'étais pas trop à manipuler le PC...
PS: ma carte graphique est câblée en DVI pas en VGA et j'ai pour l'instant laissé la config par défaut, c'est à dire pas coché la case
Forcer le mode d'affichage du DVI
Je n'aime pas modifier dans tous les sens...j'ai ça sous le coude à propos des 5 premières lignes évoquées au début...
Édité par kalagani Le 04/09/2020 à 16h43
PC1: HPxw9400 Mageia8 Xfce/Cinnamon (ex Plasma car "Freeze")
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma

kalagani Membre non connecté
-
- Voir le profil du membre kalagani
- Inscrit le : 10/03/2012
- Groupes :
kalagani :
comme écrit plus haut j'ai décoché la case par défaut
Activer la transparence (extension Composite)
et depuis ~ 4 heures pas de gel...mais je n'étais pas trop à manipuler le PC...
Activer la transparence (extension Composite)
et depuis ~ 4 heures pas de gel...mais je n'étais pas trop à manipuler le PC...
et bien revenu des courses, PC gelé :+(
Impossible de réveiller l'écran pour voir l'état du top sur Xorg, m'as fallu couper par M/A
Le log via journalctl -e -kb -1 du dernier boot n'est pas rassurant
Caché :
Le gel semble avoir eu lieu vers 17h27: encore NVRM puis des Non Makable Interrupt reçue sur les 4 CPU!!!!Code BASH :
...skipping... sept. 04 15:33:13 localhost.localdomain kernel: usb 1-7.1.1: SerialNumber: 081117408944 sept. 04 15:33:13 localhost.localdomain kernel: usb-storage 1-7.1.1:1.0: USB Mass Storage device detected sept. 04 15:33:14 localhost.localdomain kernel: scsi host8: usb-storage 1-7.1.1:1.0 sept. 04 15:33:14 localhost.localdomain kernel: usb 1-7.1.3: new high-speed USB device number 19 using ehci-pci sept. 04 15:33:14 localhost.localdomain kernel: usb 1-7.1.3: New USB device found, idVendor=046d, idProduct=082b, bcdDevice=28.25 sept. 04 15:33:14 localhost.localdomain kernel: usb 1-7.1.3: New USB device strings: Mfr=1, Product=2, SerialNumber=0 sept. 04 15:33:14 localhost.localdomain kernel: usb 1-7.1.3: Product: Webcam C170 sept. 04 15:33:14 localhost.localdomain kernel: usb 1-7.1.3: Manufacturer: sept. 04 15:33:14 localhost.localdomain kernel: uvcvideo: Found UVC 1.00 device Webcam C170 (046d:082b) sept. 04 15:33:14 localhost.localdomain kernel: uvcvideo 1-7.1.3:1.0: Entity type for entity Processing 2 was not initialized! sept. 04 15:33:14 localhost.localdomain kernel: uvcvideo 1-7.1.3:1.0: Entity type for entity Extension 6 was not initialized! sept. 04 15:33:14 localhost.localdomain kernel: uvcvideo 1-7.1.3:1.0: Entity type for entity Camera 1 was not initialized! sept. 04 15:33:14 localhost.localdomain kernel: input: Webcam C170: Webcam C170 as /devices/pci0000:00/0000:00:02.1/usb1/1-7/1-7.1/1-7.1.3/1-7.1.3:1.0/input/input17 sept. 04 15:33:15 localhost.localdomain kernel: scsi 8:0:0:0: Direct-Access Generic Flash HS-CF 5.39 PQ: 0 ANSI: 0 sept. 04 15:33:15 localhost.localdomain kernel: scsi 8:0:0:1: Direct-Access Generic Flash HS-COMBO 5.39 PQ: 0 ANSI: 0 sept. 04 15:33:15 localhost.localdomain kernel: sd 8:0:0:0: [sda] Attached SCSI removable disk sept. 04 15:33:15 localhost.localdomain kernel: sd 8:0:0:1: [sdb] Attached SCSI removable disk sept. 04 15:40:49 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=178.250.2.130 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 15:41:37 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=15.188.32.88 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL=> sept. 04 15:51:40 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:11:45 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:13:46 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:19:47 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:41:54 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:45:14 localhost.localdomain kernel: usb 1-7: USB disconnect, device number 16 sept. 04 16:45:14 localhost.localdomain kernel: usb 1-7.1: USB disconnect, device number 17 sept. 04 16:45:14 localhost.localdomain kernel: usb 1-7.1.1: USB disconnect, device number 18 sept. 04 16:45:14 localhost.localdomain kernel: usb 1-7.1.3: USB disconnect, device number 19 sept. 04 16:46:45 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:47:55 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:49:56 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:53:57 localhost.localdomain kernel: net-fw DROP IN=enp0s8 OUT= MAC=00:1c:c4:ad:43:ce:f4:6b:ef:5c:59:0c:08:00 SRC=35.181.84.199 DST=192.168.0.11 LEN=40 TOS=0x00 PREC=0x00 TTL> sept. 04 16:56:06 localhost.localdomain kernel: sd 9:0:2:0: [sde] tag#101 Sense Key : Recovered Error [current] sept. 04 16:56:06 localhost.localdomain kernel: sd 9:0:2:0: [sde] tag#101 Add. Sense: Warning - specified temperature exceeded sept. 04 16:57:05 localhost.localdomain kernel: sd 9:0:2:0: [sde] tag#58 Sense Key : Recovered Error [current] sept. 04 16:57:05 localhost.localdomain kernel: sd 9:0:2:0: [sde] tag#58 Add. Sense: Warning - specified temperature exceeded sept. 04 17:27:25 localhost.localdomain kernel: NVRM: GPU at PCI:0000:18:00: GPU-0fb5325b-a5b7-9c5e-1d2f-4e209300e06c sept. 04 17:27:25 localhost.localdomain kernel: NVRM: Xid (PCI:0000:18:00): 16, Head 00000000 Count 0000e051 sept. 04 17:27:33 localhost.localdomain kernel: NVRM: Xid (PCI:0000:18:00): 8, Channel 00000011 sept. 04 17:27:35 localhost.localdomain kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context sept. 04 17:27:37 localhost.localdomain kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context sept. 04 17:27:38 localhost.localdomain kernel: Uhhuh. NMI received for unknown reason 21 on CPU 2. sept. 04 17:27:38 localhost.localdomain kernel: Do you have a strange power saving mode enabled? sept. 04 17:27:38 localhost.localdomain kernel: Dazed and confused, but trying to continue sept. 04 17:27:40 localhost.localdomain kernel: Uhhuh. NMI received for unknown reason 21 on CPU 0. sept. 04 17:27:40 localhost.localdomain kernel: Do you have a strange power saving mode enabled? sept. 04 17:27:40 localhost.localdomain kernel: Dazed and confused, but trying to continue sept. 04 17:27:40 localhost.localdomain kernel: Uhhuh. NMI received for unknown reason 21 on CPU 1. sept. 04 17:27:40 localhost.localdomain kernel: Do you have a strange power saving mode enabled? sept. 04 17:27:40 localhost.localdomain kernel: Dazed and confused, but trying to continue sept. 04 17:27:40 localhost.localdomain kernel: Uhhuh. NMI received for unknown reason 21 on CPU 3. sept. 04 17:27:40 localhost.localdomain kernel: Do you have a strange power saving mode enabled? sept. 04 17:27:43 localhost.localdomain kernel: Dazed and confused, but trying to continue sept. 04 17:27:43 localhost.localdomain kernel: hrtimer: interrupt took 43038152 ns lines
que l'on retrouve dans le journal des erreurs au moment du gel:
Code BASH :
journalctl -p err -b -1 -- Logs begin at Wed 2020-08-05 19:44:46 CEST, end at Fri 2020-09-04 19:36:19 CEST. -- sept. 04 09:49:59 localhost.localdomain systemd-udevd[585]: Specified group 'plugdev' unknown sept. 04 09:50:01 localhost.localdomain systemd[1]: Failed to start Setup Virtual Console. sept. 04 09:50:01 localhost.localdomain systemd[1]: Failed to start Show Plymouth Boot Screen. sept. 04 09:50:25 localhost.localdomain /etc/sysconfig/network-scripts/ifup-eth[1695]: Device wlp44s9 does not seem to be present, delaying initialization. sept. 04 09:50:25 localhost.localdomain systemd[1]: Failed to start LSB: Bring up/down networking. sept. 04 10:00:38 localhost.localdomain sddm-helper[18982]: gkr-pam: unable to locate daemon control file sept. 04 10:00:39 localhost.localdomain sddm-helper[19013]: pam_kwallet: could not execute kwalletd from /usr/bin/kwalletd sept. 04 10:00:39 localhost.localdomain sddm-helper[18982]: pam_kwallet(sddm:session): pam_kwallet: Impossible to write walletKey to walletPipe sept. 04 10:00:45 localhost.localdomain kwin_x11[19194]: kwin_core: Compositing is not possible sept. 04 17:27:25 localhost.localdomain kernel: NVRM: Xid (PCI:0000:18:00): 16, Head 00000000 Count 0000e051 sept. 04 17:27:33 localhost.localdomain kernel: NVRM: Xid (PCI:0000:18:00): 8, Channel 00000011 sept. 04 17:27:38 localhost.localdomain kernel: Uhhuh. NMI received for unknown reason 21 on CPU 2. sept. 04 17:27:38 localhost.localdomain kernel: Do you have a strange power saving mode enabled? sept. 04 17:27:38 localhost.localdomain kernel: Dazed and confused, but trying to continue sept. 04 17:27:40 localhost.localdomain kernel: Uhhuh. NMI received for unknown reason 21 on CPU 0. sept. 04 17:27:40 localhost.localdomain kernel: Do you have a strange power saving mode enabled? sept. 04 17:27:40 localhost.localdomain kernel: Dazed and confused, but trying to continue sept. 04 17:27:40 localhost.localdomain kernel: Uhhuh. NMI received for unknown reason 21 on CPU 1. sept. 04 17:27:40 localhost.localdomain kernel: Do you have a strange power saving mode enabled? sept. 04 17:27:40 localhost.localdomain kernel: Dazed and confused, but trying to continue sept. 04 17:27:40 localhost.localdomain kernel: Uhhuh. NMI received for unknown reason 21 on CPU 3. sept. 04 17:27:40 localhost.localdomain kernel: Do you have a strange power saving mode enabled? sept. 04 17:27:43 localhost.localdomain kernel: Dazed and confused, but trying to continue
mais d'autres dès le départ que j'avais déjà repérées dans le /var/log/boot.log
notamment celles sur
sept. 04 09:50:01 localhost.localdomain systemd[1]: Failed to start Setup Virtual Console.
sept. 04 09:50:01 localhost.localdomain systemd[1]: Failed to start Show Plymouth Boot Screen.
Édité par kalagani Le 04/09/2020 à 19h47
PC1: HPxw9400 Mageia8 Xfce/Cinnamon (ex Plasma car "Freeze")
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma
PC2: Dell Studio 540 Core2 Quad Q8300 en double boot: XPsp3/Mageia8 64bits Plasma

auroud85 Membre non connecté
-
- Voir le profil du membre auroud85
- Inscrit le : 20/07/2020
- Groupes :
-
Équipe Mageia
Ton PC semble avoir été mis à jour depuis au moins Mageia 5.
Je suspecte :
1) plutôt des paramètres qui n'ont plus lieu d'être et qui causent des dysfonctionnements.
2) ton PC utilise une carte Nvidia qui nécessite un ancien pilote propriétaire le nvidia 340.
Ce Pilote est connu pour dysfonctionner au retour de veille.
Proposition : Réinstallation à neuf de Mageia 7.1 avec l'Installeur Classique.
1) Sauvegarde toutes tes données sur un disque USB.
2) Pendant la sauvegarde, liste les logiciels que tu utilises sur une liste papier pour les réinstaller plus tard.
3) Réinstalle Mageia 7.1 en formatant tous les volumes Linux y compris /home.
Utilise le PC, laisse le tourner et se mettre en veille seul avec les réglages par défaut de Mageia 7.1 sans rien avoir modifier dans les paramètres. S'il y a un freeze, redémarre et exporte ici à l'issue de l'opération ceci :
Code BASH :
su -c 'journalctl -b -1 --no-hostname > /tmp/journal.txt
Mageia i18-fr, KDE, Bugsquad, advisories team.
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie