Freeze mga7 [Réglé]
noyaux 5.4.2, 5.4.6, 5.4.7
Système et matériels / Installation et configuration

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
apparemment le noyau 5.4.2 me pose bien des soucis. Mon PC n'y tient pas 5 minutes sans se bloquer. Redémarrage bourrin avec le bouton d'alim obligatoire. Avec la commande dmesg, on peut lire ceci:
[ 1.705920] BERT: Error records from previous boot:
[ 1.705922] [Hardware Error]: event severity: fatal
[ 1.705924] [Hardware Error]: Error 0, type: fatal
[ 1.705925] [Hardware Error]: section type: unknown, 81212a96-09ed-4996-9471-8d729c8e69ed
[ 1.705926] [Hardware Error]: section length: 0x290
[ 1.705929] [Hardware Error]: 00000000: 00000001 00000000 00000000 00030001 ................
Ca passe quand je remets le noyau 5.3.13-desktop-2.mga7 .
Voilà.
Étrange affaire ...
Édité par choucroot Le 06/01/2020 à 20h44
Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
La commande
Code BASH :
te permet d'avoir accès à l'historique du (non) démarrage précédent. Remplace -1 par un autre nombre en fonction du nombre de démarrages intervenus depuis celui sur le noyau "défectueux".
journalctl -b -1
Yves

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
déc. 22 09:56:52 localhost kernel: BERT: Error records from previous boot:
déc. 22 09:56:52 localhost kernel: [Hardware Error]: event severity: fatal
déc. 22 09:56:52 localhost kernel: [Hardware Error]: Error 0, type: fatal
déc. 22 09:56:52 localhost kernel: [Hardware Error]: section type: unknown, 81212a96-09ed-4996-9471-8d729c8e69ed
déc. 22 09:56:52 localhost kernel: [Hardware Error]: section length: 0x290
déc. 22 09:56:52 localhost kernel: [Hardware Error]: 00000000: 00000001 00000000 00000000 00030001 ................
....
déc. 22 09:56:52 localhost kernel: [Hardware Error]: 00000280: 00000000 00000000 00000000 00000000 ................
déc. 22 09:56:52 localhost kernel: [Hardware Error]: Error 1, type: fatal
déc. 22 09:56:52 localhost kernel: [Hardware Error]: section type: unknown, 81212a96-09ed-4996-9471-8d729c8e69ed
déc. 22 09:56:52 localhost kernel: [Hardware Error]: section length: 0x68c
déc. 22 09:56:52 localhost kernel: [Hardware Error]: 00000000: 00000001 00000000 00000001 00030001 ................
...
déc. 22 09:56:52 localhost kernel: [Hardware Error]: 00000680: 00000000 00000000 00000000 ............
déc. 22 09:56:52 localhost kernel: [Hardware Error]: Error 2, type: fatal
déc. 22 09:56:52 localhost kernel: [Hardware Error]: section type: unknown, 81212a96-09ed-4996-9471-8d729c8e69ed
déc. 22 09:56:52 localhost kernel: [Hardware Error]: section length: 0xb10
déc. 22 09:56:52 localhost kernel: [Hardware Error]: 00000000: 00000001 00000000 00000002 00030001 ................
...
déc. 22 09:56:52 localhost kernel: [Hardware Error]: 00000b00: 00000000 00000000 00000000 00000000 ................
déc. 22 09:56:52 localhost kernel: PM: Magic number: 15:428:928
déc. 22 09:56:52 localhost kernel: rtc_cmos 00:03: setting system clock to 2019-12-22T08:56:50 UTC (1577005010)
déc. 22 09:56:52 localhost kernel: ata1: SATA link down (SStatus 4 SControl 300)
déc. 22 09:56:52 localhost kernel: ata2: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
déc. 22 09:56:52 localhost kernel: ata2.00: ATA-9: LDLC, R0412A0, max UDMA/133
Le truc c'est que ça gèle à des moments que je n'arrive pas à "comprendre". Ça semble complètement erratique


Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
Ou alors tous les freeze viendraient de cette ligne ?
déc. 22 09:59:32 localhost kernel: lightdm[5290]: segfault at 0 ip 00007f461a8b6126 sp 00007ffcc7f65db8 error 4 in libc-2.29.so[7f461a83d000+154000]
Ici c'est 3 minutes après le boot, ça peut correspondre
![:] :]](/images/smileys/8.gif)
Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
déc. 22 09:46:03 localhost kernel: BUG: kernel NULL pointer dereference, address: 0000000000000000
déc. 22 09:46:03 localhost kernel: #PF: supervisor read access in kernel mode
déc. 22 09:46:03 localhost kernel: #PF: error_code(0x0000) - not-present page
Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

Au Secours Informatique Membre non connecté
-
- Voir le profil du membre Au Secours Informatique
- Inscrit le : 12/08/2015
- Site internet
- Groupes :
As-tu testé ta RAM et ton disque dur ? Tu peux les tester grâce à HBCD que j'utilise beaucoup (https://www.hirensbootcd.org/old-versions/, je n'ai pas testé la toute dernière) avec les programme memtest (pour la ram) et GSmartControl ou tout plein d'autres (pour le disque dur). On ne sait jamais mais dans ce cas, ça planterait également avec l'ancien noyau.
Essaie aussi de mettre la carte graphique temporairement en VESA pour voir si ça continue de planter ou non :
1) soit en interface graphique :
- Centre de Contrôle Mageia
- Matériel (à gauche)
- Configurer le serveur d'affichage (à droite)
- clique à droite de carte graphique et choisis Vendor->Other->VESA
- clique sur OK en bas à droite, peut-être plusieurs fois (ex. pour enregistrer les paramètres)
- il faudra ensuite te déconnecter et te reconnecter.
2) soit en mode ligne de commande
- CTRL+ALT+F2
- tape root, touche entrée, ton mot de passe root (c'est normal que rien ne s'affiche), touche entrée
- drakconf, touche entrée 2 fois
- utilise la flèche haut pour aller dans Carte Graphique, touche entrée
- flèche haut puis bas pour choisir Vendor|Other|Vesa
- flèche de gauche pour aller sur OK, plusieurs fois OK puis quitter et choisis "Oui" pour enregistrer.
- CTRL+ALT+F1
- redéconnecte toi
S'il y n'a plus de plantage, c'est que le problème vient du pilote graphique. Essaie alors de réinstaller le pilote ou garde le mode vesa s'il te convient.
Pour revenir à ta carte graphique, refais comme indiqué si dessus, au moment du choix de la carte graphique, le pilote le plus approprié sera automatiquement sélectionné au moment où tu vas dans Carte Graphique.
Je propose Mageia à mes clients qui ont un vieil ordinateur avec un vieux Windows plutôt qu'ils achètent un nouvel ordinateur et pour les nouvelles tours. Beaucoup en sont très satisfaits

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :

Comme tu dis, je n'ai aucun problème avec le noyau précédent (5.3.13-desktop-2.mga7 ). Donc niveau matériel, je ne vois pas ce qui clocherait.
Je vais faire comme d'habitude. Rester avec ce noyau 5.3, et repasser à du 5.4 (ou > ) dans quelques mois lorsque plusieurs nouvelles versions auront été publiées. Avec un peu de chance, ça retombera en marche.
Si j'observe à nouveaux les mêmes problèmes, alors j'accepterais de perdre un peu de mon temps à "tester" en me servant de tes procédures. Mais là, ça me saoule un peu de me taper des régressions comme ça.

Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

Au Secours Informatique Membre non connecté
-
- Voir le profil du membre Au Secours Informatique
- Inscrit le : 12/08/2015
- Site internet
- Groupes :
Quelques fois attendre une mise à jour permet d'éviter de longues prises de têtes.
Je propose Mageia à mes clients qui ont un vieil ordinateur avec un vieux Windows plutôt qu'ils achètent un nouvel ordinateur et pour les nouvelles tours. Beaucoup en sont très satisfaits

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
Édité par choucroot Le 22/12/2019 à 21h44
Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
alors aujourd'hui, il y a eu des mises à jour, notamment le noyau 5.4.6 . J'ai installé et retravaillé là dessous. En me doutant que j'aurais encore les problèmes de freeze, j'ai ouvert à tout hasard un terminal et exécuté la commande dmesg -kw > dmesg_kw.txt , histoire de chopper des traces avant le reboot brutal.
Cette fois, écran gelé arrivé au bout de 20 minutes. Par contre, j'avais encore le curseur de la souris pilotable, contraitement avec le 5.4.2, mais c'est tout. Pas d'accès aux terminaux avec CTRALT F1 ou F2.
Au reboot, j'ai consulté le fichier desg_kw.txt.
Et j'ai ceci:
[10728.510909] r8169 0000:06:00.0 enp6s0: Link is Up - 1Gbps/Full - flow control rx/tx
[12651.016186] i915 0000:00:02.0: GPU HANG: ecode 9:1:0x00000000, hang on rcs0
[12651.016189] GPU hangs can indicate a bug anywhere in the entire gfx stack, including userspace.
[12651.016190] Please file a _new_ bug report on bugs.freedesktop.org against DRI -> DRM/Intel
[12651.016191] drm/i915 developers can then reassign to the right component if it's not a kernel issue.
[12651.016192] The GPU crash dump is required to analyze GPU hangs, so please always attach it.
[12651.016193] GPU crash dump saved to /sys/class/drm/card0/error
[12651.017241] i915 0000:00:02.0: Resetting rcs0 for hang on rcs0
[12665.032864] i915 0000:00:02.0: Resetting rcs0 for hang on rcs0
Que se passe-t-il ?

Pour info, il n'y a pas grand chose dans /sys/class/drm/card0/error
# more /sys/class/drm/card0/error
No error state collected
Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

Papoteur Membre non connecté
-
- Voir le profil du membre Papoteur
- Inscrit le : 03/10/2011
- Groupes :
-
Modérateur
-
Équipe Mageia
-
Administrateur
-
Forgeron
Tu n'es pas seul.
J'ai des freezes aussi, et j'ai fait un rapport de bug. https://bugs.mageia.org/show_bug.cgi?id=25930
Il n'a pas encore bougé. Tu peux compléter.
Je viens de trouver des rapports "amont".
https://gitlab.freedesktop.org/drm/intel/issues/673
Yves

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
Là je suis sur le kernel 5.3.13. Et je viens de subir un ralentissement bizarre. En fait, il y a bien eu un problème avec la carte, mais pas de "freeze" comme sous les kernels 5.4 . Donc le problème de "driver" i915 devait être là depuis longtemps, mais ça n'est qu'avec les kernels 5.4 qu'on s'en rend vraiment compte !
[xxx@localhost Bureau]$ dmesg -k | grep -i gpu
[ 4.231622] RAPL PMU: hw unit of domain pp1-gpu 2^-14 Joules
[ 6650.235786] i915 0000:00:02.0: GPU HANG: ecode 9:0:0x00000000, hang on rcs0
[xxx@localhost Bureau]$ uname -a
Linux localhost 5.3.13-desktop-2.mga7 #1 SMP Mon Nov 25 20:30:40 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux
Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :
D'après les infos du bug 25930, un fix d'Intel y a été inséré.
Et voilà !


Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )

choucroot Membre non connecté
-
- Voir le profil du membre choucroot
- Inscrit le : 07/08/2015
- Groupes :

toujours sous le noyau 5.4.7
freeze sévère 2 fois dans le navigateur Falkon ... au bout de nombreuses heures de fonctionnement "normal" .... Au démarrage, pas d'autre traces que :
janv. 05 18:07:48 localhost kernel: BERT: Error records from previous boot:
janv. 05 18:07:48 localhost kernel: [Hardware Error]: event severity: fatal
janv. 05 18:07:48 localhost kernel: [Hardware Error]: Error 0, type: fatal
janv. 05 18:07:48 localhost kernel: [Hardware Error]: section type: unknown, 81212a96-09ed-4996-9471-8d729c8e69ed
janv. 05 18:07:48 localhost kernel: [Hardware Error]: section length: 0x290
janv. 05 18:07:48 localhost kernel: [Hardware Error]: 00000000: 00000001 00000000 00000000 00030001 ................
...
Ce noyau avait l'air d'avoir résolu le problème .... apparemment non, reste des trucs bizarres ....

Ou alors c'est le navigateur Falkon qui ferait tout planter cette fois ci ? À suivre ....
Ordinateurs : Mageia9 64bits XFCE: MSI Cubi N-8GL-002BEU (Pentium N5000), NUC11ATKPE (Pentium N6005), HP ELITEBOOK 820-G3 (I5-6200U)
Smartphone: /e/OS ( Samsung S7 Edge )
Smartphone: /e/OS ( Samsung S7 Edge )
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie