Repérer et supprimer des fichiers en double sous mga8
-
- Voir le profil du membre nmrk.n
- Inscrit le : 20/04/2018
- Site internet
- Groupes :
-
Banni
Quel logiciel(s) utilisez-vous pour repérer et supprimer des fichiers en double sous mga8 ?
Je n'ai pas trouvé FSLint dans les dépôts.

Autre Distrib : Trisquel version Triskel | Matériel : Penguin Pro 5 GNU/Linux Desktop | Processeur : Intel Quad-Core i5-4430 (6M Cache, up to 3.20 GHz) | Memory: 32GB DDR3 | Hard Drive: ATA Samsung SSD 840 256Go table::gpt depuis 2020 (anc. dos) et Seagate Barracuda ATA ST2000DM001-1CH1 2To 64Mo table::gpt | DVD : TSSTcorp CDDVDW SH-224DB | Wireless N: Wireless N PCIe Card (TPE-N300PCIE4) | Graphics Card: GeForce 8400GS 1GB PCI Express 2.0 Video Card | Bluetooth: USB Micro Adapter v2 (TPE-USBBLUV2) | Keyboard / [https://fr.wikipedia.org/wiki/TypeMatrix]TypeMatrix[/url] BÉPO | Mouse : Selecline sans fils | Monitor: Essentiel B Photo + Essentiel B Studio 2 x 1920 x 1080 | Printer : All-in-one HP Officejet 6500A Plus connectée wifi | Power Cable: Europe - Plug Type Europlug (CEE 7/16) |

Jybz Membre non connecté
-
- Voir le profil du membre Jybz
- Inscrit le : 10/10/2018
- Groupes :
-
Administrateur
-
Forgeron
Mais si je devais partir à la trace, je listerais tous les fichiers :
Code BASH :
find . >/tmp/list-fichiers
puis je calculerai la somme de tous les fichiers :
Code BASH :
for FICHIER in $(cat /tmp/list-fichiers) ; do md5sum ${FICHIER} >>/tmp/list-fichiers-sum done
et enfin, j'analyserais la liste, pour se faire, je la séparerais en deux, ne gardant que la somme dans un fichier a part :
Code BASH :
cat /tmp/list-fichiers-sum | cut -d ' ' -f 1 | sort | uniq -c >/tmp/list-sum
Voilà qu'on a un fichier donnant pour chaque somme le nombre de fois qu'elle existe. On la nettoie en supprimant les fichiers uniques :
Code BASH :
sed -e '/^1[[:space:]]+/d' /tmp/list-sum-doublons
À ce moment, il faut retrouver les aux quelles appartiennent les sommes :
Code BASH :
for SOMME in $(cat /tmp/list-sum-doublons); do grep ${SOMME} /tmp/list-fichiers-sum >> /tmp/list-fichiers-doublons done
Voilà... On a une liste des fichiers doublons par somme.
Il y a surement un moyen plus efficace. Je dis ça sans trop réfléchir. Je tiens à précisé que je dis tout ça sans même avoir testé une commande, j'ai pu faire des erreurs.
Téléverser une image : /wiki/hebergement-de-fichiers-sur-mlo
Arch | Machine | OS |
x86_64 | lenovo x250 | mga9 |
armv7hl | bananapro | mga9 |
aarch64 | Raspberry Pi 4B | mga9 |
-
- Voir le profil du membre nmrk.n
- Inscrit le : 20/04/2018
- Site internet
- Groupes :
-
Banni
euh . . . et tu pourrais nous proposer une interface graphique ?

Autre Distrib : Trisquel version Triskel | Matériel : Penguin Pro 5 GNU/Linux Desktop | Processeur : Intel Quad-Core i5-4430 (6M Cache, up to 3.20 GHz) | Memory: 32GB DDR3 | Hard Drive: ATA Samsung SSD 840 256Go table::gpt depuis 2020 (anc. dos) et Seagate Barracuda ATA ST2000DM001-1CH1 2To 64Mo table::gpt | DVD : TSSTcorp CDDVDW SH-224DB | Wireless N: Wireless N PCIe Card (TPE-N300PCIE4) | Graphics Card: GeForce 8400GS 1GB PCI Express 2.0 Video Card | Bluetooth: USB Micro Adapter v2 (TPE-USBBLUV2) | Keyboard / [https://fr.wikipedia.org/wiki/TypeMatrix]TypeMatrix[/url] BÉPO | Mouse : Selecline sans fils | Monitor: Essentiel B Photo + Essentiel B Studio 2 x 1920 x 1080 | Printer : All-in-one HP Officejet 6500A Plus connectée wifi | Power Cable: Europe - Plug Type Europlug (CEE 7/16) |

stroibe974 Membre non connecté
-
- Voir le profil du membre stroibe974
- Inscrit le : 13/08/2018
- Groupes :
-
Modérateur
nmrk.n :
Bonjour Jybz,
euh . . . et tu pourrais nous proposer une interface graphique ?

euh . . . et tu pourrais nous proposer une interface graphique ?

+1


Jybz Membre non connecté
-
- Voir le profil du membre Jybz
- Inscrit le : 10/10/2018
- Groupes :
-
Administrateur
-
Forgeron


Je ne sais pas développer d'interface graphique, je laisse le soin à quelqu'un d'autre.
Téléverser une image : /wiki/hebergement-de-fichiers-sur-mlo
Arch | Machine | OS |
x86_64 | lenovo x250 | mga9 |
armv7hl | bananapro | mga9 |
aarch64 | Raspberry Pi 4B | mga9 |

moment magnetique Membre non connecté
-
- Voir le profil du membre moment magnetique
- Inscrit le : 06/10/2012
- Groupes :
ne pas oublier de faire avant un IFS=$'\n' sinon ça peut mal fonctionner la boucle for in si des fichiers ont des nom avec espaces
https://fr.wikipedia.org/wiki/Input_Field_Separators

Ami age Membre non connecté
-
- Voir le profil du membre Ami age
- Inscrit le : 18/08/2012
- Site internet
- Groupes :
-
Modérateur
_______________________________________________________________________

___________________________________ Un petit clic pour Mageia ? =>> CLIQUEZ I C I :
.



___________________________________ Un petit clic pour Mageia ? =>> CLIQUEZ I C I :
.

moment magnetique Membre non connecté
-
- Voir le profil du membre moment magnetique
- Inscrit le : 06/10/2012
- Groupes :
pour trouver , selectionner ( finement ) des doublons j'utilisais awk dans mes scripts , mais c'était il y a plus 10 ans ... faut que je retrouve et que je remette les mains dans le cambouis


moment magnetique Membre non connecté
-
- Voir le profil du membre moment magnetique
- Inscrit le : 06/10/2012
- Groupes :
./doublon.sh dossier_recherche fichier_resultat.txt fichier_temp
à savoir si le nom du fichier contient le caractère % ça peut poser problème au niveau de la fonction printf dans awk car c'est un caractère de formatage
il y a possibilité de deplacer un fichier dans le code en ajoutant au bon endroit dans awk ( au milieu des conditions )
commande='mv -f fichier1 fichier2 '
system(commande)
mais je ne l'ai pas mis pour eviter des cheveux blancs
Code BASH :
#!/bin/bash dossier_recherche=$1 fichier_sortie=$2 fichier_temp=$3 madate=$(date +"%Y-%m-%d-%H-%M-%S") echo $madate IFS=$'\n' find "$dossier_recherche" -type f >> "$fichier_temp""$madate""1" for FICHIER in $(cat "$fichier_temp""$madate""1" ) do somme=$( md5sum ${FICHIER} ) somme2=${somme%% *} echo $somme2";""$FICHIER" >> "$fichier_temp""$madate""2" done sort -t';' +0d -1 "$fichier_temp""$madate""2" > "$fichier_temp""$madate""3" awk -v fics=${fichier_sortie} ' BEGIN { FS=";" } { md5sum[NR] = $1 chemin[NR] = $2 } END { fin = NR print fin for(i=1;i<=fin;i++){ tableau[ md5sum[i]] = 0 ; } md5sum_etat=0 md5sum_nb=0 md5sum_debut=1 md5sum_fin=1 for(i=1;i<=fin;i++){ if( md5sum_etat != md5sum[i] ){ if( md5sum_nb > 1 ){ for(j=md5sum_debut;j<=md5sum_fin;j++){ ligne=md5sum[j]";"chemin[j]";"md5sum_nb"\n" printf(ligne) >> fics } } md5sum_etat = md5sum[i] md5sum_nb=1 md5sum_debut=i tableau[md5sum[i]] = tableau[md5sum[i]]+1 } else{ tableau[md5sum[i]] = tableau[md5sum[i]]+1 md5sum_fin=i md5sum_nb=tableau[md5sum[i]] } } } ' "$fichier_temp""$madate""3"
Édité par moment magnetique Le 03/03/2021 à 19h58

OPS56 Membre non connecté
-
- Voir le profil du membre OPS56
- Inscrit le : 18/11/2008
- Groupes :
Regarde ici
czkawka et assez puissant, il trouve les doublons même si les noms de fichiers sont différents.
J'ai fait une demande de package, qui n'a pas encore été traité.
@+

Dell G3-15 Intel Corei7 - 16Go Ram - Nvidia GTX1660 Ti (Tri boot Mageia 9- 64 bits / Linux Mint 20 Cinamon/ Windows 10)
Core i5 760 - 8Go Ram - Nvidia Gforce 450 - (Triple boot Mageia 9-64 bits - Plasma 5 / Mint 20 Cinamon / Open Suse Tumbleweed - Plasma 5)

moment magnetique Membre non connecté
-
- Voir le profil du membre moment magnetique
- Inscrit le : 06/10/2012
- Groupes :
je tiens à préciser qu'ajouter une ligne pour déplacer automatiquement les fichiers doublons ( ce qui peut se faire selon critère ) peut être dangereux dans la mesure ou par exemple j'ai testé sur mon répertoire blender-2.92.0-linux64/ ... et j'en ai trouvé un paquet et je parle pas du home
...
donc si vous faites automatiquement sur votre home il y a plein de fichiers "systeme" en double qui sont utiles et qui risque de poser problèmes si ils disparaissent .
après vous pouvez affiner la recherche . Par exemple en selectionnant qu un type de fichier dans find
find "$dossier_recherche" -type f -iname " *.jpg" >> "$fichier_temp""$madate""1"
Édité par moment magnetique Le 03/03/2021 à 20h16
-
- Voir le profil du membre nmrk.n
- Inscrit le : 20/04/2018
- Site internet
- Groupes :
-
Banni
OPS56 :
Bonjour nmrk.n
Regarde ici
czkawka et assez puissant, il trouve les doublons même si les noms de fichiers sont différents.
J'ai fait une demande de package, qui n'a pas encore été traité.
@+
Regarde ici
czkawka et assez puissant, il trouve les doublons même si les noms de fichiers sont différents.
J'ai fait une demande de package, qui n'a pas encore été traité.
@+
merci OPS56
Après avoir vu cette page : https://github.com/qarmin/czkawka/releases/
et surtout cela : linux_czkawka_gui.AppImage 26.1 MB
je l'ai téléchargé et ça m'a l'air de fonctionner . . . (c'est Molotov TV AppImage, que j'utilise, qui m'a mis la puce à l'oreille).
Il suffit de télécharger le fichier et double-cliquer dessus + ok aux messages de sécurité* et ça roule.

* Ça rend le fichier exécutable et la fois d'après on peut choisir «ne plus poser la question».
Autre Distrib : Trisquel version Triskel | Matériel : Penguin Pro 5 GNU/Linux Desktop | Processeur : Intel Quad-Core i5-4430 (6M Cache, up to 3.20 GHz) | Memory: 32GB DDR3 | Hard Drive: ATA Samsung SSD 840 256Go table::gpt depuis 2020 (anc. dos) et Seagate Barracuda ATA ST2000DM001-1CH1 2To 64Mo table::gpt | DVD : TSSTcorp CDDVDW SH-224DB | Wireless N: Wireless N PCIe Card (TPE-N300PCIE4) | Graphics Card: GeForce 8400GS 1GB PCI Express 2.0 Video Card | Bluetooth: USB Micro Adapter v2 (TPE-USBBLUV2) | Keyboard / [https://fr.wikipedia.org/wiki/TypeMatrix]TypeMatrix[/url] BÉPO | Mouse : Selecline sans fils | Monitor: Essentiel B Photo + Essentiel B Studio 2 x 1920 x 1080 | Printer : All-in-one HP Officejet 6500A Plus connectée wifi | Power Cable: Europe - Plug Type Europlug (CEE 7/16) |
-
- Voir le profil du membre nmrk.n
- Inscrit le : 20/04/2018
- Site internet
- Groupes :
-
Banni
Pourquoi l'heure de modification des mêmes fichiers n'est elle pas la même dans Czkawka et Dolphin ?

Autre Distrib : Trisquel version Triskel | Matériel : Penguin Pro 5 GNU/Linux Desktop | Processeur : Intel Quad-Core i5-4430 (6M Cache, up to 3.20 GHz) | Memory: 32GB DDR3 | Hard Drive: ATA Samsung SSD 840 256Go table::gpt depuis 2020 (anc. dos) et Seagate Barracuda ATA ST2000DM001-1CH1 2To 64Mo table::gpt | DVD : TSSTcorp CDDVDW SH-224DB | Wireless N: Wireless N PCIe Card (TPE-N300PCIE4) | Graphics Card: GeForce 8400GS 1GB PCI Express 2.0 Video Card | Bluetooth: USB Micro Adapter v2 (TPE-USBBLUV2) | Keyboard / [https://fr.wikipedia.org/wiki/TypeMatrix]TypeMatrix[/url] BÉPO | Mouse : Selecline sans fils | Monitor: Essentiel B Photo + Essentiel B Studio 2 x 1920 x 1080 | Printer : All-in-one HP Officejet 6500A Plus connectée wifi | Power Cable: Europe - Plug Type Europlug (CEE 7/16) |

lcb1 Membre non connecté
-
- Voir le profil du membre lcb1
- Inscrit le : 04/07/2011
- Groupes :

Mageia 9
Plasma : 5.27.10-1.mga9
noyau : 6.6.83-1.mga9
Asus Geforce GTX 750 ti Sur SSD
& Asus N73S laptop
Plasma : 5.27.10-1.mga9
noyau : 6.6.83-1.mga9
Asus Geforce GTX 750 ti Sur SSD
& Asus N73S laptop

Ami age Membre non connecté
-
- Voir le profil du membre Ami age
- Inscrit le : 18/08/2012
- Site internet
- Groupes :
-
Modérateur
"FSlint est un utilitaire complet multifonctions permettant de nettoyer vos stockages de fichiers. Il s'agit d'une interface graphique écrite en pyGTK. Il est en voie d'obsolescence sans remplaçant aussi fiable. Le site officiel de FSlint invite les utilisateurs à se reporter sur Czkawka, son remplaçant [edit 20/06/2021]."
_______________________________________________________________________

___________________________________ Un petit clic pour Mageia ? =>> CLIQUEZ I C I :
.



___________________________________ Un petit clic pour Mageia ? =>> CLIQUEZ I C I :
.
Répondre
Vous n'êtes pas autorisé à écrire dans cette catégorie