Uniq

From aldeid
Jump to navigation Jump to search

uniq

Description

La commande uniq permet de traiter (identifier, supprimer, isoler) les doublons dans un fichier.

Utilisation

Paramètres

-c, --count
     Fait apparaître le nombre d'occurences devant chaque ligne

-d, --repeated
      Ne fait apparaître que les lignes dupliquées

-D, --all-repeated[=delimit-method]
      Fait apparaître toutes les lignes dupliquées en les séparant par section
      delimit-method={none(par défaut),prepend,separate}. La démlimitation est
      marquée par une ligne blanche

-f, --skip-fields=N
      Ignore les N premiers champs pour la comparaison. Les champs sont
      déterminés par les espaces séparant les "mots" sur chaque ligne.

-i, --ignore-case
      Insensible à la casse pour la comparaison

-s, --skip-chars=N
      Ignore les N premiers caractères pour la comparaison

-u, --unique
      N'affiche que les lignes uniques

-z, --zero-terminated
      Termine les lignes avec un 0 byte à la place d'un saut de ligne

-w, --check-chars=N
      Limite la compraison à N caractères par ligne

--help
      Affiche l'aide

--version
      Affiche la version

Exemple

Combinée avec la fonction sort, uniq permet de supprimer tous les doubons d'un fichier, même lorsqu'ils ne se suivent pas.

$ sort input | uniq - output

produit le résultat suivant :

+-------+           +--------+            +--------+
| input |           |        |            | output |
+-------+           +--------+            +--------+
| 1     |           | 0 1 2  |            | 0 1 2  |
| 12    |           | 1      |            | 1      |
| 12    |    sort   | 1      |    uniq    | 12     |
| 123   |  ======>  | 12     |  =======>  | 123    |
| 1     |           | 12     |            | 2      |
| 2     |           | 123    |            | 2 4 5  |
| 0 1 2 |           | 123    |            +--------+
| 2 4 5 |           | 2      |
| 123   |           | 2 4 5  |
+-------+           +--------+