Apparence
Uubu.fr

Les systèmes Linux, l’open source, les réseaux, l’interopérabilité, etc.
« Il vaut mieux viser la perfection et la manquer que viser l’imperfection et l’atteindre. » (Bertrand Arthur William RUSSEL)
21 juillet 2010

coreutils GNU           Opérations de trie dans les fichiers


ptx

ptx

Lit un fichier texte et produit essentiellement un index permuté, avec chaque mot clé dans son contexte

-G, --traditional désactive toutes les extensions GNU. Si non spécifié, on peut spécifier plusieurs fichiers ou aucun.

Sélection de jeu de caractères

-f, --ignore-case met les minuscules en majuscule pour le trie. ptx assume que le fichier d'entrée est en ISO 8859-1 (latin-1).

Sélection de mot et traitement d'entrée

-b FILE, --break-file=FILE Option alternative à -W décrivant quels caractères composent les mots. il introduit le nom d'un fichier qui contient une liste de caractères qui ne peuvent pas faire partie d'un mot.
-i FILE, --ignore-file=FILE Le fichier associé avec cette option contient une liste de mots qui ne seront jamais comme mot clé.
-o FILE, --only-file=FILE Le fichier associé avec cette option contient une liste de mots qui seront retenus pour la sortie.
-r, --references Sur chaque ligne d'entrée, la séquence principale de caractères non-blanc seront pris pour référence pour identifier cette ligne dans l'index permuté.
-S REGEXP --sentence-regexp=REGEXP Cette option sélectionne quelle expression régulière va décrire la fin d'une ligne ou la fin d'une phrase. En fait, cette expression n'est pas seulement la distinction entre la fin des lignes ou la fin des phrases, et les limites de la ligne d'entrée n'ont pas de signification spécial en dehors de cette options. si -G et -r ne sont pas spécifiés, ce REGEX est importé :

           [.?!][]\"')]*\\($\\|\t\\| \\)[ \t\n]* sinon (si -r est spécifié) regex est: \n

  Utiliser un REGEX vide désactive la reconnaissance de la fin des ligne ou des phrases.

-W REGEXP, --word-regexp=REGEXP Cette option décrit quelle expression va décrire chaque mot clé. par défaut, si -G n'est pas spécifié, un mot est une séquence de lettres; le REGEXP utilisé est \w+ sinon un mot est quelque chose qui se termine par un espace, une tabulation ou un newline, le REGEXP utilisé est [^ \t\n]+

Formattage de sortie

-g NUMBER, --gap-size=NUMBER Sélectionne l'écart minimum d'espace blanc entre les champs sur la ligne de sortie.
-w NUMBER, --width=NUMBER Sélectionne la largeur maximum de sortie de chaque ligne.
-A, --auto-reference Sélectionne les références automatique. chaque ligne en entrée aura une référence automatique composé du nom du fichier et la ligne, avec une ',' entre eux.
-R, --right-side-refs Dans le format de sortie par défaut, si cette option n'est pas spécifiée, les références produite par l'effet des options -r ou -A sont placées à droite des lignes sorties, après le contexte. avec cette options, les références sont placées au début de chaque ligne en sortie.
-F STRING, --flac-truncation=STRING Si la sortie est tronquée, reporte en utilisant STRING
-m STRING, --macro-name=STRING Sélectionne une autre STRING à utiliser au lieu de 'xx', en générant une sortie utilisable par nroff ou troff ou TeX
-o, --format=roff Sélectionne un format de sortie pour le traitement par nroff ou troff. Chaque ligne de sortie ressemblera à: .xx "TAIL" "BEFORE" "KEYWORD_AND_AFTER" "HEAD" "REF"
-T, --format=tex Choisit un format de sortie utilisable par TeX. chaque ligne de sortie ressemblera à: \xx TAILBEFOREKEYWORDAFTERHEADREF