Je recopie ici la commande (un peu adaptée) pour obtenir :
.abc
./path
et ses sous-répertoires.find /path -regex ".*/.*\.abc" -exec ls -l {} \; | awk '{ Total += $5} END { print Total }'
Note : d'autres exemples existent avec la commande du
. Cependant l'option du -b
ne semble pas fonctionner sur tous les shells.
Ah le Bash ! Ce vrai et beau langage qui continue son exécution même après qu'une erreur s'est produite.
Dans leur grande sagesse, les développeurs ont eu la bonne idée d'y associer un mode de débuggage, qui permet d'afficher la valeur des variables.
Quand on en a marre de débugger un script à coup de echo
toutes les deux lignes, cela s'avère pratique.
Pour l'activer :
1) On peut lancer tout le script en mode débug :
bash -x monScript.sh
2) On peut également intégrer l'option directement au niveau du shebang :
#!/usr/bin/env bash -x
3) On peut enfin ne placer qu'une partie du script en mode débug. Il suffit d'activer le mode avant le code suspect, et de le désactiver ensuite :
#!/usr/bin/env
# Le code qui ne pose pas de problème
...
# Activation du mode debug
set -x
# Le code foireux
...
# Désactivation du mode debug
set +x
# Code exécuté après
Il y a quelques autres options, mais en gros c'est l'idée.
Pour cela, il suffit de rediriger un flux vers grep de cette façon :
cat monfichier | grep -E --color 'PATT3RN|$'
Ainsi, l'ensemble du texte d'origine est affiché. Et si le pattern apparaît, celui-ci apparaît en couleur.
Par exemple, dans le cas où l'on souhaite afficher l'arbre des dépendances d'un module maven, et qu'on cherche quelles dépendances dépendent de slf4j :
mvn dependency:tree | grep -E --color 'slf4j|$'
Note : Sans le |$, seules les lignes contenant le pattern sont affichées.
La commande shell utile pour additionner une colonne de nombres, grâce à l'outil awk.
Soit le fichier suivant :
cat monfichier
3
183
10
69
Pour additionner ces nombres, j'utilise la commande awk suivante :
cat monfichier | awk '{total = total + $1}END{print total}'
Le résultat affiché est bien entendu 265.
Petite astuce bash pour supprimer le contenu d'un répertoire :
find $REPERTOIRE -mindepth 1 -delete
-mindepth 1
permet de ne lister que les fichiers (et répertoires) situés au moins au niveau 1 de profondeur. Donc en pratique, tout ce qui se trouve dans le répertoire $REPERTOIRE.
-delete
supprime tous les fichiers (et répertoires) listés.
Note : les fichiers cachés (commençant par un '.') sont également supprimés.
sudo -u www-data stat /mon/repertoire
Pour chercher une chaine de caractères dans un répertoire de façon récursive :
grep -rl "string" "$PATH"
Je te prends ça. Pour les hash de mots de passe dans ansible (module user).
Pour tester si une page existe sans la télécharger :
#!/bin/bash
# Renvoie "true" si la page passée en argument existe.
# @param $1 : l'URL de la page dont on veut tester l'existence.
# @return true si la page existe, false sinon.
is_URL_real()
{
local page_exists
page_exists="false"
if [[ `wget --server-response --spider "$1" 2>&1 | grep 'HTTP/1.1 200 OK'` ]]; then
page_exists="true"
fi
echo "$page_exists"
}
is_URL_real "$1"
Ce qui donne à l'exécution :
./test_URL.sh "https://www.qwant.com"
true
A propos des variables de type local en Bash.
Tout d'abord, la sécurité.
Afin d'écrire plus rapidement, on se retrouve souvent à déclarer et initialiser la variable en même temps :
local var="plouf plouf"
Sauf qu'en faisant ça, l'ordre d'exécution est le suivant :
Ce qui signifie que la variable reste accessible pendant un instant au niveau global. Il faut donc mieux faire la déclaration et l'instanciation en deux temps :
local var
var="plouf plouf"
Ce qui m'amène au deuxième point. Une fois qu'une variable a été déclarée local, il n'est pas besoin de remettre le mot-clef local à chaque instanciation. Ainsi, si je considère le script suivant :
#/usr/bin/env bash
ma_fonction()
{
local var = "ALEX"
echo "$var"
var="TOM"
echo "$var"
}
ma_fonction
echo "<$var>"
La sortie sera :
ALEX
TOM
<>
Un moyen de créer des répertoires plus rapidement.
Je veux créer des répertoires ayant un nom basé sur le même modèle. Par exemple REPERTOIRE.ABC.08
.
Pour créer tous les répertoires de 08 à 14, je peux utiliser une boucle for dans laquelle un compteur s'incrémente dans une string, laquelle est passée à mkdir.
Ou alors je peux utiliser une capacité de la commande mkdir :
mkdir REPERTOIRE.ABC.{08..14}
# Ce qui me donne :
ls -a
REPERTOIRE.ABC.08
REPERTOIRE.ABC.09
REPERTOIRE.ABC.10
REPERTOIRE.ABC.11
REPERTOIRE.ABC.12
REPERTOIRE.ABC.13
REPERTOIRE.ABC.14
Je peux utiliser une suite de lettres :
mkdir REPERTOIRE.{a..f}
# Ce qui me donne :
ls -a
REPERTOIRE.a
REPERTOIRE.b
REPERTOIRE.c
REPERTOIRE.d
REPERTOIRE.e
REPERTOIRE.f
Je peux utiliser plusieurs "suites" dans le même motif. Attention toutefois, car toutes les combinaisons seront créees :
mkdir REPERTOIRE.{a..c}_{0..3}
# Ce qui me donne :
ls -a
REPERTOIRE.a_0
REPERTOIRE.a_1
REPERTOIRE.a_2
REPERTOIRE.a_3
REPERTOIRE.b_0
...
REPERTOIRE.c_3
Le bonus de fin : je peux parcourir une suite de nombres avec un pas supérieur à 1 :
# Pour un pas de 2
mkdir REPERTOIRE.{1..7..2}
# Ce qui me donne :
ls -a
REPERTOIRE.1
REPERTOIRE.3
REPERTOIRE.5
REPERTOIRE.7
Edit : si au lieu d'une suite de caractères je veut utiliser une liste de valeurs prédéfinies je peux utiliser la virgule :
mkdir dossier_{toto,1,007,AZ}
# Ce qui me donne
ls -a
dossier_toto
dossier_1
dossier_007
dossier_AZ
Pour une arborescence, j'utilise aussi l'option -p :
mkdir -p parent{1..4}/enfant{bill,bob,ben}
# Ce qui me donne
tree
.
├── parent1
│ ├── enfantben
│ ├── enfantbill
│ └── enfantbob
├── parent2
│ ├── enfantben
│ ├── enfantbill
│ └── enfantbob
├── parent3
│ ├── enfantben
│ ├── enfantbill
│ └── enfantbob
└── parent4
├── enfantben
├── enfantbill
└── enfantbob
Trier un fichier selon la colonne souhaitée.
Soit le fichier suivant, écrit en 3 colonnes :
Tend Jean 23
Car Thierry 34
Tatouille Sarah 12
Pour trier le fichier selon la deuxième colonne (alphabétique donc) :
cat mon_fichier | sort -k 2,2
# Ce qui donne :
Tend Jean 23
Tatouille Sarah 12
Car Thierry 34
Pour le trier selon la troisième colonne (ce sont des nombres) :
cat mon_fichier | sort -k 3,3 -n
# Ce qui donne :
Tatouille Sarah 12
Tend Jean 23
Car Thierry 34
Explication de la commande :
Pour mémoire.
Comment extraire la n-ème ligne d'une fichier en bash?
Soit le fichier suivant :
Ligne 01
Ligne 02
Ligne 03
Ligne 04
Ligne 05
Ligne 06
Ligne 07
Avec l'outil sed :
# J'extrais la 4eme ligne du fichier
cat mon_fichier | sed "4q;d"
# Ce qui donne
Ligne 04
# J'extrais la 67eme ligne (avec une variable)
var="67"
cat mon_fichier | sed "${var}q;d"
Aujourd'hui je suis tombé sur ça :
for i in $(seq 0 $var)
do
echo "bla bla bla"
done
Il s'agit d'une des multiples façons d'utiliser la boucle for en bash. Sauf que :
Depuis la version 4 de bash qui, je le rappelle, est sortie en février 2009, il existe une nouvelle façon d'utiliser la boucle for :
# Pour i de 1 à $var par pas de 1
for (( i=1; i<=$var; i++ ))
do
echo "bla bla bla"
done
Ou encore :
# Pour i de 3 à 47 par pas de 4
for i in {3..47..4}
do
echo "bla bla bla"
done
Il serait temps de s'y mettre !
Afin d'éviter de créer des scripts troués, une bonne pratique est d'utiliser le double-tiret -- pour marquer la fin des options d'une commande bash.
En effet, supposons que je veuille lister les fichiers d'un répertoires. Rien n'empêche qu'un répertoire s'appelle -o et active donc l'option associée. Pour signifier à la commande ls d'ignorer ce qui suit mes options je procède ainsi :
# Mon répertoire s'appelle "-o -a"
var="-o -a"
# J'ajoute un double-tiret pour signifier la fin des options
ls -l -- "$var"
# Une fois la variable évaluée, la commande ressemblera à ceci
ls -l -- -o -a
# Et seule l'option -l sera prise en compte
Cette convention est reprise par toutes les commandes built-in de bash (+ d'autres shells comme csh et sh) sauf une poignée (true, false, echo et eval).
J'avais fais quelques tests il y a quelques mois, pour voir ce qu'on pouvait faire en "hackant" les options des commandes. Pour ls c'est ennuyeux. Mais il suffit d'imaginer les conséquences avec rm par exemple ...
Note à moi-même : il faudra que j'essaie getopt pour créer un parseur d'options en bash.
La même chose mais avec l'outil sed cette fois.
Je veux donc afficher ce qui se trouve entre deux motifs, mais en utilisant des variables à la place des motifs. J'utilise le fichier suivant :
Ce fichier est un fichier particulier
car il contient un passage sensible situé
entre MOTIF_01 et
une balise
de fin
appelée MOTIF_02. Il s'agit d'extraire
ce qui se situe entre les deux.
Pour cela j'utilise sed de la façon suivante :
# Le cas classique avec MOTIF_01 et MOTIF_02
cat mon_fichier | sed -n "/MOTIF_01/,/MOTIF_02/p"
# Ce qui me donne
entre MOTIF_01 et
une balise
de fin
appelée MOTIF_02. Il s'agit d'extraire
En fait, cela me donne ce qui se trouve entre les lignes comprenant les motifs, en plus des lignes comprenant les motifs. Après ça, un substitution avec sed "s///" finit le travail.
# En utilisant des variables (il suffit de les ajouter aux motifs)
cat mon_fichier | sed -n "/MOTIF_01$VAR_01/,/$VAR_02/p"
Cette fois c'est une capacité de l'outil awk qui m'intéresse.
Comment afficher ce qui se trouve entre deux motifs ? Le point fort est que cette méthode fonctionne même si les motifs ne sont pas sur la même ligne :
# J'affiche ce qui se trouve entre le motifs MOTIF_01 et MOTIF_02
cat mon_fichier | awk "/MOTIF_01/,/MOTIF_02/"
Dans ce cas, les motifs sont affichés avec ce qui les sépare. Le résultat peut ressembler à quelque chose comme ça :
bla bla bla MOTIF_01 toc
//Plein de trucs se trouvant entre les motifs
paf pouf MOTIF_02 plouf plouf
Une option bien utile de l'outil grep.
Je veux chercher un motif dans un fichier texte. Mais je veux également afficher un certain nombre de lignes avant/après ce motif. J'utilise le fichier suivant :
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Nulla et vehicula lectus.
Integer sit amet augue est.
Vivamus vestibulum pretium ex.
Praesent in nunc nec turpis aliquam porttitor.
Etiam leo quam, bibendum nec velit eget, aliquam malesuada justo.
Aliquam sit amet dapibus enim.
Proin eget velit vehicula, vulputate augue eget, maximus diam.
Aenean pellentesque, nisi id viverra tempor, neque dui lacinia nisi, et ultricies nunc turpis at mauris.
Pour cela, j'utilise les options -A et -B de grep ainsi :
# En plus du motif recherché, j'affiche 2 lignes au-dessus et 3 lignes en-dessous
cat mon_fichier | grep -E " turpis aliquam " -A3 -B2
Ce qui me donne
Integer sit amet augue est.
Vivamus vestibulum pretium ex.
Praesent in nunc nec turpis aliquam porttitor.
Etiam leo quam, bibendum nec velit eget, aliquam malesuada justo.
Aliquam sit amet dapibus enim.
Proin eget velit vehicula, vulputate augue eget, maximus diam.
Il faut lire ces options comme :
Le nombre qui les suit indique le nombre de lignes à garder avant/après.
Si le nombre de lignes à garder avant/après est le même, alors je peux utiliser l'option -C :
# En plus du motif recherché, j'affiche 1 ligne au-dessus et en-dessous
cat mon_fichier | grep -E "amet dapibus" -C1
Ce qui me donne
Etiam leo quam, bibendum nec velit eget, aliquam malesuada justo.
Aliquam sit amet dapibus enim.
Proin eget velit vehicula, vulputate augue eget, maximus diam.
Pour connaître le path d'un script à l'intérieur de ce même script, il faut utiliser :
PATH=${BASH_SOURCE[0]}
Au lieu de :
PATH=$0
En effet, la première méthode retourne le path du script courant même s'il est sourcé (ie lancé comme ceci : ./script.sh).