Code final de la boîte 1
Utilisation du programme
Si vous souhaitez lire le code du programme et l'exécuter sans rentrer dans les détails
de sa création, vous voici sur la bonne page.
Obtenir tous les fichiers du projet
git clone https://github.com/titanix/projet_bao.git
Arguments du programme
Forme longue | Forme courte | Utilité |
--input_dir= | -i | Répertoire contenant les fichiers RSS à traiter |
--output_dir= | -o | Dossier où seront écrits les fichiers résultats |
--xml | -x | Utilise une procédure d'extraction basée sur
une bibliothèque XML plutôt que l'extraction par défaut. |
--treetagger | -t | Générer en plus des fichiers XML obtenus avec TreeTagger (bao2) |
--proc=N | -p | Utilise le code parallèle avec au plus N
processus concurrents |
--verbose | -v | Affiche des informations détaillées durant
l'exécution (non implémenté) |
--help | -h | Affiche le message d'aide et quitte le programme |
L'argument -p est obsolète. En outre, il semblerait que l'option
-x conduise à la génération de fichiers ayant des problèmes
d'encodage.
Exemples
Exécute un traitement séquentiel, basé sur l'extraction de chaîne
de caractères, sur le répertoire 2008 et écrits les fichiers de résultat dans
le répertoire courant.
parcours.pl --input_dir=2013 --output_dir=results --xml
Exécute un traitement séquentiel des fichiers présents dans le dossier 2013,
basé sur l'extraction de chaîne XML, et génère les fichiers de sorties dans le
répertoire nommé results.
parcours.pl -i=2013 -o=results -x
On voit qu'il est possible d'écrire les commandes de manière sensiblement plus courte
grâce à la bibliothèque long_ops.
parcours.pl -input_dir=2013 -o=results -x --treetagger
On peut mixer les options à forme longues et courtes dans la même commande. Ici on demande
au programme de générer de surcroît des fichiers XML dont le contenus provint de TreeTagger.