Git --projet-boite-à-outils

Code final de la boîte 1

Utilisation du programme

Si vous souhaitez lire le code du programme et l'exécuter sans rentrer dans les détails de sa création, vous voici sur la bonne page.

Obtenir tous les fichiers du projet

git clone https://github.com/titanix/projet_bao.git

Arguments du programme

Forme longueForme courteUtilité
--input_dir=-iRépertoire contenant les fichiers RSS à traiter
--output_dir=-oDossier où seront écrits les fichiers résultats
--xml-xUtilise une procédure d'extraction basée sur une bibliothèque XML plutôt que l'extraction par défaut.
--treetagger-tGénérer en plus des fichiers XML obtenus avec TreeTagger (bao2)
--proc=N-pUtilise le code parallèle avec au plus N processus concurrents
--verbose-vAffiche des informations détaillées durant l'exécution (non implémenté)
--help-hAffiche le message d'aide et quitte le programme
Attention
L'argument -p est obsolète. En outre, il semblerait que l'option -x conduise à la génération de fichiers ayant des problèmes d'encodage.

Exemples

Commande minimale
parcours.pl -i=2008

Exécute un traitement séquentiel, basé sur l'extraction de chaîne de caractères, sur le répertoire 2008 et écrits les fichiers de résultat dans le répertoire courant.

Commande avec dossier de sortie, avec extraction basée sur XML
parcours.pl --input_dir=2013 --output_dir=results --xml

Exécute un traitement séquentiel des fichiers présents dans le dossier 2013, basé sur l'extraction de chaîne XML, et génère les fichiers de sorties dans le répertoire nommé results.

Commande précédente, forme courte
parcours.pl -i=2013 -o=results -x

On voit qu'il est possible d'écrire les commandes de manière sensiblement plus courte grâce à la bibliothèque long_ops.

Commande mixant forme longue et courte
parcours.pl -input_dir=2013 -o=results -x --treetagger

On peut mixer les options à forme longues et courtes dans la même commande. Ici on demande au programme de générer de surcroît des fichiers XML dont le contenus provint de TreeTagger.