Cette dernière partie présente le programme réalisé en cours L6T54.
Nous avons programmé à partir d'une architecture de base un programme
permettant de charger fichiers texte ou URL afin d'en faire une analyse
de base en termes de fréquences des mots, formes de mots, concordances,
annotations syntaxiques et extractions de patrons.
En voici une présentation succinte à l'aide de captures d'écran, je
n'ai malheureusement pas pu illustrer la fonction concernant l'annotation
syntaxique et l'extraction patron pour un problème de compatibilité
que je n'ai pas réussi à résoudre à temps.
-
On peut ici constater l'allure générale du programme, les différents
onglets attestent des tâches réalisables.
-
Voici comment charger un URL (il est également possible de charger
un texte en entrant son emplacement ou en passant par le raccourcie
FILE). Le text obtenu n'est pas utilisable tel quel, un traitemnt
de nettoyage est nécessaire au préalable.
-
Voici le texte après nettoyage.
-
Après obtention du texte l'onglet dictionnaire nous permet de constater
les formes de mots présentes et leur fréquence. Pour obtenir les concordances
d'un mot, il faut en séléctionner un et ensuite cliquer sur le bouton
``concordance''.
-
Voici ce que l'on obtient ensuite, le mot sélectionné est ``et''.
Concordance nous renseigne sur l'environnement contextuel du mot,
c'est à dire que l'on obtient un contexte droit et un contexte gauche
pour chaque occurence du mot sélectionné.
-
Cet onglet très pratique nous permet d'avoir basiquement quelques
petites stats sur le fichier étudié, cela permet de tirer des conclusions
en fonction de ces résultats.
Beliao julie
2010-06-07