Présentation de l'atelier
La plateforme NooJ est un environnement de développement permettant à ses utilisateurs de construire, d'adapter, de maintenir et de partager des ressources linguistiques à large couverture sous la forme de dictionnaires et de grammaires électroniques, puis d'appliquer automatiquement ces ressources à des textes pour y retrouver des informations, les analyser, les annoter, les extraire, etc. Le moteur de NooJ est utilisé dans de nombreuses applications de Traitement Automatique des Langues et des Humanités Numériques, et il existe des ressources linguistiques au format NooJ pour une trentaine de langues.
Programme de l'intervention
L'objectif de l'atelier est de permettre aux participants de maîtriser les fonctionnalités automatiques de recherche d'information et d'annotation de textes du logiciel NooJ.
- Manipuler et importer des textes et corpus
- Appliquer des requêtes simples sous forme d'expressions régulières
- Concordance et analyses statistiques
- Appliquer des requêtes plus puissantes sous forme de grammaires
- Annoter un texte automatiquement
- Exporter un texte annoté au format XML
- Poster