MTI830 - Forage de textes et de données audiovisuelles
Au terme de ce cours, l’étudiante ou l’étudiant sera en mesure :
- d’expliquer le fonctionnement des techniques de forage de textes et de données audiovisuelles;
- de choisir une approche de forage en fonction des besoins de l’application;
- d’évaluer les approches de techniques de forage.
Introduction à la théorie et aux techniques de forage de textes et de données audiovisuelles. Systèmes de recherche d'information textuelle et de documents audiovisuels; indexation efficace de texte et de documents audiovisuels; espace vectoriel booléen, modèles probabilistes de requête. Documents structurés et non structurés. Taille et diversité des corpus. Discussion sur les métriques d’évaluation et survol des techniques d’agrégation et de classification. Indexation sémantique latente. Évaluation des performances. Visualisation des résultats. Traitement automatique du langage naturel.