IND540 - Introduction à l’analyse des mégadonnées
Ce cours vise à analyser des mégadonnées dans le but de découvrir des informations pour prendre des décisions éclairées.
Au terme de ce cours, l’étudiante ou l’étudiant sera en mesure de : expliquer la nature des systèmes d’analyse de données ; utiliser les outils appropriés ; représenter des documents analytiques en combinant des techniques de narration, de codification et graphiques ; modéliser les problèmes de la science des données à grande échelle.
Applications du domaine des mégadonnées pour des traitements analytiques. Mise en place d’un environnement de développement adapté. Enjeux de l’extraction, de la transformation et du chargement de données massives. Théorie et application de patrons algorithmiques appliqués aux grappes de calculs utilisant un moteur d’analyse des mégadonnées. Concepts de compression de données traitées dans des ensembles de données distribuées résilientes (RDD), des Dataframes, des filtres et de la programmation parallèle.