Le projet Mozart est une recherche interdisciplinaire menée conjointement par des spécialistes de l’autisme et des chercheurs en informatique. Il est dirigé par Laurent Mottron, psychiatre et chercheur de renommée internationale au Département de psychiatrie de l’Université de Montréal, en collaboration avec Sylvie Ratté, professeure-chercheuse au Département de génie logiciel et des technologies de l’information à l’ÉTS.
Ce projet part d’un constat fondamental : l’être humain est naturellement « câblé » pour apprendre une langue. Chez les enfants neurotypiques, cet apprentissage se fait principalement par l’imitation des parents et les interactions sociales. Or, chez de nombreux enfants autistes non verbaux, le chemin vers le langage est différent.
YouTube comme porte d’entrée vers le langage
Les travaux de Laurent Mottron et de ses étudiants David Gagnon et Alexia Ostrolenk ont mis en évidence un phénomène marquant : les enfants autistes non verbaux acquièrent spontanément des éléments de langage à partir de vidéos en ligne, notamment sur YouTube. En effet, les chercheurs et chercheuses ont constaté que certains enfants faisaient usage de mots ou d’expressions qui ne provenaient pas de la langue parlée à la maison.
Ces enfants montrent un attrait particulier pour des vidéos de type dessins animés, souvent centrées sur des lettres, des chiffres, des véhicules, des animaux ou des formes géométriques, fréquemment accompagnées de sons et de chansonnettes. Certains évoluent progressivement – mais pas de manière constante – vers des contenus linguistiques plus complexes : sons combinés, mots, phrases, puis séquences structurées.
Cette observation a mené à une question clé : peut-on exploiter ces intérêts spontanés pour soutenir l’émergence du langage oral, plutôt que de laisser l’algorithme de YouTube guider seul les recommandations?
Miser sur les centres d’intérêt des enfants
L’idée centrale du projet Mozart est d’intervenir indirectement sur les recommandations vidéo afin de favoriser l’apprentissage du langage naturel, dans la langue parlée par les parents. Par exemple, si un enfant manifeste un intérêt marqué pour les voitures (son centre d’intérêt capital) pourrait-on lui proposer des vidéos mettant en scène des voitures, mais intégrant progressivement des chiffres, des lettres ou des mots?
L’objectif n’est évidemment pas de rendre les enfants dépendants de YouTube, mais plutôt d’exploiter leur intérêt naturel pour les contenus numériques afin de les amener doucement vers une communication verbale.
Les enfants prenant part au projet disposent chacun d’une tablette identique, dans un environnement numérique très restreint : seule l’application YouTube est accessible, via un compte premium familial dont le contenu est déjà filtré. Les enfants utilisent la tablette environ une heure par jour, et les parents sont accompagnés pour gérer les réactions ou les crises éventuelles.
Le rôle clé de l’informatique
C’est ici qu’intervient l’expertise de Sylvie Ratté et de son équipe, Roya Moeini et Alain Kiemde, tous deux aux études doctorales. Sur le plan technique, le projet fait face à plusieurs défis majeurs. D’abord, YouTube ne donne aucun accès direct à sa liste de recommandations. Il est donc impossible de la modifier de façon classique.
Plutôt que de recréer un environnement semblable à YouTube, une tâche titanesque, l’équipe de recherche a donc opté pour une approche détournée. Comme c’est elle qui gère les comptes YouTube des enfants, elle a choisi d’influencer les recommandations en visionnant certains types de vidéos ciblées, afin de « nourrir » l’algorithme.
Comprendre la similarité entre les vidéos
Un autre défi important concerne la notion de similarité entre les vidéos, un concept particulièrement complexe en informatique. Une vidéo peut être analysée selon de multiples dimensions : le son, la narration, les objets présents à l’écran, les couleurs, les personnages, le rythme, etc. Or, les enfants observés savent très précisément ce qu’ils aiment et cliquent de manière intentionnelle sur les contenus qui les attirent.
L’équipe de recherche travaille donc à la collecte automatique des listes d’écoute, puis à leur analyse à l’aide d’algorithmes d’intelligence artificielle. Les premières analyses reposent sur des éléments comme les catégories YouTube, les titres et les mots-dièse. À cela s’ajoutent progressivement des données multimodales : transcriptions audio, informations visuelles (formes, couleurs, objets), ainsi que des caractéristiques sonores.
En parallèle, le comportement à l’écran est aussi analysé : clics, défilement, avance rapide, navigation dans la liste de recommandations. Pour certains enfants, l’analyse se concentre principalement sur le son, puisque l’enfant continue parfois à explorer les recommandations tout en écoutant la vidéo en arrière-plan.
Vers un outil pour les équipes cliniques et les familles
En croisant les caractéristiques des vidéos avec les comportements observés à l’écran, l’équipe de recherche vise à identifier des schémas d’attention propres à chaque enfant. Les résultats préliminaires montrent que l’approche permet déjà de caractériser efficacement le contenu des dessins animés et de révéler des préférences distinctes pour certains éléments visuels, textuels ou sonores.
À long terme, le projet Mozart vise à développer un outil de suivi destiné aux cliniciens et cliniciennes, afin de mieux documenter l’évolution des apprentissages linguistiques, ainsi qu’un outil pour les parents, leur permettant de comprendre et de suivre les intérêts de leur enfant, tout en respectant strictement la confidentialité des données.
Cette recherche pourrait également influencer les équipes de création de contenu en les aidant à concevoir des vidéos mieux adaptées aux besoins et aux intérêts des enfants autistes non verbaux.
En résumé, le projet Mozart explore une question essentielle : est-il possible de concevoir un système de recommandation qui guide doucement les enfants vers le langage, plutôt que de les cantonner dans la spirale algorithmique de YouTube? Les travaux en cours suggèrent que la réponse pourrait bien être oui.