Conclusions.tex 8.8 KB
\chapter{Conclusions et Perspectives}

\section{Conclusion générale}

Les travaux cités dans l'état de l'art, les résultats et l'expérimentation que nous avons menés dans une école maternelle pour l'apprentissage de l'anglais en utilisant AI-VT ont montré que les environnements informatiques pour l'apprentissage humain (EIAH) doivent trouver des stratégies adaptées afin d'exploiter et d'analyser toute l'information récoltée sur l'évolution de l'apprenant et ses éventuelles lacunes. L'intégration d'un système de recommandation en temps réel proposant des alternatives de parcours dynamiques et variées aux apprenants a pour but de répondre à ce besoin particulier.

Nous avons montré dans nos travaux de quelle manière les outils d'IA et d'apprentissage automatique peuvent répondre à cette problématique. Ils permettent en effet de travailler avec des données structurées selon un contexte déterminé, d'explorer et d'exploiter les espaces où ces données sont définies, d'analyser et d'extraire l'information utile pour connaître les comportements, les acquis et les faiblesses des apprenants. Parmi tous les outils d'IA, nous nous sommes plus particulièrement tournés vers ceux dont le fonctionnement nécessite peu de données car ils permettent à des apprenants sans profil pré-établi de se voir proposer des adaptations en temps réel dès les premiers exercices. 

AI-VT est donc aujourd'hui capable de proposer des recommandations dynamiques et personnalisées en utilisant l'apprentissage par renforcement, la génération de solutions stochastiques, le raisonnement bayésien, les approches d'ensemble avec plusieurs algorithmes via deux empilements, l'optimisation stochastique itérative, l'intégration d'approches locales et collaboratives, le raisonnement à partir de cas avec les systèmes multi-agents et le processus de Hawkes.

Les jeux de données testés (données réelles et générées) ont permis de tester la solidité du système, son amélioration progressive et l'unification de tous les algorithmes, outils et modules proposées. Deux métriques ont également été proposés afin de mieux mesurer le degré d'adaptabilité du système au regard de chaque apprenant. La première métrique permet de mesurer la qualité de l'adaptation du système dans un parcours standard, où l'objectif de l'apprenant est d'avancer dans l'acquisition de la connaissance et dans les niveaux de complexité. La seconde métrique est plus spécifique à la révision où l'objectif de l'apprenant est de renforcer la connaissance dans chaque niveau de complexité avant de passer au niveau suivant.

La version finale du système AI-VT qui intègre tous les modules développés, est capable de prendre en compte des aspects importants du processus d'apprentissage tels que le renforcement des connaissances, la dynamique de l'information, la variation de la progression, le temps d'apprentissage non-linéaire suivant un algorithme intégrant une courbe d'oubli.

Chaque module proposé s'est montré compétitif et a présenté des performances de qualités comparables à d'autres algorithmes et modules de référence dans le domaine de la régression et de la recommandation. L'architecture proposée permet de tirer partie des avantages de chacun de ces modules et ainsi d'améliorer globalement l'adaptation en cours de séance d'entraînement dans le système AI-VT en fonction des résultats partiels des apprenants.

Au regard des problématiques soulevées en introduction de ce manuscrit, voici les contributions apportées par ces travaux de recherche.

Une architecture modulaire capable d'associer plusieurs modules avec des fonctionnalités différentes permet d'ajouter de nouvelles fonctionnalités et de modifier les modules de manière indépendante sans affecter profondément le système. Les modules peuvent être réutilisés et leur indépendance réduit le risque de perturbation de l'ensemble du système tout en augmentant sa résilience.

Un algorithme de régression générique, nommé ESCBR et fondé sur le RàPC et l'empilement, a été proposé comme filtre collaboratif dynamique pour la prédiction des notes des apprenants. Cette généricité donne à l'algorithme la flexibilité de s'adapter à différents structures et contextes des données. Cette contribution illustre la manière dont peut être automatisée la phase de révision du cycle classique suivi par le système de RàPC initial d'AI-VT.

Le module nommé ESCBR-SMA fondé sur le module précédent est un système multi-agent suivant un raisonnement bayésien incluant des rétroactions, des échanges d'informations, l'émergence d'une intelligence collective et l'utilisation de raisonnements cognitifs.

Un module de recommandation stochastique, nommé TS, fondé sur un algorithme d'échantillonnage a également été conçu et implémenté dans AI-VT. Celui-ci prend en compte les notes obtenues par l'apprenant pendant la séance, et ainsi de manière réactive, propose des évolutions vers le niveau de complexité optimal au regard des connaissances démontrées par l'apprenant. Les résultats montrent que globalement les recommandations sont pertinentes et variées.

Une association d'ESCBR-SMA à l'échantillonnage stochastique de Thompson est proposé pour qu'AI-VT puisse tenir compte de considérations globales (filtre collaboratif) et locales (information individuelle propre à chaque apprenant) au moment de proposer une recommandation. Ce module est capable de produire des recommandations optimales même avec peu d'information et ainsi démarrer à froid (\textit{cold start}) tout en s'adaptant au fur et à mesure en réduisant la variance des recommandations.

Toutefois, l'évolution des distributions de probabilité sur lesquelles est fondé ce module de recommandation stochastique est statique. Ceci constitue une limitation du module dans la mesure où le processus d'apprentissage n'est généralement pas statique. Ceci a été confirmé par les tests menés sur un jeu de données réel et lors de l'expérimentation que nous avons menée dans l'école maternelle. La littérature du domaine fait état d'un processus d'oubli et de la nécessité de mettre en place un mécanisme d'ajustement. En réponse, le processus de Hawkes permet de simuler une courbe d'oubli qui facilite l'identification du changement de point de convergence. Ainsi, le système complet peut identifier les lacunes et aussi les éventuels changements dans le temps.

\section{Perspectives}

Différentes évolutions peuvent être envisagées. En particulier, l'intégration de résultats d'analyse vidéo et audio pourrait aider à mieux interpréter les émotions et comportements des apprenants dans la séance et ainsi leur proposer des recommandations encore plus pertinentes. Il serait envisageable d'ajouter un module incluant une courbe d'oubli dynamique en suivant l'hypothèse d'Ebbinghaus \cite{CHEN2025104070} avec une méthode telle que celle proposée dans le système de Leitner \cite{busch2023teaching}.

Il pourrait également être intéressant de proposer différentes configurations pour le système de recommandation, en changeant les paramètres définis. Le point de départ pourrait consister à étudier la possibilité d'améliorer encore la fonction déterminant quelles sont les meilleures solutions proposées au second niveau d'empilement de l'outil d'ensemble (ESCBR-SMA). Il pourrait être intéressant de pouvoir paramétrer cette fonction, qu'AI-VT en propose plusieurs et qu'elles soient dépendantes du profil de l'apprenant et des matières enseignées.

Le développement de techniques pour extraire plus d'information sur le profil des apprenants et la dynamique de changement permettrait également au système de prévoir et d'anticiper les objectifs, les acquis et les attentes. En particulier, développer l'interactivité entre les apprenants est une possibilité à envisager.

Les scénarios d'apprentissage testés dans ces travaux ont mis en lumière le fait qu'il existait des points de rupture. Il serait intéressant de les analyser afin de mieux les prédire. Ces travaux ont notamment proposé d'utiliser un échantillonnage de Thompson pour que les modifications des niveaux de complexité des exercices proposés par le système soient progressifs. Cet outil est fondé sur une distribution de probabilité. Il pourrait donc être envisagé de tester d'autres familles de distributions de probabilité et de calculer de manière dynamique les taux corrélés d'actualisation des distributions de probabilité pour chaque niveau de complexité.

Une autre piste de travail est la correction automatique incluant la notation des exercices. Cet aspect n'est pas encore proposé dans AI-VT. Il pourrait l'être en considérant des algorithmes ou modèles intégrant des gabarits ou même des cartographies d'erreurs ou de réponses incorrectes à la base de données de l'EIAH.