Conclusions.tex
9.27 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
\chapter{Conclusions et Perspectives}
\section{Conclusion générale}
Nous avons vu dans l'état de l'art et aussi avec l'expérimentation que nous avons mené dans une école maternelle pour l'apprentissage de l'anglais en utilisant AI-VT que les environnements informatiques pour l'apprentissage humain (EIAH) doivent trouver des stratégies adaptées afin d'exploiter et d'analyser toute l'information récoltée sur l'évolution de l'apprenant et ses éventuelles lacunes. L'intégration d'un système de recommandation en temps réel proposant des alternatives de parcours dynamiques et variées aux apprenants présente donc de nombreux avantages.
Nous avons montré dans ces travaux de quelle manière les outils d'IA et d'apprentissage automatique peuvent répondre à cette problématique. Ils permettent en effet de travailler avec des données structurées selon un contexte déterminé, d'explorer et d'exploiter les espaces où ces données sont définies, d'analyser et d'extraire l'information utile pour connaître les comportements, les tendances et les faiblesses des apprenants. Parmi tous les outils d'IA, nous nous sommes plus particulièrement tournés vers ceux dont le fonctionnement nécessite peu de données car ils permettent à des apprenants inconnus de l'EIAH de se voir proposer des adaptations en temps réel dès les premiers exercices.
L'EIAH AI-VT qui a servi d'environnement d'application et d'expérimentation à ces travaux est donc aujourd'hui capable de proposer des recommandations dynamiques et personnalisées en utilisant l'apprentissage par renforcement, la génération de solutions stochastique, le raisonnement Bayésien, les approches d'ensemble avec plusieurs algorithmes via deux empilements, l'optimisation stochastique itérative, l'intégration d'approches locales et collaboratives, le raisonnement à partir de cas avec les systèmes multi-agents et le processus de Hawkes.
Les jeux de données testés (réelles et générées) ont permis de tester la solidité du système, son amélioration progressive et l'unification de tous les algorithmes, outils et modules proposés. Deux métriques ont également été proposés afin de mieux mesurer le degré d'adaptabilité du système au regard de chaque apprenant, une métrique permet de mesurer la qualité de l'adaptation du système dans un parcours standard, où l'objectif de l'apprenant est de avancer dans l'acquisition de la connaissance et dans les niveaux de complexité, l'autre métrique prétend de mesurer aussi la qualité, mais dans le cas de un parcours de révision, où l'objectif de l'apprenant est de renforcer la connaissance dans chaque niveau de complexité avant de passer au niveau suivant.
La version finale du système AI-VT qui intègre tous les modules développés est capable de prendre en compte des aspects importants du processus d'apprentissage tels que le renforcement des connaissances, la dynamique de l'information, la variation de la progression, le temps d'apprentissage non-linéaire en étant capable de suivre un algorithme intégrant une courbe d'oubli.
Chaque module proposé s'est montré compétitif et a présenté des performances de qualités comparables à d'autres algorithmes et modules de référence dans le domaine de la régression et de la recommandation. L'architecture proposée permet de tirer partie des avantages de chacun de ces modules et ainsi d'améliorer globalement l'adaptation en cours de séance d'entraînement dans le système AI-VT en fonction des résultats partiels des apprenants.
Au regard des problématiques soulevées en introduction de ce manuscrit, voici les contributions apportées par ces travaux de recherche.
Une architecture modulaire capable d'associer plusieurs modules avec des fonctionnalités différentes qui permet d'ajouter nouvelles fonctionnalités sans affecter profondément le système et modifier les modules de manière indépendante. Les modules peuvent être réutilisés, aussi l'indépendance des modules réduit le risque de perturbation de l'ensemble du système augmentant la résilience.
Un algorithme de régression générique fondé sur le RàPC et l'empilement a été proposé comme un module de l'architecture pour l'utiliser comme filtre collaboratif dynamique dans la prédiction des notes des apprenants. Cette généricité donne à l'algorithme la flexibilité de s'adapter à différents structures et contextes des données, le aspect dynamique aide à obtenir des résultats avec des bases de données qui changent en temps d'exécution. Pour exploiter encore plus les capacités de l'algorithme, est implémentée l'intégration dans certaines étapes de l'algorithme un système multi-agent avec raisonnement bayésien ajoutant comme avantages les possibilités de rétroactions, d'échanges d'informations, l'émergence d'une intelligence collective et l'utilisation de raisonnements cognitifs.
Une autre module développé est la recommandation stochastique fondé sur un algorithme d'échantillonnage qui prend en compte les notes obtenues par l'apprenant pendant la séance, et ainsi de manière réactive propose des évolutions dans le niveau de complexité optimal en rapport avec les connaissances démontrés par l'apprenant. Les résultats montrent que globalement les recommandations sont pertinents et aussi varies dans le contenu. Les avantages de cet module sont : l'identification des lacunes pendant la séance et la flexibilité d'adaptation selon les besoins de chaque apprenant.
Étant donnée la généricité du module de régression fondé sur RàPC et sa propriété collaborative, une association avec l'échantillonnage stochastique est proposé pour avoir les points de vue global (filtre collaboratif) et local (information individuel de chaque apprenant) au moment de proposer une recommandation d'adaptation. Ce type d'association permet d'exploiter plus les données contenus dans le jeu de données et aussi de produire des recommandations optimales sans beaucoup d'information, même l'algorithme unifié peut travailler dans le cas du \textit{cold start} et s'adapter au fur et à mesure en réduisant la variance des recommandations.
Une limitation identifiée dans l'algorithme unifié est que avec l'évolution des distributions de probabilité du module de recommandation stochastique la convergence est statique, mais le processus d'apprentissage généralement n'est pas statique comme nous l'avons constate avec le jeu de données réel, l'expérimentation dans l'école et l'état de l'art qui parle d'un processus d'oubli, alors un mécanisme d'ajustement est nécessaire. Ici intervient le processus de Hawkes comme simulation d'une courbe d'oubli, qui facilite l'identification du changement de point de convergence. Ainsi, le système complet peut identifier les lacunes et aussi les éventuels changements dans le temps.
\section{Perspectives}
Différentes perspectives peuvent être envisagées. En particulier, l'intégration de résultats d'analyse vidéo et audio pourrait aider à mieux interpréter les émotions et comportements des apprenants dans la séance et ainsi leur proposer des recommandations encore plus pertinentes. Ajout d'un module de courbe d'oubli dynamique en suivant l'hypothèse de Ebbinghaus avec une méthode comme le système de Leitner.
Il pourrait également être intéressant de proposer différentes configurations pour le système de recommandation, en changeant les paramètres définis. Le point de départ pourrait consister à étudier la possibilité d'améliorer encore la fonction déterminant quelles sont les meilleures solutions proposées au second niveau d'empilement de l'outil d'ensemble (ESCBR-SMA). Peut-être intéressant aussi de pouvoir paramétrer cette fonction, qu'AI-VT en propose plusieurs et qu'elles soient dépendantes du profil de l'apprenant et des matières enseignées.
Développer des techniques pour extraire plus d'information sur le profil des apprenants et la dynamique de changement pour permettre au système de prévoir et anticiper les objectifs, acquisitions et expectatives. Aussi explorer la possibilité du travail en groupe ou coopératif, ainsi somme les interactions entre les apprenants.
Les scénarios d'apprentissage testés dans ces travaux ont mis en lumière le fait qu'il existait des points de rupture. Il serait intéressant de les analyser afin de mieux les prédire. Ces travaux ont notamment proposé d'utiliser un échantillonnage de Thompson pour que les modifications des niveaux de complexité des exercices proposés par le système soient progressifs. Cet outil est fondé sur une distribution de probabilité. Il pourrait donc être envisagé de tester d'autres familles de distributions de probabilité et de calculer de manière dynamique les taux corrélés d'actualisation des distributions de probabilité pour chaque niveau de complexité.
Une autre piste de travail est la correction automatique. Cet aspect n'est pas encore proposé dans AI-VT. Il pourrait l'être en considérant des algorithmes ou modèles intégrant des gabarits ou même des cartographies d'erreurs ou de réponses incorrectes à la base de données de l'EIAH.
Pour finir, il pourrait être intéressant de définir des intervalles pour chaque paramètre et exécuter un analyse de sensibilité pour évaluer les résultats avec l'objectif d'estimer la stabilité du système et les limites numériques.