Les technologies numériques au service des apprentissages

Les technologies numériques au service des apprentissages

 

Introduction

Les technologies numériques ont bouleversé notre environnement informationnel d’une manière spectaculaire au cours de ces 40 dernières années : de très nombreux aspects de notre vie quotidienne ont été profondément modifiés par le développement de ces technologies, jusqu’au temps que nous passons à lire, qui a été multiplié par deux ou trois pendant cette période (White et al., 2010). Dans le domaine des apprentissages scolaires, les effets du numériques sont particuliers : ils ne sont pas aussi massifs que dans d’autres domaines, malgré des politiques d’équipement volontaristes ici et là. Les enseignants n’utilisent pas tous le numérique en classe alors que (presque) tous l’utilisent chez eux, notamment pour préparer leur enseignement. Les résultats empiriques sont nuancés : parfois les nouvelles technologies améliorent les apprentissages, parfois elles les détériorent. L’objectif est de faire une rapide synthèse de ce que change le numérique dans les apprentissages. Notre approche est centrée sur les processus cognitifs impliqués dans l’utilisation de ces supports et dans les apprentissages mis en œuvre avec ceux-ci.
 
Dans une première partie, nous traitons de la recherche d’information. La facilité apparente avec laquelle les élèves utilisent les outils comme Google et Wikipédia masque souvent l’exigence de cette activité. Nous décrivons les processus cognitifs impliqués dans la définition du but informationnel, la formulation d’une requête, l’évaluation de la pertinence et de la qualité des sources, les contraintes qui pèsent sur la mise en œuvre de ces processus et les difficultés les plus fréquemment rencontrées par les élèves.
Dans une seconde partie, nous abordons le traitement de l’information présentée à l’écran, en nous focalisant sur les processus perceptifs et attentionnels. Nous analysons les particularités liées aux documents multimédias utilisés massivement et qui incluent des images, des vidéos et des animations virtuelles, ainsi que des commentaires audio dynamiques et interactifs. Contrairement aux documents traditionnels écrits de type texte, la perception joue un rôle déterminant sur les processus attentionnels mis en œuvre pour comprendre le contenu du document. La compréhension peut d’abord être influencée par la saillance perceptive des éléments contenus dans les images statiques ou dynamiques du document.
Les processus de compréhension proprement dits seront l’objet de la dernière partie. 
 

Rechercher l’information : définir un but et sélectionner

Les technologies de l’information permettent actuellement aux élèves d’accéder à des documents d’une façon qui est extrêmement plus rapide et apparemment beaucoup plus facile qu’il y a 30 ou 40 ans. En quelques secondes ils peuvent trouver un article très approfondi sur la théorie de l’évolution, mais ils peuvent aussi tomber sur autre qui présente les pires bêtises sur cette même théorie. Ils peuvent aussi ne pas trouver ce qu’ils cherchent, trouver ce qu’ils ne cherchent pas, croire qu’ils ont trouvé ce qu’ils cherchent alors qu’ils ont trouvé autre chose, ne pas savoir ce qu’ils cherchent, ne pas savoir comment le chercher et même ne pas se rendre compte qu’ils ont trouvé ce qu’ils cherchaient (!). L’activité de recherche d’information est l’objet de nombreux travaux depuis une trentaine d’années, qui fournissent un tableau assez détaillé des difficultés et des facilités des élèves dans le domaine. 
 

Définir un but

Les humains en général et les élèves en particulier se trouvent parfois dans des situations où, ayant un but à atteindre, ils ne savent pas comment l’atteindre. Atteindre ce but implique notamment de comprendre certains aspects de la situation et d’avoir des pistes pour l’action. Le déficit de connaissance peut ne pas être conscient. Si l’individu ne prend pas conscience de son déficit de connaissance, il ne transformera pas ce déficit en besoin. Par exemple, un adolescent de 15 ans qui ne connaît pas le théorème de Thales peut parfaitement vivre cet état de connaissance comme satisfaisant. Son professeur de mathématiques peut, de l’extérieur, juger qu’au contraire, ce déficit correspond à un besoin de connaissance. Le théorème de Thales correspond à un besoin si et seulement si (a) un individu qui ne connaît pas le théorème (b) se trouve dans une situation où il doit atteindre un but qui ne peut être atteint sans le théorème (c) cet individu est conscient de cette lacune dans cette situation.
Pour faire face à un déficit de connaissances conscient dans une situation, les humains ont plusieurs grandes catégories de solutions (Tricot & Comtat, 2012) :
  • Ils peuvent agir dans la situation pour tenter d’atteindre le but par essais et erreurs, en interprétant les effets de leurs actions sur les éléments et les relations, faire des inférences sur les éléments de la situation et leurs relations, raisonner, pour se rapprocher progressivement du but. C’est l’activité de résolution de problème.
  • Ils peuvent solliciter un autre humain qui possède déjà la connaissance manquante, ou une partie de celle-ci, lui demander s’il a cette connaissance (lui demander de l’aide, des explications, l’action à réaliser, etc.). C’est l’activité de dialogue.
  • Ils peuvent rechercher dans un document ou un système de documents pour voir si la connaissance manquante, ou une partie de celle-ci, existe quelque part. C’est l’activité de recherche d’information.
La recherche d’information est donc une solution parmi d’autres au déficit conscient de connaissance. Cette recherche a lieu quand la personne estime que pour combler ce manque de connaissance il faut le transformer en but informationnel : ce qui va combler le manque de connaissance est une information qui se trouve dans un document. 
 
Un but d’information contient le plus souvent une représentation du « quoi » (quel est le contenu recherché ?), du « comment » (comment cette information va être trouvée ?) et du « où » (dans quel système ? avec quel moteur de recherche ?).
Elaborer un but informationnel est donc une activité complexe qui consiste (a) à prendre conscience d’une lacune, (b) à décider que cette lacune peut être comblée par une information et enfin (c) à se représenter ce qu’on le va chercher, comment et où. Cette activité est tellement exigeante que parfois un enseignant décide de définir le but informationnel à la place de l’élève. Les difficultés que va rencontrer l’élève sont alors de nature différente.
 

Formuler une requête

La plupart des systèmes documentaires existants traitent des mots (même ceux qui stockent des images traitent des mots, qui indexent les images : on ne peut pas chercher une image à partir d’une image mais à partir des mots qui décrivent celle-ci). Pour interagir avec ces systèmes il faut donc que l’élève transforme le but informationnel en mots. Puis il va falloir utiliser ces mots pour former une requête. Cette activité est elle aussi très exigeante au plan cognitif : de nombreuses études soulignent les difficultés rencontrées par les élèves (et par les adultes) dans ce domaine (voir les synthèses de Boubée et Tricot, 2010 et 2011).
 
En effet, les travaux de recherche montrent que la formulation d’une requête repose sur une triple expertise :
  • l’expertise du domaine, qui permet de trouver les mots adéquats pour désigner ce que l’on cherche ;
  • l’expertise informationnelle qui permet de décider comment et où on va chercher ;
  • des traitements métacognitifs qui permettent d’évaluer que les résultats décevants proviennent d’une requête non adéquate, puis de reformuler celle-ci (parfois une quatrième expertise est mise en avant, la connaissance du système particulier sur lequel va avoir lieu la recherche, mais il n’est pas certain que cette expertise soit tellement importante aujourd’hui tellement les outils généralistes s’imposent partout et tout le temps).
 
Les élèves peuvent avoir une expertise assez limitée dans chacun des trois domaines, ce qui expliquerait le fait qu’ils rencontrent souvent des difficultés à trouver les mots adéquats, à formuler et reformuler leur requête, à identifier les environnements pertinents pour faire cette recherche. Il semble difficile aujourd’hui de distinguer les difficultés des élèves des difficultés des novices en général : les difficultés d’adultes novices ressemblent fortement à celles d’élèves aussi novices qu’eux.
Les principales difficultés relevées dans la littérature sont classiquement : 
  •  la faible planification : les élèves se lancent rapidement dans la recherche, ils consacrent peu de temps à réfléchir à leur requête et plus généralement à leur stratégie ;
  •  la dépendance à la consigne : les élèves ont tendance à « plaquer » les mots de la question posée par l’enseignant, à utiliser cette question comme requête, parfois littéralement ;
  •  les difficultés de nature linguistique : les élèves peuvent rencontrer des problèmes orthographiques, lexicaux ou sémantiques. Ils utilisent volontiers des éléments du langage naturel, des termes « larges » et parfois des requêtes à un seul terme ;
  •  les difficultés logiques : de nombreux élèves sont peu à l’aise avec la syntaxe booléenne, ils n’utilisent pas les opérateurs booléens et quant ils le font, ils confondent les opérateurs ET et OU ;
  •  les difficultés stratégiques : il n’est pas rare en cas d’échec que les élèves soumettent la même requête ou au contraire qu’ils changent tous les mots de leur requête.
 
Les travaux de recherche qui mettent en exergue les difficultés des élèves dans ce domaine sont tellement nombreux qu’on se demande parfois comment il est possible de leur demander de formuler une requête. Et pourtant ils trouvent !, comme le montre si bien Nicole Boubée dans sa thèse (Boubée, 2007). 
 
La recherche d’information, contrairement à la résolution de problème, est une activité dans laquelle on obtient toujours un résultat, jamais parfait, toujours plus ou moins imparfait. La façon dont les chercheurs ont étudié cette activité est peut-être passée à côté de cet aspect crucial pendant de longues années, jugeant trop souvent de façon binaire la réussite ou l’échec d’une recherche d’information.
 
Les difficultés et les facilités des élèves dans le domaine semblent en partie différentes de celles identifiées il y a 10, 20 ou 30 ans : l’activité de recherche d’information, notamment celle avec les moteurs de recherche et la consultation d’encyclopédies en ligne, est devenue une activité quotidienne (Sahut, 2015), cette fréquence entrainant peut-être une augmentation de l’expertise, en tout cas d’une partie de celle-ci. Par exemple, il y a 20 ans, de très nombreuses études montraient que les adolescents préféraient naviguer que (re)formuler des requêtes : 10 ans après ce n’était plus le cas (Boubée, 2008).
 

Evaluer la pertinence

Quand l’élève se trouve face à une liste de résultats, il faut qu’il ou elle évalue la pertinence de chacun de ces résultats pour décider lequel il ou elle va sélectionner ou lire en premier. Cette activité d’évaluation de la pertinence est elle-aussi souvent exigeante : il s’agit d’évaluer, à partir d’un titre par exemple, quel document va le mieux combler le manque de connaissance, donc à la fois : maintenir en mémoire de travail une représentation suffisamment précise du but informationnel ; comprendre le titre et inférer correctement le contenu du document à partir de ce titre ; comparer les deux, i.e. la représentation du but et la représentation du contenu. Cette évaluation est paradoxale : seuls les experts du domaine évaluent de façon juste cette adéquation but / contenu ; or quand on recherche de l’information c’est parce qu’on manque de connaissance, donc que l’on est (relativement) novice.
 
Les recherches dans le domaine de l’évaluation de la pertinence par des élèves montrent principalement (cf. Boubée & Tricot, 2011 pour une synthèse) : 
  • que le temps passé à l’évaluation de la pertinence est souvent très limité, rarement plus de quelques dizaines de secondes sont consacrées à l’examen d’une page de résultats ;
  • que les élèves les plus jeunes peuvent s’appuyer sur des indices non pertinents (mise en majuscules, en gras de certains mots, ambiguïté quant au statut des mots qui suivent le titre du document) pour évaluer la pertinence d’un document ;
  • comme les adultes, ils oscillent entre l’évaluation de la pertinence centrée sur le comblement du manque de connaissance et l’évaluation de la pertinence centrée sur la « topicalité », i.e. l’adéquation au thème de la recherche ;
  • la pertinence peut changer au cours de la recherche d’information, parfois parce que le but évolue (vers plus de précision, vers une autre direction, plus intéressante), mais aussi parfois parce qu’on a oublié notre but ;
  • l’évaluation de la pertinence est souvent associée à l’évaluation d’autres qualités du document ou d’information (par exemple : nouveauté, intérêt, avis d’autrui, taille du document, présence d’images, accessibilité, facilité de compréhension).
 

Evaluer la qualité des sources

Le dernier aspect de la recherche d’information chez les élèves est peut être le plus préoccupant : les mutations extrêmement rapides des systèmes d’information font que l’environnement informationnel d’un enfant ou d’un adolescent aujourd’hui est bien celui où n’importe qui peut écrire n’importe quoi, le publier, le diffuser, bref, le rendre accessible à n’importe quel lecteur. Evaluer la qualité des sources est une activité essentielle du citoyen de cette société de l’information.
 
 

Conclusion: Gérer la recherche d'information

L'ensemble des difficultés de recherche de l'information précédemment examinées, mais aussi des potentialités nouvelles offertes par ces technologies convergent vers l'idée qu'il est essentiel d'aider les élèves à gérer l'activité de recherche d'information. Le guidage et l'accompagnement que peut proposer le maître ou l'enseignant est donc crucial.  Cela d'autant que la recherche et le traitement de l'information se poursuit lorsque l'élève arrive sur un site, un ensemble de pages ou même sur une page présentée à l'écran.
Contrairement aux documents traditionnels, l'écran ne présente pas majoritairement du texte écrit, mais également de l'information sous  d'autres modalités: sons, images, animations, vidéos, réalité virtuelle, texte parlé etc. Les processus fondamentaux initiaux de traitement cognitif de ces différentes modalités ne sont pas le mêmes. De plus, ces multiples modalités sont délivrées  simultanément, ce qui peut entrainer des difficultés sérieuses de partage de l'attention entre les sources multiples de l'information. Par ailleurs, des facilités interactives avec le logiciel ou la présentation à l'écran peuvent être ajoutées, sous la forme de feed-backs, de simulation de processus que l'élève peut contrôler lui même (par exemple simplement contrôler le défilement de l'animation avec quick-time).     
 
 

Traiter l’information présentée à l’écran : le rôle de la  perception, et de l’attention 

Les documents multimédias sont composés de textes, accompagnés d'images, de sons, d'animations, de vidéos, d'environnements ou d'objets virtuels. Les recherches sur les documents d’apprentissage ont longtemps été dominées par le texte. Pourtant, avec l'arrivée massive des technologies, des tablettes tactiles, la quantité de représentations graphiques (images statiques ou animées, schémas, graphiques, cartes, diagrammes techniques, vidéos, 2D et 3D) ne cesse de croître dans les documents. La recherche est moins avancée que celle portant sur l'apprentissage de l'écrit.
 
L’ensemble des travaux sur la compréhension et la « lecture » des documents numériques montrent que comprendre implique d’abord de percevoir, et de diriger son attention au bon endroit, au bon moment vers, l’information  pertinente en « inhibant » l’information présentée sur l’écran, mais qui est non pertinentes pour le  but de la tâche d’apprentissage à réaliser. Or, les documents multimedias, ne comportent pas que texte, avec une structure linéaire de mots spécifique au texte et qui contraint le processus de lecture, mais aussi beaucoup d’images, de schémas , statiques mais également dynamiques, comme les animations, la réalité virtuelleet les vidéos.  Comment ces images, avec une structure non linéaire contrairement au texte,  sont elles perçues et traitées cognitivement? Bref, qu'apprend-t-on et comment avec des images, des schémas, et plus généralement avec des représentations graphiques contenues dans les documents multimédias que le texte seul ne saurait transmettre? 
 

L’effet de  L’explosion » des images et des représentations graphiques dans les documents numériques : du statique au dynamique

Une récente analyse des formats utilisés dans les manuels scolaires de sciences de la fin d'école primaire  a montré que la grande majorité des pages de ces ouvrages contenaient des représentations graphiques variées: photographies, images réalistes, abstraites, schémas, graphiques, cartes géographiques, arborescences, arbres généalogiques, radiographies, etc. Ces représentations graphiques, souvent présentées par paires sur la même page, décrivent des connaissances variées: phénomènes naturels, cycles, mécanismes biologiques évolutifs, processus physiques et techniques. Peu d'entre elles semblent décoratives (voir exemples sur la Figure 1).
 
L'analyse a également montré que le contenu informationnel des textes qui accompagnent les images n'est pas toujours en cohérence avec les représentations graphiques. Enfin, ces représentations contiennent des conventions graphiques de toutes sortes, implicites (comme des flèches) qui ne sont pas toujours comprises par les élèves de 10-11 ans.
 
Figure 1. Graphiques statiques (paires) extraits de livres scolaires de sciences (cycle 3) 
     
 
Si l’usage des images augmente (en sciences et en formation professionnelle, images et graphiques techniques occupent une place cruciale), la conception des représentations graphiques à visée éducative repose plus sur l'intuition et des critères esthétiques, que sur des bases scientifiques. Pourtant de nombreuses recherches, chez l’adulte, ont montré leur rôle facilitateur dans la mémorisation et la compréhension de textes explicatifs ou procéduraux. Par ailleurs, l'aspect motivant des images pour l'apprentissage a été observé. 
Cependant, la compréhension d'une représentation graphique statique, accompagnée ou non de texte, ne consiste pas seulement à la création instantanée d'un cliché, "d'une copie", interne de l'image externe. Ce que l'on doit apprendre pour "lire" un graphique, qui dépeint par exemple un mécanisme technique, consiste à construire pas à pas une représentation mentale cohérente, appelée un modèle mental  du mécanisme en action (voir Figure 2). 
 
 
Figure 2. Les images "ne parlent pas d'elles mêmes" 
         
 
Cette construction implique d'élaborer
  • (i) une représentation interne de la configuration des composants du graphique (forme, relations spatiales);
  • (ii) l'apprenant doit ensuite inférer le comportement des composants (mouvement) puis
  • (iii) construire une représentation fonctionnelle et intégrée des relations entre les comportements de tous les composants du système. 

Cette activité de compréhension nécessite la mise en œuvre de ressources cognitives coûteuses. Le texte qui parfois accompagne le schéma peut constituer une aide pour l'apprentissage, à condition que le design du texte (structure, organisation spatiale, concepts, vocabulaire etc.) soit compatible avec l'organisation de la représentation graphique. De plus, le partage d'attention nécessaire à la compréhension des deux médias, texte et image, peut ajouter un coût cognitif supplémentaire. Une méthode récente pour faciliter l'apprentissage de processus dynamiques complexes a consisté à proposer à l'apprenant des animations (réalistes ou virtuelles) des événements qui constituent le phénomène (par exemple les étapes de l'apparition d'un volcan et de son irruption, le fonctionnement d’une pompe, d’un circuit de freinage, du cerveau, etc.). 

 

Apprendre avec des animations, des images virtuelles dynamique et des vidéos : des contraintes ou des bénéfices ? 

Selon Bétrancourt et collaborateurs, une animation se définit comme "une application (ou un procédé) qui génère une série d’images de telle manière que chaque image qui apparaît soit une altération de l’image qui la précède. La séquence des images (rythme, vitesse, ordre, nombre de visualisations) est déterminé soit par le concepteur soit par l’utilisateur" . Cette définition englobe toute une série de documents comme des graphiques animés, des animations virtuelles, 2D et 3D, ou des vidéos. Parce qu'elles montrent concrètement les changements temporels, les animations sont ainsi à même de décrire des phénomènes dynamiques explicitement, en particulier dans les domaines scientifiques et techniques, ou médicaux. La présupposition qui a guidé l'usage des animations était qu'elles devaient faciliter chez l’apprenant la compréhension des changements temporels des phénomènes complexes et qu'elles étaient motivantes. Pourtant, de nombreuses études  ont révélé que les animations n'étaient pas toujours plus efficaces qu'une série d'images statiques pour aider la compréhension. Pourquoi?
 
D’abord, parce que les contraintes perceptives et attentionnelles générées par ces supports d’apprentissage sont sont très fortes. Ces contraintes  entrainent fréquemment des difficultés cognitives majeures pour la compréhension des concepts délivrés au cours de la présentaiotn dynamique. 
 
  • (i) Les animations sont éphémères et rapides, chaque image est remplacée par une autre. Elles imposent à l’apprenant un coût cognitif, d'encodage, de stockage temporaire et d'intégration de l'information, plus élevé que les ressources de traitement dont il dispose en un temps restreint. Les animations sont difficilement  appréhendables, surtout si elles ne sont pas familières pour l'apprenant. Non seulement les images changent continuellement au cours du déroulement du processus dynamique, mais les objets ou les éléments qui constituent l’image se déplacent souvent simultanément sur l’écran. Cela entraîne la nécessité pour l’apprenant de partager son attention entre plusieurs sources d’informations et de segmenter le flux continu d'information nouvelles en événements significatifs et compréhensibles pour lui. Par exemple, il est très difficile de comprendre et d'expliquer le galop du cheval après avoir vue une vidéo réaliste des mouvements de ses membres inférieurs pendant le galop. Les peintres de la renaissance éprouvaient des difficultés à reproduire sans erreur le galop du cheval dans des tableaux figurant des cavaliers. Il a fallu attendre la photographie (longue séquence d'images statiques), pour mieux comprendre la complexité du galop.
  • (ii) Les contraintes liées aux processus perceptifs et à l'attention limitent la "profondeur" des apprentissages à partir de documents animés, comme des vidéos: les éléments saillants visuellement, et qui attirent d'abord l'attention,  sont perçus les premiers mais ils ne sont pas toujours les plus pertinents pour comprendre le contenu proposé (voir figure 3). L'effet de saillance perceptive joué par les composants des images peut être augmenté par plusieurs facteurs. Une couleur vive attire plus l'attention qu'une couleur plus neutre. La taille, un élément plus grand sera regardé plus tôt, et plus longtemps par l'apprenant qu'un élément plus petit. La position dans l'image: un élément central sera perçu plus rapidement qu'un élément plus périphérique. Le mouvement attire instantanément, l'attention de l'observateur, et son effet sur l'attention peut aussi être influencé par d'autres modalités de présentation comme la vitesse, l'amplitude etc.

    Ces effets de la perception se révèlent d'autant plus marqués que le contenu de  l'information présenté dans les documents est nouveau et non  familier pour l'élève et plus généralement que le niveau des connaissances préalables de l'élève sur le domaine étudié est faible. Par ailleurs, le but de la tâche donnée à l'élève influence également le processus d'exploration du document imagé.

    Lorsqu'il s'agit de vidéos ou bien d'images virtuelles (et éventuellement en 3D) le point de vue  de la caméra sur l'image par rapport à l'apprenant (par exemple, vue en face à face avec la scène, vue par dessus l'épaule de l'élève) influence la direction de l'attention et l'extraction des information pertinentes pour la tâche. Ces effets sont très bien connus des cinéastes.

    Enfin, les animations explicatives réalistes de processus et de phénomènes dynamiques contiennent de nombreux événements simultanés. La simultanéité implique un partage stratégique de l'attention, difficile et couteux pour les élèves qui ne disposent pas des connaissances préalables pour gérer de façon optimale ce partage stratégique.

    Malgré ces difficultés et ces limites, les animations se sont révélées plus bénéfiques que des images statiques pour présenter efficacement un processus dynamique, en particulier pour les apprenants qui ne disposent pas de connaissances préalables sur le contenu thématique de l'animation et/ou ayant des aptitudes spatiales faibles. C’est ce  qu’ont montré deux récentes méta-analyses (analyse quantitative synthétique d’un grand nombre d’études sur le même sujet) réalisée par Höffler et Leutner (2007) et Bétrancourt & Bernay (2014).

  • (iii) Comparativement au cas d’une animation dynamique, confronté à une série d'images statiques qui représentent les phases clés d'un processus dynamique, l’élève doit inférer les événements entre les étapes présentées alors que face à une animation, l'activité  consiste plutôt à suivre perceptivement le processus. Dans le premier cas, l’apprenant "simule mentalement" activement le processus. Dans le second, il visualise plus passivement l’animation. Il peut même avoir l’illusion de l’avoir "bien vue" et comprise. On pourrait en conclure que la profondeur de traitement cognitif des informations dynamiques impliquées par les inférences à réaliser dans le cas d'images statiques serait bien plus élevée que dans le cas d'animations seulement perçues. Cependant, simuler mentalement un processus dynamique à partir d’images statiques n’est possible que si l’apprenant est capable de réaliser cette simulation, c'est à dire s'il dispose des connaissances préalables sur le processus dynamique à apprendre, des ressources cognitives et des habiletés visuo-spatiales suffisantes. Ainsi, le traitement d'images dynamiques, pourrait à l'inverse avoir un effet compensateur (Boucheix & Schneider, 2009) et bénéfique, pour l'élève qui aurait des difficultés pour générer des inférences couteuses et posséderait de faibles habiletés spatiales.

    En résumé, les modalités de présentation réalistes des animations sont susceptibles de générer des difficultés perceptives, attentionnelles et cognitives. Les études des quinze dernières d'années se sont attachées à améliorer les conditions de présentation des animations.

Le partage de l'attention entre le (les) texte(s) et l'(les) image(s)dans les documents multimédias

Dans les plupart des documents numériques, un ou des textes explicatifs ou de type commentaires, accompagnent les animations et les images. Le traitement cognitif des deux modalités d'information nécessite un partage de l'attention entre les texte et l'image (qui si elle animée) peut se transformer au cours du temps (cf. figure 3)

Figure 3. Distribution des fixations oculaires entre le texte et l'image au cours de la lecture-compréhension d'un document  technique  par des adultes  (Tiré de Schneider & Boucheix, 2008).

La sélection, l'organisation et l'intégration cognitive des informations du texte et des images (Mayer, 2014) afin de construire une représentation mentale cohérente  de la signification du document se révèlent trés couteuse dans le cadre des limites de ressouces attentionnelle disponible en mémoire de travail (voir la partie compréhension ci-dessous).  

 

L'ergonomie des documents numériques: Améliorer la conception et la présentation des animations et des documents multimédia pour optimiser l'allocation des ressources perceptives et attentionnelles de l'élève

 Plusieurs catégories  d'amélioration de la présentation des animations multimédias ont été étudiées, chez l’adulte, mais aussi chez l’enfant scolarisé, avec leurs effets sur la compréhension: (i) Changer la modalité de présentation du texte qui accompagne l’animation: de la modalité ecrite à la modalité orale; (ii) donner un contrôle interactif à l'apprenant sur le déroulement de l'animation ou de la vidéo; (iii) attirer l'attention, « au bon moment, au bon endroit »; (c) segmenter l'animation. D’autres techniques ont donné lieu à quelques études: (d) la présentation d'animations simultanées, (e) le dessin. Récemment une approche différente des précédentes a été proposée fondée sur un modèle cognitif de la compréhension des animations. 
 

L’effet de modalité

 
Une animation est mieux traitée quand elle s’accompagne d’un texte présenté à l’oral (commentaire) plutôt que d’un texte écrit (Mayer, 2014), c'est l'effet de modalité..
 

L’effet de l’interactivité : chouette, c'est interactif! Donc c'est mieux?

Pour permettre au sujet de réguler son apprentissage en fonction du son propre rythme, il est possible d’intégrer à l’animation un dispositif de contrôle de la vitesse et de la direction du défilement des images. Les études ont montré que l'autocontrôle par l'apprenant sur l'animation n'entrainait pas de bénéfice d'apprentissage. Pour utiliser efficacement ce contrôle, l’apprenant doit avoir conscience de ses besoins en information, ce qui favorise ceux qui disposent de connaissances préalables sur le domaine. Au cours de l’interaction avec une animation, la dimension qui semble cruciale est de savoir quel est le bon point de vue pour étudier le processus décrit (quoi regarder, quand, dans quel but) plutôt que le niveau d’interactivité qui est donné à l’élève. C'est un facteur déterminant dans le cas des images en 3D. Enfin, le dispositif de contrôle (souris, boutons, tactile) peut représenter une tâche supplémentaire qui entre en compétition avec la tâche d’apprentissage. 
 

Attirer l’attention de l’élève: où regarder, quoi et quand? 

Du fait du caractère simultané de l’apparition des événements, l’apprenant doit partager son attention entre différentes localisations de l’animation pour détecter les informations pertinentes comme les composants et les trajectoires. Le partage de l’attention n’est pas seulement spatial mais également temporel. Selon les phases du déroulement du processus, un composant central pour la compréhension de la phase initiale d’un phénomène peut être secondaire lors des phases suivantes. Il s’ensuit une "compétition visuelle" pouvant générer une charge perceptive et cognitive importante. Chez les novices, les éléments perceptivement saillants de l’animation (en raison de leur taille, de leur proximité spatiale, des contrastes de vitesse) attirent l’attention au détriment des éléments moins saillants. Or, les événements les moins saillants perceptivement peuvent aussi être thématiquement importants pour la compréhension. C’est ce que nous avons montré dans une étude sur a compréhension du fonctionnement d’un système technique non familier, une touche de piano (voir Figure 3).
 
 
Les techniques de signalisation utilisent des flèches directionnelles, points et/ou contrastes de couleurs et/ou des consignes verbales. Une revue de question menée par De Koning et collaborateurs en 2010,  a montré que si la signalisation attirait efficacement l'attention de l'apprenant, les effets sur la compréhension étaient plus limités. En revanche, l'ajout des signaux dynamiques et non statiques semblait plus favorable pour la compréhension comme nous l'avons vérifié dans notre étude illustrée Figure 3. 
 

La segmentation et autres techniques pour optimiser l'allocation des ressources cognitives 

Spanjers, Van Gog et collaborateurs ont montré en 2010 que la segmentation de longues animations (accompagnées ou non de textes) en courtes sections (significatives) dont la taille est compatible avec les limites de traitement et de stockage de la mémoire de travail conduit à une augmentation des performances d'apprentissage comparativement à des animations non-segmentées. 
De plus, présenter simultanément de courts segments animés d'un processus temporel long permet à l'apprenant de faire des comparaisons entre les segments animés, ce qui est plus difficile lorsque l'animation est présentée séquentiellement. Les activités de comparaison renforcent l'élaboration de relations entre les étapes ou les paramètres d'un processus technique ou physique. Par exemple, dans le domaine de la voile, apprendre comment la direction du vent interagit avec la manipulation de la barre pour conserver le cap du bateau est facilité par des présentations simultanées de l'effet de ces paramètres. En revanche, faire dessiner aux élèves les étapes d'une animation, même pour de formes simples, pourrait avoir un effet négatif sur l'apprentissage. En effet, l'activité de dessin elle même tend à focaliser l'apprenant sur la qualité de la reproduction des formes des configurations dans leur dimension statique. Cette activité s'avère cognitivement couteuse en elle même et entre en compétition avec  le traitement cognitif de la dimension temporelle que constitue l'aspect pertinent de l'animation. Enfin, ralentir la vitesse de l’animation n’a pas toujours d’effet positif.
 

 Le cas particulier de l'apprentissage de procédures gestuelles

Apprendre à faire un nœud (par exemple, en chirurgie, pour naviguer en  bateau ) voile….), des gestes de secours, un scoubidou, un pas de danse, des gestes techniques, est significativement facilité par l'utilisation de vidéos comparativement à des séries d'images statiques qui pourtant présentent de façon permanente les étapes de la procédure. Ce résultat robuste a été mis en relation avec la capacité "naturelle" des être humains à apprendre des tâches qui impliquent des mouvements, des activités motrices, en observant les gestes d'autrui.
Le modèle neuroscientifique des "neurones miroirs" a été avancé pour expliquer cet avantage des visualisations dynamiques sur d'autres modalités d'apprentissage. D'après ce modèle, issu des travaux de neurosciences (par exemple, Rizzolatti & Sinigaglia, 2008), les aires cérébrales qui sont actives au cours de la réalisation d'actions  qui impliquent la réalisation de mouvements sont en partie le mêmes que celles qui sont  actives lorsque l'on observe ces mêmes actions réalisées par autrui, cela à travers une vidéo par exemple. Ces découvertes ont suscité un regain d'intérêt pour l'étude de l'apprentissage par imitation d'autrui et pour l'analyse des conditions d'efficacité de telles méthodes de formation basées sur l'imitation. Cependant, des études récentes ont montré l’intérêt, mais aussi les limites de l’utilisation des videos et/ou animations virtuelles avec les  modèles théoriques des neurones miroirs.
 
Une meilleure connaissance scientifique des processus cognitifs  impliqués dans l'appre tissage des  porcédures à parti de vidéos ou d'images virtuelles est nécessaire. D’autant  plus que cette forme de support est de plus en plus utilisée dans l'apprentissage à distance avec  le développement des MOOC (massive open online course) par exemple. 
En résumé, les travaux qui ont consisté à enrichir les animations en ajoutant des propriétés supplémentaires ont eu des effets limités sur l'amélioration des apprentissages, faute peut-être de modèles théoriques de la compréhension des animations. 
 

Le rôle des facteurs individuels 

De nombreux travaux ont mis en évidence l'effet de facteurs individuel sur les performances d'apprentissage à partir de représentations graphiques.
Lorsque l'on mesure les habiletés spatiales des apprenants avec des tests standardisés qui évaluent des capacités comme la rotation mentale de figure 3D, le pliage de figures, ou l'orientation dans l'espace, il est généralement observé que les participants ayant des habiletés spatiales élevées obtiennent de meilleures performances de compréhension d'image ou de schémas. Cependant, plus intéressant, il existe une interaction entre les conditions de présentation des images et les habités spatiales. Les apprenants ayant des habiletés spatiales faibles bénéficient plus d'une animation que d'une série d'images statiques portant sur le même contenu. Ils "rattrapent" ainsi les sujets ayant des habiletés spatiales élevées. (De la même façon, les animations sont plus bénéfiques que des séries d'images statiques pour les apprenants novices dans le domaine considéré que pour des sujets possédant des connaissances préalables. Enfin, chez les personnes âgées, la compréhension d'animations rapides est plus difficile que chez les jeunes, partiellement en raison du déclin des habiletés spatiales.  
Dans cette partie,  nous avons essayé de montrer le rôle de la perception et de l'attention dans le traitement cognitif de documents numériques multimédias. Mais, regarder au bon moment, au bon endroit ne garantie pas un processus de compréhension efface, qui nécessite l'intégration et la mise en relation des informations. La section suivante est consacré à la compréhension.     
 
 

Intégrer l’information : comprendre, apprendre et utiliser ce qu’on a appris 

 
L’objectif de cette section est de présenter les processus -et modèles-  de compréhension et d’apprentissage avec des documents numériques.
L’activité cognitive de compréhension est impliquée dans de nombreuses activités humaines comme la communication, la résolution de problème, la prise de décision, la conscience de la situation dans un environnement dynamique, l’apprentissage. La compréhension et l’apprentissage se distinguent mais entretiennent aussi des liens.
Comme nous l'avons évoqué dans les section précédentes, plusieurs types de documents numériques peuvent être utilisés. On trouve dans le domaine de l’éducation des hypertextes (documents présentant des informations textuelles interconnectées par des liens hypertextes) ou des documents multimédia (documents présentant différents formats et/ou modalité d’informations). Dans les documents multimédia on peut également distinguer les documents « statiques » (présentation d’images figées) et les animations (documents présentant des informations visuelles dynamiques).
 

Comprendre des documents numériques :la compréhension dans tous ses états

Des modèles -théories- différents de la compréhension ont été développés selon les types de documents numériques. Si des spécificités existent pour chaque modèle, car comprendre un texte ne renvoie pas aux mêmes activités mentales que comprendre la dynamique d’une animation, la compréhension repose néanmoins sur des processus mentaux de base équivalent quelque soit le document. Ces processus sont la sélection de l’information pertinente, la mise en relation des informations entre elles et de la construction d’une représentation globale intégrée, cohérente et, appropriée des contenus.

La cohérence

Comprendre, c’est construire une ou des représentations mentales structurées et cohérentes. Cette cohérence est nécessaire à un maintien des représentations en mémoire de travail de l’apprenant et à un ancrage en mémoire à long terme. Etablir la cohérence, c’est produire des connexions entre les concepts des contenus, ce qui revient à construire le sens à partir des informations issues des contenus et de la base de connaissances initiales de l’apprenant. La cohérence se définit généralement à deux niveaux, le niveau local et le niveau global.
La cohérence locale est atteinte si le lecteur peut connecter l’information entrante à l'information de la phrase antérieure ou aux informations issues des traitements précédents en mémoire de travail. Elle repose en grande partie sur la cohésion du texte, c’est-à-dire le degré de recouvrement d’argument entre les deux phrases (Kintsch & van Dijk, 1978).
La cohérence globale est atteinte si l’information entrante peut être connectée à la macrostructure - c'est à dire le plan, la structure globale - des contenus ou à des informations traitées plus tôt qui ne sont plus en mémoire de travail. La cohérence globale est ainsi établie lorsque des groupes locaux d’information sont organisés et inter-reliés dans des groupes plus globaux, c'est à dire plus généraux, d'ordre supérieur, ce qui est nécessaire à la compréhension de la signification conceptuelle du texte (Graesser, Singer, & Trabasso, 1994). Cette question de la cohérence globale est essentielle pour la compréhension des documents numériques qui permettent d’accéder à n’importe quelle information à partir d’un point du document. En effet, le lecteur peut être facilement amené à des ruptures de cohérence selon l’ordre de lecture qu’il suivra.
 
Les activités inférentielles
 
Lorsqu’un document ne présente pas une bonne cohésion interne (ex. discontinuité dans la structure générale des contenus, faible explicitation des liens entre contenus), le lecteur engage des activités inférentielles qui permettront de combler les ruptures de cohérence. Fiar des inférences consiste à établir des liens, des relation, entre des contenus permettant de  produire des informations (nouvelles, parfois implicites) pour construire une représentation cohérente. Ces inférences sont d’autant plus difficiles à conduire que les processus de compréhension sont limités aux capacités de la mémoire de travail.
 

La compréhension de documents hypertextes

Les documents hypertextes ont une spécificité, ils proposent des accès non-linéaires à l'information grâce à des hyperliens qui permettent un affichage quasi instantané des informations pointées par le lien. Les lecteurs peuvent naviguer au sein d'un espace d'information en fonction de leurs besoins et objectifs. Une telle interaction avec des documents est prévue pour faciliter l'accès à l'information par contraste avec des documents plus linéaires comme des documents papier. Ce type de fonctionnalité d’accès modifie en partie la compréhension par rapport à des documents papier en mettant davantage au cœur de l’activité de parcours de lecture élaboré par le lecteur (Van den Broek & Kendeou, 2015). Cette activité de parcours de lecture vise un objectif d’établissement de cohérence. Cette activité sous-tend la navigation au sein d’un document hypertexte. Traiter les contenus de ce type de document nécessite l’exécution de processus de navigation (e.g., sélection de liens, encodage et maintien en mémoire du parcours de navigation). Les lecteurs doivent combler des manques d’information et autoréguler leur activité en décidant par exemple de modifier leur façon de parcourir le document (DeStefano & LeFevre, 2007; Shapiro & Niederhauser, 2004). Parce que les hypertextes proposent des informations interconnectées, comprendre les contenus d’un hypertexte nécessite de mettre en œuvre des processus d'intégration (mise en relation)  de l'information à partir de différents endroits ou nœuds d’information en établissant des relations sémantiques entre les nœuds, ce qui participe à la compréhension au sens d’une représentation cohérente en mémoire de la situation décrite dans les contenus (Madrid, Van Oostendorp, & Puerta Melguizo, 2009; Salmerón, Cañas, Kintsch, & Fajardo, 2005).
 
Le modèle de compréhension des document hypertexte élaboré par Rouet et Britt (2011) décrit les activités fonctionnelles de traitement cognitif de documents complexes. 
Cinq étapes essentielles sont présentées dans ce modèle :
 
(i) La construction d’un modèle interne de la tâche : le lecteur construit d'abord une représentation de la tâche à réaliser (but de la recherche d'information) et un ensemble de buts qui guideront par la suite les traitements qui seront basés sur la pertinence de l'information trouvée par rapport à ces buts de recherche. La construction du modèle de la tâche s’appuie sur les connaissances du lecteur et les contraintes et moyens identifiés au niveau des ressources externes. Ce modèle est dynamique et peut être actualisé au cours de cycles de traitements cognitifs. Au final, cette étape aboutit à un modèle de la tâche de recherche de l'information avec l’ensemble des buts et procédures pour atteindre ces buts, ainsi qu’un ensemble de critères pour l’évaluation de la pertinence thématique des documents ou parties des documents, le nombre de documents à localiser et à lire, et le type de résultat attendu.
 
(ii) L’évaluation par le lecteur de ses besoins informationnels : le lecteur compare ses connaissances aux exigences de la tâche (e.g., production d’une dissertation - d'un texte-  sur une question spécifique). Des tâches avec des prescriptions peu spécifiques peuvent rendre difficile cette évaluation des besoins. Cette évaluation des besoins intervient à plusieurs reprises au cours de l’activité grâce à l’acquisition de nouvelles informations qui permettent d’actualiser le résultat final attendu et donc de mesurer l’écart à ce résultat final attendu. Le maintien en mémoire des buts à atteindre et les activités d’évaluation des besoins peuvent s’avérer exigeants, en particulier pour des lecteurs avec de faibles connaissances ou habiletés de régulation de leurs activités .
 
(iii) La sélection, le traitement et l'intégration des informations du document :
Evaluation de la pertinence des items : le lecteur doit évaluer la pertinence des ressources informationnelles (documents) par rapport à son but de recherche sur la base de leur degré de correspondance au thème mais aussi de leur fiabilité (évaluation des sources de l'information, de leur fiabilité par exemple). Mais également, il doit ternir compte de l'utilité de la tâche, à savoir le coût que représente la tâche pour un bénéfice espéré. L’évaluation de l'utilité conduit le lecteur à décider de la poursuite ou non de la lecture d’un document, de l’ordre de lecture des documents, et à quel degré de profondeur il faut traiter les informations.
Le niveau de profondeur du traitement cognitif des textes : le lecteur extrait et intègre des informations issues du document traité. Cependant, les traitements opérés vont dépendre des spécifications de la tâche et des buts construits par le lecteur. Le traitement peut être en surface, c'est à dire superficiel, (e.g., stratégies de scanning, de simple balayage de l'information) lorsque le texte est utilisé pour localiser une information spécifique, ou au contraire plus en profondeur pour construire une représentation plus précise  de la situation décrire par le texte (i.e., traitements plus systématiques de la signification des contenus).
 
 (iv) Création et actualisation d’un modèle - d'une représentation mentale-  des documents : cette étape renvoie au traitement de documents multiples. Le lecteur doit combiner une information nouvellement acquise avec celles trouvées dans d’autres documents. Les processus de combinaison peuvent correspondre à des principes de complémentarité (relation de soutien entre les informations des documents), d’opposition, ou de contradiction. Le lecteur doit maintenir une représentation de chaque information et de sa source afin de se rappeler où l’information a été trouvée. Grâce au souvenir des liens entre sources et contenus des documents connectés, le lecteur élabore un modèle des documents, en particulier pour des buts de lecture complexes (e.g., étudier une controverse).
 
(v) La construction d’un produit de la tâche : le lecteur utilise les informations pour construire une réponse à la tâche de recherche d'informations (e.g., rédaction d’un résumé ou d’une dissertation) sur la base des spécifications de la tâche, des informations acquises dans les documents et du type de produit attendu. Si la représentation du produit attendu n’est pas claire ou si le modèle de la tâche est erroné, les lecteurs peuvent par erreur terminer la phase d’acquisition (i.e., décision à l’étape 2 d’arrêter l’étape 3) ou la phase de production (i.e., décision à l’étape 5 d’arrêter l’étape 4). 
 
L’évaluation de la qualité du produit : le lecteur évalue ici si le produit construit à l’étape précédente satisfait ou non les buts définis à l’étape 1. Soit le lecteur décide de stopper le processus, les buts sont atteints, soit il relance un cycle de traitements. Le nouveau cycle sert soit à compléter ou réviser le produit en vue de l’améliorer, soit à réviser ses besoins informationnels si l’amélioration du produit semble impossible. Les habilités d’autorégulation ont ici un rôle important.

 

La compréhension de documents multimédia statiques

La compréhension à partir de textes, d’hypertextes ou de documents multiples s’appuie sur de multiples processus. Parmi ces processus, les processus de sélection des informations pertinentes et de mise en relations des informations entre elles s’appuyant sur les caractéristiques du document et les connaissances antérieures de l’individu sont centraux. 
 
L’effet multimédia : processus d’intégration entre textes et images
 
Un document multimédia peut être défini comme un document présentant des informations en utilisant un format verbal (texte ou discours oral) et un format pictural (e.g., graphiques, photos, animations, vidéos) (Mayer, 2014). 
Tout d’abord, au même titre que les documents hypertextes et les documents multiples, il ne suffit pas de multiplier les textes, les documents, les sources ou les formats d'informations pour aider la compréhension et ainsi contribuer à un meilleur apprentissage. Une étude de Sandberg et Barnard (1997) a parfaitement montré qu’en dépit des attentes des auteurs, un environnement d’apprentissage enrichi avec diverses ressources textuelles et graphiques n’a pas apporté un apprentissage plus profond. Pour concevoir des documents numériques réellement efficaces pour des apprentissages, il est essentiel d’étudier les traitements cognitifs de ces documents afin de pouvoir adapter les documents et les tâches aux caractéristiques de apprenants. L'effet multimédia est issu des résultats d'un ensemble d'expériences qui ont  montré que l’apprentissage est amélioré par l’ajout d’images à des textes, et cela dans certaines conditions déterminées. (Mayer, 2014). 
La compréhension d’un document multimédia repose sur l'intégration entre l'information picturale et textuelle (à savoir le renforcement des connexions référentielles entre les deux types de représentations). Ce processus d'intégration servirait de base pour la production d'inférences (Glenberg & Langston, 1992; Jamet & Erhel, 2006) et favoriserait un meilleur apprentissage. Gyselinck et Tardieu (1999) ont montré un effet positif d’une illustration sur la production d’inférences lors de l'apprentissage à partir de textes expositifs. Les auteurs ont précisément montré que pour être efficaces, les illustrations doivent être présentées en même temps que le texte, afin de permettre aux lecteurs de naviguer entre l'information picturale et textuelle. Plus récemment, Mason, Tornatora et Pluchino (2013) ont montré que lorsqu'on demande à des apprenants de lire un texte illustré, plus ils réalisent des traitements d'intégration entre les textes et les illustrations (nombre de transitions osculaires entre le texte et l’image et vice-et-versa), plus ils apprennent. De plus, on a constaté qu'une plus grande fréquence des transitions oculaires entre les représentations d'un support multimédia (photo et graphique) prédisait de meilleurs scores de transfert. (Johnson & Mayer, 2012; Letourneau, Homer, Schwartz et Plass (2014)). Les modèles d'apprentissage développés pour les documents multimédia accordent en effet de l’importance aux processus d’intégration et à la construction d’une représentation intégrée en mémoire.
Mayer, 2014 a développé un modèle -une théorie- cognitif de l’apprentissage multimédia. Selon ce modèle l'apprentissage multimédia est influencé à la fois par des contraintes du système cognitif humain et par un engagement actif de l'élève.  
 
Une capacité limitée de traitement
 
Les traitements des informations multiples s’opèrent dans une mémoire de travail à capacité limitée conduisant les apprenants à opérer des sélections des informations et à s’engager dans des traitements itératifs (i.e., un texte ou une image ne peut être traité en une seule fois et nécessite plusieurs traitements).
 
Un traitement actif
 
La finalité de l’apprentissage étant de construire un modèle mental cohérent, et approprié, intégrant des informations des différents formats d’information, l’apprenant doit mettre en œuvre des traitements contrôlés. Il doit sélectionner les informations pertinentes pour les traiter dans un des canaux sensoriel de la mémoire de travail (phonologique -auditif-  et/ou visuel), organiser mentalement les informations sélectionnées en une représentation mentale cohérente (représentation picturale ou verbal en mémoire de travail) et enfin produire un modèle mental du contenu des informations reliant les représentations en mémoire à partir des connaissances antérieures activées en mémoire à long terme.
 
D’après le modèle de l’apprentissage multimédia. Les cinq étapes de traitement de l'information sont itératives et peuvent ne pas se dérouler dans l’ordre présenté :
 
  • La sélection: l’apprenant va sélectionner les mots pertinents dans la source d’information verbale (texte audio ou visuel). ou des parties de l’image présentée.
  • Organisation des informations verbales d’une part et picturales d’autres part en une représentation mentale cohérente.
  • Intégration des deux représentations mentales: l'une "picturale", issue du traitement de l'image et l'autre "verbale" issue du texte (Schnotz, 1999). L’apprenant doit intégrer les deux représentations mentales construites précédemment dans les deux canaux de traitement (représentation verbale et représentation picturale) en une dernière représentation mentale cohérente, unique, que Mayer appelle le modèle mental. Des connexions entre des parties du modèle pictural et verbal doivent être créées grâce à l’aide de connaissances antérieures. Chaque élément d’un modèle correspond à un autre élément de l’autre modèle, c’est-à-dire que les structures sous-jacentes des deux représentations doivent être interconnectées. Des connexions référentielles entre les représentations verbales et picturales seraient construites une à une. L’intégration implique donc un coût cognitif important pour l'élève.

 

La compréhension d'informations imagées dynamiques : les animations

Les informations dans les documents numériques peuvent être statiques, interactives (l’utilisateur exerce une action sur la représentation de l’information) mais aussi dynamiques. Les formats de types vidéos et animations présentent des informations dynamiques. « Une animation réfère à un film simulé représentant les mouvements d’objets dessinés (ou simulés). Les principaux critères de cette définition sont les suivants : (1) image – une animation est une sorte de représentation illustrée ; (2) mouvement – une animation représente des mouvements visibles ; et (3) simulation – une animation est composé d’objets qui sont artificiellement créés via le dessin ou une autre méthode de simulation » (Mayer & Moreno, 2002, p.88, notre traduction).

Lowe et Boucheix (2008, 2011, 2016) ont proposé un modèle du traitement cognitif des animations expliquant les processus bottom-up et top-down impliqués dans l'apprentissage à partir  d'animation explicatives de processus dynamique. Ce modèle est organisé selon cinq grandes phases :

Exploration perceptuelle et localisée de l'animation: Au cours de la première étape, l’élève doit segmenter le flux continu des informations en unités événementielles pertinentes, c'est à dire décomposer l'animation en unités évènementielles. Dans cette approche, la notion d'événement est cruciale: un événement correspond à un composant de l'animation complété par le ou les comportements associés à ce composant. Par exemple, une partie d'un mécanisme (technique ou biologique) ou une relation causale, forme un sous-groupe structuré d'événements. La segmentation des évènements est difficile et couteuse. Cette étape met l’accent sur l’importance des aspects perceptifs dans le traitement cognitif d’une image réaliste. L’identification de ces évènements est déterminée par la saillance perceptive de l’évènement (taille, forme, mouvement distinct des autres éléments et événements). Cela se traduit par des processus perceptifs d'abords dispersés puis localisés.

Formation de structures locales : durant une  2nde phase, les unités sélectionnées et l'espace d'événements temporellement adjacents sont combinés pour former des micro-segments dynamiques. Des relations entre les unités traitées en phase 1 sont reliées sur la base de principes Gestaltistes par exemple. Les microgroupes d'événements temporels dynamiques - appélés micro-chunks-  produits restent des fragments à un niveau local. Ils correspondent à ce que Fayol et Gaonac'h (2002) ont appelé des "ilots" de compréhension".

Caractérisation globale : au cours de cette phase 3, les micro-groupes -micro-chunks -dynamiques sont reliés entre eux pour composer une structure d'organisation de niveau supérieur plus large (par exemple, des chaînes de causalité entre des groupes d'événements). Une représentation structurée des entités opérationnelles importantes est construite. Cette phase permet de valider des connexions établies à la phase 2 et d’aboutir à une chaine causale et de transformation des évènements et objets. Cependant, en l’absence de connaissances spécifiques au domaine, cette structure de causalité peut présenter certaines erreurs. Dans ce cas, l’apprenant sera davantage sensible aux attributs physiques de l’animation. A cette étape, l’apprenant aboutit à une représentation cohérente de la structure générale de l’animation mais pas encore à un modèle mental de la fonctionnalité du système en situation.

Différentiation fonctionnelle : cette phase implique des processus top-down basés sur les connaissances antérieures qui contribuent à la compréhension des aspects fonctionnels des informations de l’animation. La représentation de la contribution des évènements aux performances de l’ensemble du système est élaborée. En d’autres termes, l’apprenant comprend à cette étape l’objectif fonctionnel des différents aspects dynamiques de l’animation.

Consolidation du modèle mental : sur la base des connaissances antérieures, l’apprenant consolide son modèle mental en l’intégrant à un univers plus abstrait, ce qui lui permet ensuite de le mobiliser pour répondre à des situations variées ou pour évaluer des erreurs dans le mécanisme. Une animation seule ne favorise pas cette abstraction en particularisant la structure dynamique à une situation donnée.

Ce modèle met donc en avant l’activité de compréhension comme une activité séquentielle organisée autour de processus bottom-up et top-down.

Ce modèle en étapes (pas forcément successives et ordonnées de façon systématique), suggère que l'on pourrait soutenir la difficulté de traitement cognitif d'animations complexes , comme celle de la figure 4. Par exemple, l'étape de la décomposition du flux des évènements pourrait être soutenue en fournissant à l'élève de petits groupes (pairs) d'évènements pertinents, de façon séquentielle, cela permettrait de faciliter la phase de composition, comme le montre la figure 5 ci-dessous. Une récente recherche de Lowe & Boucheix, 2016, montre l'intérêt de cette méthode.

 

Figure 4. Dans cette exemple, la présentation des petits groupes de mini-animation de paires de composants (animation touche-chevalet, puis animation chevalet-échappement, etc.) sont présentés séquentiellement en suivant l'ordre de la chaine  causale du système mécanique. 

 

En résumé, les différents processus cognitifs nécessaires à une compréhension profonde des contenus d’un document numérique exigent des ressources cognitives importantes et les apprenants rencontrent parfois des difficultés à traiter de manière efficace ces documents. La multiplicité des informations, des sources, des formats, l’aspect transitoire de certaines informations rendent difficile la compréhension car les informations et les buts des apprenants saturent parfois leur mémoire de travail et réduisent ainsi les ressources nécessaires à la réalisation des traitements. L’objectif de compréhension étant de se construire une représentation de l’ensemble des contenus traités par le document, l’apprenant doit intégrer les différentes représentations construites en mémoire en une représentation globale cohérente de l’ensemble des informations pertinentes.

 
 

Conclusion  

Les technologies numériques offrent de nombreuses possibilités pour optimiser - parfois rendre possible- les apprentissages, leur individualisation  et soutenir les processus cognitifs de construction des connaissances, ainsi que leur utilisation. L'usage de différentes modalités (sensorielles) de présentation des informations, des guidages de l'attention, des aides pour la compréhension des relations conceptuelles et des inférences, l'ajout de paramètres d'interactivité offrent de réels leviers potentiels pour les enseignants, les formateurs et les élèves. Cette optimisation ne concerne pas seulement les apprentissages fondamentaux ou scolaires mais aussi les apprentissages professionnels. Selon leur conception, les technologies numériques peuvent également s'attacher à prendre en compte les aspects motivationnels et émotionnels de l'apprentissage, c'est l'un des objectifs des études récentes sur les "jeux sérieux éducatifs" ou "formatifs", pour peu évidemment que les études sur l'apprentissage avec ces "jeux" fassent l'objet d'une approche scientifique rigoureuse et objective, qui inclue leur évaluation. Les technologies numériques ont des conséquences positives. Cependant, il existe aussi des conséquences plus négatives. En particulier,  la multiplicité des sources sensorielles, des textes des images, des sons, augmente les exigences de contrôle cognitif et métacognitif. Ces exigences concernent l'adoption de stratégies optimales  de traitement des informations multiples qui nécessitent -entre autres- à la fois  de partager efficacement son attention entre les médias, de rafraichir et intégrer les informations dynamiquement, d'inhiber (temporairement parfois) les  informations inutiles au but poursuivi. Bref, le numérique offre plus de possibilités, mais en contre partie il contraint à  plus d’exigences.

 
 
 

Pour aller plus loin, quelques références pour approfondir

  • Amadieu, F. & Tricot, A. (2014). Apprendre avec le numérique. Mythes et réalités. Collection  Savoir pratiques éducation, Paris, Retz.
  • Boucheix, J.-M. (2008). Contrôle d'animations multimédias par des enfants de dix à 11 ans : quel effet des dispositifs de contrôle ? Psychologie Française, 53(2), 239-257.
  • Boucheix, J.M., & Rouet, J.F. (2007). Les animations interactives multimédias sont elles efficaces pour les apprentissages? Revue Française de Pédagogie, 160, 239-257.  
  • Rouet, J.-F., & Britt, M.A. (2011). Relevance processes in multiple document comprehension. In M.T. McCrudden, J. P. Magliano, & G. Schraw (Eds.), Text Relevance and Learning from Text (pp. 19-52). Greenwich, CT: Information Age Publishing.
  • Mayer, R.E. (2014). The Cambridge handbook of multimedia Learning. Cambridge University Press.
 
 
 
 

⇒ Retour à la page des Dossiers

Partenaires du projet

Fondation La main à la pâte