On peut tenter une définition de l’évaluation scolaire en s’interrogeant sur ses buts. Jean CARDINET 1 en définit quatre, fondamentaux :
et précise qu’il ne peut s’agir d’évaluer de la même façon dans tous les cas. L’évaluation, en effet, même si elle porte sur le même objet, à savoir une production d’élève, comporte des fonctions différentes : pédagogique, sociale et institutionnelle. Évaluer consiste donc essentiellement à fournir des informations à différents destinataires : élève(s), professeur lui-même, parents, administration scolaire, autres professeurs, société... surtout en vue de prendre des décisions : proposer des activités d’apprentissage, de soutien ou de remédiation ; décerner un diplôme ou certifier de la maîtrise de compétences; transformer les méthodes et les modalités de l’enseignement; etc. La diversité des destinataires engendre d’ailleurs, parce que la nature de l’information attendue est différente pour chacun, une première difficulté, fondamentale : il y a souvent incompatibilité, voire contradiction, entre les informations fournies aux uns et aux autres parce qu’elles ne sont pas fondées sur la même « logique » et parce qu’elles relèvent, par nature, de modèles différents de la relation pédagogique. Si, d’autre part, on retient la définition de l’évaluation proposée par G. de LANDSHEERE 2
on est conduit à valider l’acception la plus triviale du terme, celle qui structure la représentation la plus largement partagée sur sa nature, mais aussi certainement la plus réductrice : évaluer, c’est toujours et principalement donner une note 3. Cette définition s’accorde avec le troisième but de l’évaluation défini par J. CARDINET ; elle n’est pas pertinente pour les autres. Dans le même article, G. de LANDSHEERE, citant N.E. GRONLUND, précise toutefois que l’évaluation
Il est là question de tout autre chose que d’une note qui « mesure » un comportement ou un produit, et c’est en cela que réside toute la difficulté, mais aussi toute l’ambiguïté de l’évaluation. Qu’est-ce qu’évaluer ? Il est certainement utile, pour répondre à cette question, de reprendre la distinction opérée par N. CHOMSKY entre compétence et performance. La compétence d’un élève, si on la rapporte à l’évaluation de ses comportements et de ses productions, représente l’ensemble de ce qu’il est capable, potentiellement, d’accomplir. Sa performance représente, elle, l’actualisation partielle de sa compétence, dans un contexte et une production définis. Évaluer consistera donc à juger de la compétence d’un élève à travers sa performance, à extrapoler sa compétence à partir de comportements observables et/ou d’un produit réalisé. Y. ABERNOT 4, faisant également référence à CHOMSKY, note que
Un modèle de l’évaluation ( parmi d'autres ) 5 L’acte d’évaluation peut s’inscrire dans un triangle dont les sommets figurent les trois pôles entre lesquels s’affrontent le plus souvent les différentes conceptions, les différentes pratiques de l’évaluation. Le RÉSULTAT de l’apprentissage est un produit ou un comportement qui montre ce que l’apprenant sait et sait faire au moment et dans les conditions où il est évalué. Il est, le plus souvent, un indicateur des apprentissages réalisés. Le jugement émis par l’évaluateur porte principalement sur la présence et la maîtrise de savoirs et de compétences et l’information évaluative produite sur ce résultat est de l’ordre de la réussite ou de la non-réussite en fonction des critères retenus. La VALEUR du résultat de l’apprentissage est la traduction de ce résultat en note dont l’ambition est de s’inscrire dans un absolu étalonné : l’échelle de 0 à 20, ou toute autre échelle possible 6. L’information évaluative ne dit plus rien du produit évalué, des savoirs et des savoir-faire maîtrisés ou non, elle renvoie un jugement sur la qualité globale du travail accompli par l’élève. Donner une valeur au résultat d’un apprentissage est d’ailleurs une nécessité pour informer tous ceux qui ne sont pas présents dans la situation d’apprentissage ( parents, administration, société... ) et pour lesquels les informations sur la réussite ou la non-réussite des apprentissage ne sont pas des informations pertinentes, ou ne font pas partie d’un héritage socioculturel profondément et encore durablement partagé. Les ACTIVITÉS MENTALES qui permettent les apprentissages et donc la mise en oeuvre des connaissances et des compétences forment le troisième pôle de cet ensemble. Il s’agit de tous les processus intellectuels, cognitifs, sociocognitifs, culturels etc., qui, sans se manifester directement et de façon visible, sont pourtant indispensables à la réussite d’une tâche. L’information évaluative consiste, dans ce cas, à faire l’hypothèse, à partir du produit réalisé, de la mise en oeuvre d’opérations mentales dont seule la maîtrise permet d’atteindre le résultat attendu. Le jugement de l’évaluateur porte alors sur la mobilisation par l’apprenant de stratégies et de moyens d’apprentissage adaptés. La possibilité d’évaluer ces activités mentales, surtout celles de haut niveau, passe, bien entendu, également par la mise à distance métacognitive qui en est l’instrument privilégié. Nous sommes là de plain-pied dans le modèle de l’apprendre que propose J. BERBAUM 7 ainsi que dans ce que VYGOTSKY appelle « conscience après » , retour réflexif sur les réussites et les non-réussites pour en analyser les causes 8. Il est aisé de voir pourquoi ces trois pôles s’affrontent toujours dans la pratique de l’évaluation. C’est qu’ils ne répondent ni au même but, ni aux mêmes modalités. Le pôle ACTIVITÉ et le pôle RÉSULTAT sont en interaction parce que l’un dit toujours quelque chose de l’autre; et surtout parce que si l’objectif premier de l’enseignement devient la maîtrise des savoirs et des compétences relatifs aux différents domaines de connaissance, ainsi que leur transfert optimal dans de nouveaux domaines, alors le resserrement des liens entre ces deux pôles est une nécessité. En effet, un même résultat peut être obtenu par des stratégies différentes ( et c’est là le pari même de toute différenciation pédagogique ). Par contre, il ne peut y avoir interaction entre le pôle RÉSULTAT et le pôle VALEUR puisqu’il s’agit d’une traduction de l’un dans le code particulier de l’autre. Une fois un produit traduit en note, lorsque la note seule est la trace des apprentissages, il n’est plus possible de se faire une idée exacte de ce qu’était ce produit, il n’est plus possible d’y revenir. Seule subsiste la mesure. Quant aux pôles VALEUR et ACTIVITÉS MENTALES, il est strictement impossible de les mettre en relation. Une note ne peut donner d’indication sur des processus mentaux. Il est même possible, en forçant quelque peu le trait, de considérer que certains résultats de moindre valeur peuvent être dus à la mobilisation par l’apprenant de processus cognitifs de haut niveau ( et ce sont précisément ceux que l’enseignement devrait chercher à développer ). En effet, il peut être plus facile de réussir une tâche en faisant appel à un apprentissage par cœur, ou même à un conditionnement 9, plutôt que par la mise en oeuvre de stratégies et d’opérations mentales plus élaborées mais actuellement moins maîtrisées. C’est d’ailleurs ce qui se passe lorsque ne sont évalués que des savoirs déclaratifs que les élèves sont capables d’énoncer mais incapables d’utiliser. Une typologie des évaluations Il est d’usage, depuis quelques années déjà, de distinguer trois grands types d’évaluation : l’évaluation formative, l’évaluation formatrice et l’évaluation sommative. a- L’évaluation formative
C’est un mode d’évaluation dont l’objectif principal est donc la régulation du processus d’apprentissage. Il s’agit donc, essentiellement, d’un processus de rétroaction. En fournissant à l’apprenant, qui en est le principal destinataire 11, des informations sur ses progrès par rapport à un objectif déterminé, elle permet
En ce sens, l’évaluation formative permet donc de remplir les deux premières fonctions assignées à l’évaluation par J. CARDINET. C’est également une évaluation qui permet à l’apprenant d’évaluer lui-même ce qu’il sait, ce qu’il ne sait pas, ce qui fait qu’il ne réussit pas et, en ce sens, elle un chemin vers l’auto-évaluation. Enfin, c’est un type d’évaluation qui permet de mettre en place une pédagogie de la réussite, source de motivation. Faut-il préciser que l’évaluation formative consiste à fournir des informations, des appréciations sur le travail, les activités et les productions de l’apprenant ? Elle est irréductible donc à un résultat chiffré. L’évaluation formative n’est pas, dans tous les cas, qu’une évaluation terminale, qui se situerait toujours après une tâche; elle constitue également, par nature, une évaluation diagnostique ou une évaluation pronostique qui peut donc intervenir en début de séquence d’apprentissage ou avant une séance de travail subordonnée à un objectif spécifique. Évaluation diagnostique, car elle permet alors de mettre en lumière les difficultés liées à l’apprentissage et donne des indications sur les obstacles à surmonter; en ce sens elle est une évaluation qui sert à mettre en place des activités propres à lever ces obstacles d’apprentissage. Comme le précise J. CARDINET 12.
Évaluation pronostique, dans le sens où elle permet de déterminer si un élève maîtrise les pré-requis nécessaires pour la poursuite des apprentissages prévus dans une séquence. Elle renvoie, alors, des informations sur les apprentissages prioritaires à consolider, à s’approprier en vue de la réussite des apprentissages ultérieurs.
b. L’évaluation formatrice D’après C. HADJI 13, l’évaluation formatrice est une
Ce type d’évaluation est, on le voit, essentiellement conçu comme un outil spécifique d’apprentissage qui a sa place dans le processus même de l’apprentissage. Elle permet
L’évaluation formatrice est donc le vecteur d’une réelle appropriation des savoirs et des savoir-faire.
c. L’évaluation sommative L’accent, ici, est mis sur la notion de produit de l’activité d’un élève. Son destinataire est prioritairement l’institution scolaire et la société. L’objectif principal de l’évaluation sommative est un objectif de certification. En effet, elle permet L’évaluation sommative, faisant la somme des apprentissages réalisés, se traduit le plus souvent dans une note. J. CARDINET 14 note que l’évaluation sommative
et il ajoute
Une recommandation à méditer, en tout cas, pour redonner à l’évaluation sommative sa véritable fonction : faire le bilan des apprentissages appropriés et consolidés. Ailleurs, il distingue l’évaluation sommative externe de l’évaluation sommative interne. La première
La seconde
Deux modalités d’évaluation Une évaluation, formative ou sommative, peut être conçue selon deux modalités : une évaluation qui compare les élèves les uns aux autres, dans le groupe classe ou entre des groupes de même niveau, et une évaluation qui permet de certifier ce que les élèves peuvent faire et ne peuvent pas faire, indépendamment les uns des autres, en rapportant cette certification à un ensembles de critères prédéfinis. On parlera, dans le premier cas, d’évaluation normative, et, dans le second, d’évaluation critérielle 17. a- L’évaluation normative L’évaluation normative permet
Elle traduit donc les résultats d’un apprentissage, le produit d’une tâche, en termes de comparaison avec les résultats des autres élèves de la classe voire avec des élèves appartenant à d’autres groupes de même niveau. Elle permet ainsi de situer chaque élève par rapport à la moyenne de son groupe; c’est cette moyenne qui représente la norme du groupe en question. Il est capital de bien comprendre que ce n’est pas par rapport à une moyenne absolue qu’on classe les élèves. En effet, la moyenne normative est toujours fonction du niveau d’un groupe de référence donné parce que, lors de l’élaboration de l’épreuve d’évaluation, il est nécessaire d’insérer des questions faciles, des questions de difficulté moyenne et des questions difficiles dans le but de discriminer les élèves les uns par rapport aux autres. A l’occasion d’une évaluation normative, les élèves sont classés du plus fort au plus faible parce que l’épreuve a été construite dans ce sens; on prend essentiellement en compte l’écart de la moyenne de chacun par rapport à la moyenne du groupe dont il fait partie; on fait en sorte que la distribution des élèves s’opère selon une courbe en cloche (cf. figure) - c’est là d’ailleurs l’indicateur de la validité de ce type d’évaluation. Ainsi, dans l’idéal, les élèves devraient se répartir selon cette distribution « normale » définie par G. de LANDSHEERE 19
Un écart-type, noté s ( sigma ), permet de mesurer la dispersion de la série des notes. Il se calcule selon la formule 20 où
Si cet écart-type est d’environ 2,5, la distribution des notes est alors dite " normale " et les élèves sont distribués sur la courbe de la façon suivante :
Enfin, comme le souligne C. HADJI 21
L’évaluation normative trouve également sa place dans des dispositifs pédagogiques différenciés. Dans ce cas cependant, elle se présente de façon quelque peu différente : l’objectif n’est plus de distribuer les élèves dans une perspective de classement les uns par rapport aux autres, mais bien d’assurer la progression de tous vers les objectifs retenus, en donnant notamment à chacun tous les moyens ( temps, aide notionnelle et méthodologique... ) d’atteindre un niveau optimal de progrès. Ce qu’évalue alors une telle épreuve normative c’est la quantité des progrès, bien sûr, c’est-à-dire les différents apprentissages réalisés, mais surtout la qualité de la progression vers un objectif déterminé. On pourrait penser qu’il s’agit là pratiquement d’une évaluation de type formatif, à cette exception près que l’épreuve est sommative, non critérielle, parce que chaque élève est évalué en fonction de son point de départ dans la séquence d’apprentissage, en vertu de l’évaluation initiale réalisée. La courbe des notes devrait se rapprocher dans ce cas d’une courbe en " J ".
b- L’évaluation critérielle L’évaluation critérielle vérifie les performances d’un élève en fonction d’un ensemble de compétences ( savoirs, savoir-faire, savoir-être ) constituées en critères par rapport à un modèle défini par avance. Dans l’enseignement technique par exemple, les référentiels de diplômes sont ces modèles, à un niveau donné et pour une formation donnée. R. Glaser, cité par V. de Landsheere 23, précise
Contrairement à l’évaluation normative, la démarche critérielle ne situe pas les élèves les uns par rapport aux autres; ce qui est pris en compte, c’est l’écart des performances ( que ce soit en plus ou en moins ) par rapport à une sorte de « capital-cible » , pour reprendre l’expression de V. de Landsheere 24. Le but poursuivi est, bien entendu, 100 % de réussite. Il n’y a pas de questions trop faciles ou de questions plus difficiles puisqu’il n’est pas question d’aboutir à un classement des élèves sur une échelle ordinale. Les tâches proposées permettent d’évaluer à quel point
Évaluer des compétences en situation Une tâche inscrite dans une situation réelle donnée, aussi proche que possible d’une situation sociale ou professionnelle, est particulièrement complexe à évaluer. On se trouve, en effet, sur un terrain où les facteurs cognitifs, affectifs, conatifs et gestuels sont massivement présents et où ils interagissent constamment. Dans des situations de ce type, les connaissances et les savoirs ( facteur cognitif ), les actions ( facteur gestuel ), les comportements ( facteur conatif ) et les émotions ( facteur affectif ) sont intimement liés. Si l’évaluation a lieu en cours de formation ( évaluation formative critérielle ), certaines compétences sont déjà acquises antérieurement à la tâche, on peut alors évaluer leur degré de transfert si la tâche s’inscrit dans une situation nouvelle par rapport à la situation d’apprentissage. Si ce n’est pas le cas, on évaluera leur degré de réinvestissement. D’autres ont fait l’objet des apprentissages visés en cours de séquence. Ce sont ces compétences qui seront évaluées prioritairement, mais sans négliger leurs relations avec les autres paramètres de la situation. Les critères de performance retenus pour l’évaluation devront prendre en compte le caractère facilitateur ou non des autres compétences mises en oeuvre dans la situation. Certaines, enfin, ne sont pas évaluées parce qu’elles n’ont pas fait l’objet d’apprentissages spécifiques. Il faut veiller alors à ce que la non-maîtrise de ces compétences-là ne rendent pas la tâche impossible ou problématique. Au contraire, les situations scolaires plus traditionnelles ne font intervenir, le plus souvent, que les dimensions cognitives ( connaissances sur les objets, surtout ) et gestuelles. Qui plus est, elles tendent à présenter ces compétences de manière unidimensionnelle en éliminant, souvent implicitement, la complexité des situations : évaluer une compétence telle que « décoder un message écrit » en la coupant de toute situation sociale ou professionnelle, la réduit à une activité « simple », facilement évaluable certes, mais considérablement appauvrie, sans enjeu réel. La même compétence, en situation, se conjugue avec un faisceau d’autres compétences qui lui sont irréductiblement liées; elle est plus difficile à maîtriser parce que d’autres compétences, de nature différente, interagissent avec elle; il est donc plus difficile de l’évaluer parce qu’il faut considérer en même temps les autres facteurs, les autres types de compétences à maîtriser et leurs relations; cela rend bien plus complexe la définition des critères de performance. V. de Landsheere 26 distingue quatre composantes principales de l’évaluation des compétences :
Si la compétence à évaluer est une connaissance, déclarative ou procédurale, alors les indicateurs de sa présence sont des énoncés déclaratifs : connaissance, savoir-dire et savoir sur un savoir-faire. Ainsi, énoncer de façon correcte le théorème de Pythagore est un savoir-dire une connaissance. Expliquer la méthode de calcul de l’hypoténuse d’un triangle rectangle est un savoir sur un savoir-faire associé à des savoir-dire des connaissances ( concept de rectangle, angle droit, notion de carré... ). Lorsque la compétence à évaluer est un savoir-faire, les indicateurs sont alors des actions, celles qui sont nécessaires, selon des stratégies et des méthodes imposées ou propres à l’élève, pour réussir la tâche fixée. Si ce qui importe, c’est la réussite de la tâche, seule l’observation de l’activité de l’élève permettra une évaluation cohérente. L’apprentissage se fait pendant l’action, l’évaluation également; mais bien entendu pas au même moment ou à l’occasion de la même tâche. Pour évaluer ces savoir-faire, il faudrait aller, avec P. MENDELSOHN 28, jusqu’à faire l’éloge du « bricolage » :
On peut évaluer le savoir-faire d’un élève dans le domaine de la formation des adverbes à partir des adjectifs en observant ses actions, ses méthodes, ses stratégies à l’occasion d’une tâche qui nécessite, entre autres, la mise en oeuvre de cette compétence. Si l’évaluation porte sur un savoir-être, une attitude, alors l’indicateur de la présence d’une telle compétence doit être un comportement, habituel ou non. Ainsi, dans le travail d’un groupe, pourra-t-on évaluer les attitudes, positives ou négatives, d’un élève dans les différents domaines du travail de ce groupe : recherche d’information, interactions dans la poursuite de la tâche, régulation des activités et de la vie du groupe...
Critérier l’évaluation des compétences Les critères à retenir pour l’évaluation des compétences, pour être pertinents, doivent distinguer ceux qui sont orientés vers le but de la tâche, notamment dans sa dimension pragmatique, ceux qui sont orientés vers l’action, les processus d’accomplissement de la tâche par exemple et ceux qui sont orientés vers le produit de l’activité. Les critères orientés vers les buts sont ceux qui permettent d’évaluer l’adéquation de la performance réalisée par un élève aux finalités, buts et objectifs généraux de la formation. Ils évaluent également l’adéquation et la cohérence du produit de l’activité de l’élève par rapport à des normes, sociales ou professionnelles ( intelligibilité, acceptabilité, fonctionnalité du produit ). En ce sens, il peut y avoir maîtrise complète ou seulement partielle du faisceau de compétences ( capacité 1 ) considéré pour l’accomplissement de la tâche proposée ou encore absence totale de maîtrise. Les critères orientés vers l’action permettent d’évaluer les processus mis en oeuvre dans l’exécution d’une tâche : choix de techniques, de méthodes; choix d’opérations, d’outils; mobilisation de savoirs; décentration métacognitive et ajustements; durée impartie... Ces critères sont centrés sur les objectifs spécifiques de la formation et plus particulièrement sur les compétences spécifiques à mobiliser pour la réussite de la tâche proposée. Il n’y a, le plus généralement, que deux possibilités d’accomplissement : réussite ou non-réussite, cohérence ou incohérence, validité ou non-validité. Les critères orientés vers le produit l’évaluent en tant que tel, indépendamment de sa portée pragmatique et des processus et conditions de sa réalisation. L’évaluation porte donc sur la forme et le contenu du produit : esthétique, correction, exactitude... Pour illustrer ce propos, prenons l’exemple d’une tâche en situation : prendre la parole, de façon adaptée en termes de forme et de contenu, lors d’une réunion de travail. Deux critères principaux, orientés tout à la fois vers les buts, l’action et vers le produit, peuvent être retenus :
Les compétences spécifiques à maîtriser relèvent des différentes composantes d’un tâche : cognitives, conatives, affectives, gestuelles. On voit bien quelles seront les compétences à évaluer :
Toutes ces compétences n’ont pas le même statut. Certaines sont des compétences « globales » qui assurent l’essentiel de ce qui doit être maîtrisé : la pertinence sémantique et la cohérence pragmatique du discours produit. D’autres, plus "locales", facilitent, améliorent certes la pertinence et la cohérence du discours mais sans toujours le rendre inacceptable si elles ne sont pas maîtrisées. Ainsi en est-il, par exemple, de certaines caractéristiques syntaxiques qui peuvent rendre un discours formellement incorrect sans pour autant altérer sa portée sémantico-pragmatique : le destinataire perçoit le sens et l’intention du propos. La non-réussite formelle ( syntaxe fautive 29 ) n’est pas un critère de non-réussite par rapport au but de la tâche. On pourra cependant évaluer la tâche comme partiellement réussie puisque certaines compétences caractéristiques ne sont pas maîtrisées. Pour évaluer toutes ces compétences, constituées en critères, la prise en compte du seul produit ne suffit pas; il faut également élaborer des instruments d’observation de l’activité de l’élève, des processus qu’il met en oeuvre tant dans ses stratégies que dans ses méthodes de résolution.
Séquence d’apprentissage : quand évaluer ? a- Les moments de l’évaluation Comme le montre la figure, les moments de l’évaluation sont très fréquents en cours de séquence d’apprentissage. Ils ouvrent et ferment toute séance de travail. Il est même pratiquement impossible, dans des conditions habituelles, de les observer tous, surtout si l’on y intègre ceux nécessaires à l’évaluation des tâches et activités de consolidation, d’approfondissement, de soutien ou de remédiation qui ne figurent pas sur ce schéma. Quelques-uns de ces moments, toutefois, doivent absolument être respectés; ainsi, il n’est pas possible de faire l’économie des différentes évaluations formatives, pronostiques ou diagnostiques, qui interviennent en fin de séance de travail parce qu’elles sont les indicateurs principaux des apprentissages réalisés ou à réaliser. C’est en fonction des résultats à ces évaluations que le professeur pourra décider des activités à proposer à un élève : consolidation des apprentissages, soutien - notionnel ou méthodologique -, remédiation. Dans ce cas, l’objet de l’évaluation se confond avec les activités d’apprentissage définis pour cette séance. La tâche définie dans l’objectif spécifique de la séance doit, en effet, permettre à l’élève de mettre en oeuvre des compétences diverses. Ni les activités de réinvestissement, ni celles qui ne font pas l’objet de l’apprentissage spécifique ne devraient être évaluées, si ce n’est les premières parfois, de façon sommative. Mais cela multiplie les critères d’évaluation, de même que les instruments d’évaluation. Il est donc plus sage de limiter, dans la plupart des cas, l’évaluation formative aux apprentissages réalisés à l’occasion de la tâche proposée. Quant à l’évaluation sommative, il faut insister sur le fait qu’elle n’est possible que pour évaluer des apprentissages consolidés :
Elle devrait donc n’intervenir qu’en fin de séquence, éventuellement avec un temps de latence permettant un réel apprentissage. Bien entendu, cela remet en cause une pratique courante dans l’institution scolaire : la multiplication des notes et des relevés de notes comme indicateur du travail accompli par un élève 31. Tout le monde - parents, élèves, enseignants et administration scolaire - semble investir les notes d’une fonction certainement excessive :
La pratique des différentes formes d’évaluation, au début, pendant et à la fin des apprentissage devrait conduire à relativiser l’importance de notes trop fréquentes, en ce sens qu’elles n’auraient, dans ce contexte, que peu de pertinence. Mieux vaut, certainement, n’obtenir qu’une seule note, à l’issue d’une séquence d’apprentissage, mais qui fasse réellement la « somme » des apprentissages réalisés et consolidés. C’est d’ailleurs ce que préconisent, à la suite de B.S. BLOOM, les théoriciens de la pédagogie de maîtrise 33 :
b- Apprentissages et évaluation
Sans vouloir forcer le trait, on ne peut nier que le propos de J.-P. ASTOLFI corresponde à une réalité trop fréquente. Il pose de façon aiguë la question de ce qui est exactement évalué lorsqu’un temps trop court sépare le moment de la présentation des savoirs, souvent abusivement tenu comme un moment d’apprentissage, et celui de l’évaluation, qu’elle soit formative ou sommative d’ailleurs. Une séance d’apprentissage est un moment de contact de l’élève avec un objet d’apprentissage, parfois de premier contact. Il est rare qu’elle soit également un moment d’appropriation, tout simplement parce que celle-ci nécessite, outre l’acquisition des savoirs, leur consolidation et leur assimilation. Et seuls le temps et l’exercice le permettent. Il en résulte, qu’à suivre de trop près le repérage 35 des objets d’apprentissage proposés, l’évaluation court le risque de se tromper de cible. J.-P. ASTOLFI 36 note fort justement que
On n’évalue donc que la capacité d’attention de l’élève, l’efficacité de sa mémoire immédiate, le poids relatif du conflit entre ses représentations spontanées et ses représentations « apprises », ou tout autre facteur de ce type. Il semble, par conséquent, nécessaire de différer le moment de l’évaluation pour lui assurer une validité et une cohérence suffisantes. Dans ce sens, il faudrait être plus que circonspect face à des pratiques comme celles du contrôle en cours de formation qui, souvent, consiste à évaluer ( de façon sommative ) des apprentissages maîtrisés, certes, mais insuffisamment ou momentanément, parce que l’évaluation intervient trop tôt dans le processus d’assimilation.
Certains outils sont plus adaptées que d’autres à l’évaluation de certaines capacités ou compétences. Celles-ci ne peuvent être appréhendées qu’à travers une performance de l’élève. Il faut, par conséquent adapter la forme de la performance à la compétence à évaluer. Comme le souligne Y. Abernot 37
Bien entendu, les outils d’évaluation seront très largement déterminés par les objectifs, mais il est possible, suivant en cela l’exemple d’Y. Abernot, de mettre en relation ces outils et la taxonomie du domaine cognitif proposée par B.S. Bloom. Les outils d’évaluation les plus fermés sont parfaitement adaptés à des objectifs dont le niveau d’exigence les situe sur les premiers degrés de cette taxonomie, alors qu’aux niveaux les plus élevés correspondent des outils plus ouverts. En utilisant la terminologie de J.P. Guilford 38, on peut estimer que les outils d’évaluation fermés font prioritairement appel à la pensée convergente, alors que les outils ouverts sont dédiés à la pensée divergente. Un tableau permet de donner une idée précise de ces correspondances; il faut toutefois ajouter qu’il n’a qu’une valeur indicative : en effet, une catégorie d’objectifs, à un niveau d’exigence déterminé, peut être évalué à l’aide de plusieurs types d’outils voisins. Les outils fermés, ceux dont les réponses peuvent généralement s’apprécier en juste ou faux, sont nombreux. Leur degré d’ouverture peut être modulé en fonction des compétences à évaluer et du type d’évaluation ( formative / sommative, normative / critérielle ) qu’on veut pratiquer 39.
Les outils d’évaluation ouverts requièrent de l’élève une plus grande maîtrise; ils mettent en oeuvre des compétences de plus haut niveau et supposent la maîtrise d’un faisceau de plus en plus large de compétences.
Ces outils sont parmi ceux qui sont le plus fréquemment utilisés, cela ne limite en rien la possibilité d’en imaginer d’autres. En ce domaine, tout dépend des compétences à évaluer, et les seuls outils pertinents sont ceux qui permettent d’évaluer avec le plus de précision et de la manière la plus fiable les compétences souhaitées. Parallèlement à ces outils d’évaluation, Y. ABERNOT 40 présente deux autres instrument, précieux pour le professeur, qui pourront efficacement le guider dans la mise en place d’un enseignement différencié : la matrice d’objectifs et le tableau des systèmes d’erreurs de l’élève. Une matrice brute d’objectifs permet de visualiser le déroulement d’une séquence d’apprentissage en fournissant au professeur une double information : le pourcentage des réussites par objectif et une visualisation du parcours de chaque élève dans la séquence. Le pourcentage de réussites par objectif permet d’évaluer leur pertinence par rapport au niveau de compétences de la classe. Ainsi, dans une perspective de pédagogie de maîtrise, des réussites inférieures à 80 % doivent alerter le professeur sur la difficulté excessive de l’objectif considéré; cela devrait lui permettre de proposer aux élèves, dans les séances de travail suivantes, des activités d’application adaptées aux réussites et non-réussites constatées. La matrice permet également de suivre le parcours individuel d’un élève et de voir où se situent les points de rupture dans la progression vers l’objectif général de la séquence. Une matrice ordonnée permet de constater les compétences acquises par la majorité des élèves ( à gauche ) et les élèves ayant maîtrisé le plus de compétences ( de haut en bas ). Le tableau des système d’erreurs est un autre outil d’évaluation et de régulation intéressant à utiliser dans la perspective d’une évaluation formative différenciée. Il exige une réflexion didactique pertinente sur les difficultés d’apprentissage d’une notion ou d’une compétence et permet, à cette condition, de repérer, au fil des travaux des élèves et des évaluations réalisées, les erreurs les plus systématiques. Le tableau recense toutes les difficultés d’apprentissage probables qu’un élève peut rencontrer dans l’exécution d’une tâche : difficultés liées aux représentations initiales, au produit demandé, aux savoirs et savoir-faire à mobiliser etc. Il fournit ainsi un « programme » de travail différencié en vue de surmonter ces obstacles. Dans l’exemple choisi, le système d’erreurs s’articule autour de la notion de récit. La tâche demandée consiste à produire une séquence narrative. La typologie des erreurs retenue ne concerne que le texte narratif et ses marques constitutives; d’autres erreurs ne sont pas prises en compte : lexique, syntaxe, orthographe... Elles peuvent faire l’objet d’un autre tableau qui regroupe les erreurs relatives à l’écriture d’un texte, quelle que soit sa nature. L’utilisation de ce tableau fait apparaître les erreurs récurrentes de l’élève et fournit donc au professeur un indicateur précieux qui lui permettra de proposer des travaux de remédiation appropriés : il apparaît, dans cet exemple - fictif, bien entendu, que la récurrence des erreurs dans l’utilisation du passé-simple ou celles relevant de la structuration du texte nécessitent de travailler plus particulièrement ces points en proposant à l’élève des activités qui tiennent compte également de la cause de ces erreurs.
Les difficultés de l’évaluation Il n’est peut-être pas inutile de terminer en rappelant quelques problèmes, souvent évoqués, liés à l’évaluation du travail des élèves. a- Fidélité La fidélité de l’évaluation est très fréquemment remise en question. En effet, c’est un lieu commun de signaler que les enseignants ne formulent pas les mêmes jugements devant le même produit à évaluer. Ainsi, F. Viallet et P. Maisonneuve 41 notent que
Il faut ajouter que, dès que l’on veut évaluer des attitudes par exemple 42, la subjectivité de l’évaluation et les jugements de valeur propres à l’évaluateur interviennent de façon plus importante encore. De même, tous les évaluateurs n’utilisent pas l’échelle d’évaluation dont ils disposent de manière identique. Certains l’utilisent dans sa totalité, de 0 à 20; d’autres la restreignent, n’allant pratiquement jamais en-deçà de 5 ou au-delà de 15. L’écart-type n’est donc pas le même selon les évaluateurs: certains, en ne donnant que des notes moyennes le restreignent; d’autres, au contraire, en accordant des notes extrêmes, obtiennent un écart-type plus important. On peut toutefois observer, avec Y. Abernot 43, que
Le problème de la validité de l’évaluation est l’un des plus épineux qui soit.
Or des " variables parasites " 45 viennent presque toujours interférer dans les pratiques d’évaluation. Quelques-unes de ces variables sont bien connues :
D’autres variables encore peuvent entrer en ligne de compte lors d’une évaluation, celles qu’Y. Abernot appelle les « variables choc » et les « variables de débordement ». Les « variables choc » sont représentées par les éléments sur lesquels les enseignants sont intraitables, ce qu’ils souhaitent rencontrer, ou au contraire ne jamais voir, dans une production d’élèves. Ces variables peuvent donc être positives ( idée développée par l’élève et qui « plaît » tout particulièrement à l’enseignant ) ou négatives ( si tel ou tel élément, des abréviations par exemple, apparaît dans un devoir, l’enseignant refuse de corriger ou note très sévèrement, en tout cas très en-dessous de la valeur « réelle » du travail fourni ). Les « variables de débordement » sont celles qui sont prises en compte dès que leur nombre dépasse un certain seuil, comme la goutte d’eau qui fait déborder le vase : la ponctuation, les accents, l’écriture... Si certaines peuvent constituer, parfois, des critères d’évaluation, d’autres, en revanche, sont plus difficiles à accepter comme tels. Faire entrer, dans une évaluation sommative des savoirs et des savoir-faire d’un élève, des paramètres comme par exemple le délai de remise d’un travail ou encore le comportement de cet élève, fausse tout particulièrement la validité de cette évaluation. Or beaucoup d’élèves en difficulté sont évalués sur des paramètres qui ne recouvrent pas toujours leurs capacités effectives, tant il est vrai qu’ils cumulent les « handicaps », cognitifs, procéduraux et comportementaux. A trop faire intervenir des variables de débordement, on se prive des moyens d’assurer les conditions de la réussite.
c- Sensibilité Une évaluation sensible doit être adaptée au produit à évaluer. Il n’est pas toujours nécessaire de noter un travail de 0 à 20. Dans certains cas, une évaluation dichotomique est suffisante : réussi / non réussi; dans d’autres, un élargissement de l’échelle d’évaluation peut être souhaitable : 40, 50... 100. C’est d’ailleurs ce qui se passe lorsque l’échelle de 0 à 20 est subdivisée par ½ ou ¼ de point : d’une échelle à 21 degrés on passe ainsi à une échelle à 81 degrés si les notes sont calculées au ¼ de point !
Si tous les problèmes évoqués - et ce sont loin d’être les seuls - peuvent donner à croire que les enseignants évaluent « n’importe comment », il ne faut pas perdre de vue que la grande majorité ont le sentiment d’évaluer honnêtement le travail de leurs élèves. L’évaluation est l’une des pratiques les plus sensibles du métier d’enseignant, l’une des plus difficiles aussi. Et c’est malheureusement aussi celle pour laquelle ils sont le moins préparés. Mais, au fond, une des ambiguïtés principales de l’évaluation ne réside-t-elle pas surtout dans le fait que si on sait assez souvent ce qui est évalué, on ne sait jamais avec précision qui est évalué?
- septembre 1996 -
NOTES
|