Evaluation

	L'évaluation
	modèles et pratiques

SOMMAIRE
	Qu'est-ce que l'évaluation ?
	Qu'est-ce qu'évaluer ?
	Un modèle de l'évaluation ( parmi d'autres )
	Une typologie des évaluations
	a	L'évaluation formative
	b	L'évaluation formatrice
	c	L'évaluation sommative
	Deux modalités d'évaluation
	a	L'évaluation normative
	b	L'évaluation critérielle
	Évaluer des compétences en situation
	Critérier l'évaluation des compétences
	Séquence d’apprentissage : quand évaluer ?
	a	Les moments de l’évaluation
	b	Apprentissages et évaluation
	Des outils pour l'évaluation
	Les difficultés de l'évaluation
	a	Fidélité
	b	Validité
	c	Sensibilité

Qu'est-ce que l'évaluation ?

On peut tenter une définition de l’évaluation scolaire en s’interrogeant sur ses buts. Jean CARDINET ¹ en définit quatre, fondamentaux :

« - améliorer les décisions relatives à l’apprentissage de chaque élève
   - informer sur sa progression l’enfant et ses parents
   - décerner les certificats nécessaires à l’élève et à la société
   - améliorer la qualité de l’enseignement en général. »

et précise qu’il ne peut s’agir d’évaluer de la même façon dans tous les cas. L’évaluation, en effet, même si elle porte sur le même objet, à savoir une production d’élève, comporte des fonctions différentes : pédagogique, sociale et institutionnelle.

Évaluer consiste donc essentiellement à fournir des informations à différents destinataires : élève(s), professeur lui-même, parents, administration scolaire, autres professeurs, société... surtout en vue de prendre des décisions : proposer des activités d’apprentissage, de soutien ou de remédiation ; décerner un diplôme ou certifier de la maîtrise de compétences; transformer les méthodes et les modalités de l’enseignement; etc. La diversité des destinataires engendre d’ailleurs, parce que la nature de l’information attendue est différente pour chacun, une première difficulté, fondamentale : il y a souvent incompatibilité, voire contradiction, entre les informations fournies aux uns et aux autres parce qu’elles ne sont pas fondées sur la même « logique » et parce qu’elles relèvent, par nature, de modèles différents de la relation pédagogique.

Si, d’autre part, on retient la définition de l’évaluation proposée par G. de LANDSHEERE ²

« Estimation par une note d’une modalité ou d’un critère considéré dans un comportement ou un produit. »

on est conduit à valider l’acception la plus triviale du terme, celle qui structure la représentation la plus largement partagée sur sa nature, mais aussi certainement la plus réductrice : évaluer, c’est toujours et principalement donner une note ³. Cette définition s’accorde avec le troisième but de l’évaluation défini par J. CARDINET ; elle n’est pas pertinente pour les autres.

Dans le même article, G. de LANDSHEERE, citant N.E. GRONLUND, précise toutefois que l’évaluation

« ... comprend à la fois la description qualitative et la description quantitative des comportements et comporte, en outre, des jugements de valeur concernant leur désirabilité. »

Il est là question de tout autre chose que d’une note qui « mesure » un comportement ou un produit, et c’est en cela que réside toute la difficulté, mais aussi toute l’ambiguïté de l’évaluation.

Qu’est-ce qu’évaluer ?

Il est certainement utile, pour répondre à cette question, de reprendre la distinction opérée par N. CHOMSKY entre compétence et performance.

La compétence d’un élève, si on la rapporte à l’évaluation de ses comportements et de ses productions, représente l’ensemble de ce qu’il est capable, potentiellement, d’accomplir. Sa performance représente, elle, l’actualisation partielle de sa compétence, dans un contexte et une production définis. Évaluer consistera donc à juger de la compétence d’un élève à travers sa performance, à extrapoler sa compétence à partir de comportements observables et/ou d’un produit réalisé. Y. ABERNOT ⁴, faisant également référence à CHOMSKY, note que

« ... l’évaluation est une tentative d’appréhension de la compétence sur un tout à partir d’une performance sur une partie. »

Un modèle de l’évaluation ( parmi d'autres ) ⁵

L’acte d’évaluation peut s’inscrire dans un triangle dont les sommets figurent les trois pôles entre lesquels s’affrontent le plus souvent les différentes conceptions, les différentes pratiques de l’évaluation.

Le RÉSULTAT de l’apprentissage est un produit ou un comportement qui montre ce que l’apprenant sait et sait faire au moment et dans les conditions où il est évalué. Il est, le plus souvent, un indicateur des apprentissages réalisés. Le jugement émis par l’évaluateur porte principalement sur la présence et la maîtrise de savoirs et de compétences et l’information évaluative produite sur ce résultat est de l’ordre de la réussite ou de la non-réussite en fonction des critères retenus.

La VALEUR du résultat de l’apprentissage est la traduction de ce résultat en note dont l’ambition est de s’inscrire dans un absolu étalonné : l’échelle de 0 à 20, ou toute autre échelle possible ⁶. L’information évaluative ne dit plus rien du produit évalué, des savoirs et des savoir-faire maîtrisés ou non, elle renvoie un jugement sur la qualité globale du travail accompli par l’élève. Donner une valeur au résultat d’un apprentissage est d’ailleurs une nécessité pour informer tous ceux qui ne sont pas présents dans la situation d’apprentissage ( parents, administration, société... ) et pour lesquels les informations sur la réussite ou la non-réussite des apprentissage ne sont pas des informations pertinentes, ou ne font pas partie d’un héritage socioculturel profondément et encore durablement partagé.

Les ACTIVITÉS MENTALES qui permettent les apprentissages et donc la mise en oeuvre des connaissances et des compétences forment le troisième pôle de cet ensemble. Il s’agit de tous les processus intellectuels, cognitifs, sociocognitifs, culturels etc., qui, sans se manifester directement et de façon visible, sont pourtant indispensables à la réussite d’une tâche. L’information évaluative consiste, dans ce cas, à faire l’hypothèse, à partir du produit réalisé, de la mise en oeuvre d’opérations mentales dont seule la maîtrise permet d’atteindre le résultat attendu. Le jugement de l’évaluateur porte alors sur la mobilisation par l’apprenant de stratégies et de moyens d’apprentissage adaptés. La possibilité d’évaluer ces activités mentales, surtout celles de haut niveau, passe, bien entendu, également par la mise à distance métacognitive qui en est l’instrument privilégié. Nous sommes là de plain-pied dans le modèle de l’apprendre que propose J. BERBAUM ⁷ ainsi que dans ce que VYGOTSKY appelle « conscience après » , retour réflexif sur les réussites et les non-réussites pour en analyser les causes ⁸. Il est aisé de voir pourquoi ces trois pôles s’affrontent toujours dans la pratique de l’évaluation. C’est qu’ils ne répondent ni au même but, ni aux mêmes modalités.

Le pôle ACTIVITÉ et le pôle RÉSULTAT sont en interaction parce que l’un dit toujours quelque chose de l’autre; et surtout parce que si l’objectif premier de l’enseignement devient la maîtrise des savoirs et des compétences relatifs aux différents domaines de connaissance, ainsi que leur transfert optimal dans de nouveaux domaines, alors le resserrement des liens entre ces deux pôles est une nécessité. En effet, un même résultat peut être obtenu par des stratégies différentes ( et c’est là le pari même de toute différenciation pédagogique ).

Par contre, il ne peut y avoir interaction entre le pôle RÉSULTAT et le pôle VALEUR puisqu’il s’agit d’une traduction de l’un dans le code particulier de l’autre. Une fois un produit traduit en note, lorsque la note seule est la trace des apprentissages, il n’est plus possible de se faire une idée exacte de ce qu’était ce produit, il n’est plus possible d’y revenir. Seule subsiste la mesure.

Quant aux pôles VALEUR et ACTIVITÉS MENTALES, il est strictement impossible de les mettre en relation. Une note ne peut donner d’indication sur des processus mentaux. Il est même possible, en forçant quelque peu le trait, de considérer que certains résultats de moindre valeur peuvent être dus à la mobilisation par l’apprenant de processus cognitifs de haut niveau ( et ce sont précisément ceux que l’enseignement devrait chercher à développer ). En effet, il peut être plus facile de réussir une tâche en faisant appel à un apprentissage par cœur, ou même à un conditionnement ⁹, plutôt que par la mise en oeuvre de stratégies et d’opérations mentales plus élaborées mais actuellement moins maîtrisées. C’est d’ailleurs ce qui se passe lorsque ne sont évalués que des savoirs déclaratifs que les élèves sont capables d’énoncer mais incapables d’utiliser.

Une typologie des évaluations

Il est d’usage, depuis quelques années déjà, de distinguer trois grands types d’évaluation : l’évaluation formative, l’évaluation formatrice et l’évaluation sommative.

a- L’évaluation formative

« Évaluation intervenant, en principe, au terme de chaque tâche d’apprentissage et ayant pour objet d’informer élève et maître du degré de maîtrise atteint et, éventuellement, de découvrir où et en quoi un élève éprouve des difficultés d’apprentissage, en vue de lui proposer ou de lui faire découvrir des stratégies qui lui permettent de progresser.»
G. de Landsheere ¹⁰

C’est un mode d’évaluation dont l’objectif principal est donc la régulation du processus d’apprentissage. Il s’agit donc, essentiellement, d’un processus de rétroaction. En fournissant à l’apprenant, qui en est le principal destinataire ¹¹, des informations sur ses progrès par rapport à un objectif déterminé, elle permet

	d’intervenir dans le processus d’apprentissage pour infléchir les modalités de l’action en cours;
	de transformer les contenus d’apprentissage, de permettre à l’apprenant de transformer ou de varier ses méthodes et ses stratégies d’apprentissage;
	de décider des actions d’aide nécessaires ( soutien notionnel, aide méthodologique... ).

En ce sens, l’évaluation formative permet donc de remplir les deux premières fonctions assignées à l’évaluation par J. CARDINET.

C’est également une évaluation qui permet à l’apprenant d’évaluer lui-même ce qu’il sait, ce qu’il ne sait pas, ce qui fait qu’il ne réussit pas et, en ce sens, elle un chemin vers l’auto-évaluation.

Enfin, c’est un type d’évaluation qui permet de mettre en place une pédagogie de la réussite, source de motivation.

Faut-il préciser que l’évaluation formative consiste à fournir des informations, des appréciations sur le travail, les activités et les productions de l’apprenant ? Elle est irréductible donc à un résultat chiffré.

L’évaluation formative n’est pas, dans tous les cas, qu’une évaluation terminale, qui se situerait toujours après une tâche; elle constitue également, par nature, une évaluation diagnostique ou une évaluation pronostique qui peut donc intervenir en début de séquence d’apprentissage ou avant une séance de travail subordonnée à un objectif spécifique.

Évaluation diagnostique, car elle permet alors de mettre en lumière les difficultés liées à l’apprentissage et donne des indications sur les obstacles à surmonter; en ce sens elle est une évaluation qui sert à mettre en place des activités propres à lever ces obstacles d’apprentissage. Comme le précise J. CARDINET ¹².

« L’évaluation diagnostique porte [...] sur les acquisitions et les démarches, sur les aptitudes, sur l’histoire et le contexte social de l’élève. Elle s’appuie sur une analyse de ses productions et sur l’observation de son comportement pour formuler des hypothèses, et suggérer des remèdes. »

Évaluation pronostique, dans le sens où elle permet de déterminer si un élève maîtrise les pré-requis nécessaires pour la poursuite des apprentissages prévus dans une séquence. Elle renvoie, alors, des informations sur les apprentissages prioritaires à consolider, à s’approprier en vue de la réussite des apprentissages ultérieurs.

b. L’évaluation formatrice

D’après C. HADJI ¹³, l’évaluation formatrice est une

« ... évaluation qui, en fonction de l’idée que seul l’élève peut vraiment réguler son activité d’apprentissage, et de la prise en compte de l’importance de la représentation des buts à atteindre, vise l’appropriation par l’apprenant des critères de réalisation du produit et d’appréciation de la production, l’activité didactique se centrant pour cela sur des tâches concrètes et non sur des objectifs formels. »

Ce type d’évaluation est, on le voit, essentiellement conçu comme un outil spécifique d’apprentissage qui a sa place dans le processus même de l’apprentissage. Elle permet

	le progrès vers l’expertise et l’autonomie de l’élève en le conviant à mettre en oeuvre des procédures métacognitives à chaque moment de son apprentissage;
	l’émergence de représentations cohérentes nécessaires à la maîtrise : représentation du produit, représentation de la tâche, représentation des buts...;
	l’implication active de l’élève dans le processus d’apprentissage qui donne du sens à l’action.

L’évaluation formatrice est donc le vecteur d’une réelle appropriation des savoirs et des savoir-faire.

c. L’évaluation sommative

L’accent, ici, est mis sur la notion de produit de l’activité d’un élève. Son destinataire est prioritairement l’institution scolaire et la société. L’objectif principal de l’évaluation sommative est un objectif de certification. En effet, elle permet

	de fournir un bilan qui situe l’apprenant par rapport à une norme ou à des critères établis;
	de prendre des décisions de type institutionnel, obtention d’un diplôme, passage dans une classe supérieure par exemple;
	de situer les apprenants les uns par rapport aux autres, à l’intérieur d’un ou de plusieurs groupes.

L’évaluation sommative, faisant la somme des apprentissages réalisés, se traduit le plus souvent dans une note. J. CARDINET ¹⁴ note que l’évaluation sommative

« ... porte sur un objectif terminal, plutôt que sur des savoirs partiels : si l’on fait l’effort d’établir un bilan, on voudrait qu’il renseigne sur quelque chose d’important et d’utile socialement [...]. Elle porte normalement sur des résultats acquis de façon relativement stable, car totaliser des acquisitions qui s’oublieraient immédiatement n’aurait pas de sens. »

et il ajoute

« On tend souvent à confondre ces deux évaluations [formative et sommative], en parlant d’un niveau global de compétences caractéristiques d’un bon ou d’un mauvais élève. Cependant, tant que l’élève est encore en train d’apprendre, un bilan est prématuré. Pour prendre des décisions d’ordre pédagogique, dans la pratique journalière de la classe, c’est une évaluation formative dont on a besoin : il faut se garder de juger trop vite le niveau général de réussite d’un élève. »

Une recommandation à méditer, en tout cas, pour redonner à l’évaluation sommative sa véritable fonction : faire le bilan des apprentissages appropriés et consolidés.

Ailleurs, il distingue l’évaluation sommative externe de l’évaluation sommative interne. La première

« juge le résultat social de l’enseignement. [...] elle certifie que le but final de la formation a été atteint, donc que les élèves ont acquis les compétences dont la société a besoin. [Elle] contrôle la maîtrise de situations réelles, et donc extérieures à l’école. » ¹⁵

La seconde

« juge les savoirs et les savoir-faire scolaires. [...] Elle ne prépare pas directement à la vie active. C’est pourquoi les examens scolaires se centrent presque exclusivement sur les disciplines enseignées, conçues comme des outils indispensables pour des formations ultérieures. » ¹⁶

Deux modalités d’évaluation

Une évaluation, formative ou sommative, peut être conçue selon deux modalités : une évaluation qui compare les élèves les uns aux autres, dans le groupe classe ou entre des groupes de même niveau, et une évaluation qui permet de certifier ce que les élèves peuvent faire et ne peuvent pas faire, indépendamment les uns des autres, en rapportant cette certification à un ensembles de critères prédéfinis.

On parlera, dans le premier cas, d’évaluation normative, et, dans le second, d’évaluation critérielle ¹⁷.

a- L’évaluation normative

L’évaluation normative permet

« ... de situer un individu par rapport à une norme, constituée par les performances d’un groupe de référence.» G. de Landsheere ¹⁸

Elle traduit donc les résultats d’un apprentissage, le produit d’une tâche, en termes de comparaison avec les résultats des autres élèves de la classe voire avec des élèves appartenant à d’autres groupes de même niveau. Elle permet ainsi de situer chaque élève par rapport à la moyenne de son groupe; c’est cette moyenne qui représente la norme du groupe en question.

Il est capital de bien comprendre que ce n’est pas par rapport à une moyenne absolue qu’on classe les élèves. En effet, la moyenne normative est toujours fonction du niveau d’un groupe de référence donné parce que, lors de l’élaboration de l’épreuve d’évaluation, il est nécessaire d’insérer des questions faciles, des questions de difficulté moyenne et des questions difficiles dans le but de discriminer les élèves les uns par rapport aux autres.

A l’occasion d’une évaluation normative, les élèves sont classés du plus fort au plus faible parce que l’épreuve a été construite dans ce sens; on prend essentiellement en compte l’écart de la moyenne de chacun par rapport à la moyenne du groupe dont il fait partie; on fait en sorte que la distribution des élèves s’opère selon une courbe en cloche (cf. figure) - c’est là d’ailleurs l’indicateur de la validité de ce type d’évaluation.

Ainsi, dans l’idéal, les élèves devraient se répartir selon cette distribution « normale » définie par G. de LANDSHEERE ¹⁹

« Distribution symétrique de notes par rapport à la moyenne, les notes se raréfiant à mesure que l’on s’en éloigne, selon une équation mathématique (fonction de Laplace-Gauss). La représentation graphique de cette distribution revêt la forme d’une courbe en cloche, appelée courbe de Laplace-Gauss. »

Un écart-type, noté s ( sigma ), permet de mesurer la dispersion de la série des notes. Il se calcule selon la formule ²⁰

où

	n_iest le nombre d’apparition de chaque note
	x_i représente chaque note de l’échelle choisie
	m est la moyenne des notes données
	N est le nombre total des copies corrigées

Si cet écart-type est d’environ 2,5, la distribution des notes est alors dite " normale " et les élèves sont distribués sur la courbe de la façon suivante :

	99 % obtiennent une note comprise entre 4 et 17;
	95 % une note de 7 à 14;
	68 % une note entre 9 et 12.

Enfin, comme le souligne C. HADJI ²¹

« ... la norme est, d’un côté, purement descriptive, puisque ce sont des performances réelles qui la définissent. On s’y réfère bien, toutefois, pour formuler un jugement de valeur, dans la mesure où la possibilité donnée de situer une performance par comparaison n’est utilisée que pour apprécier celle-ci. Au-delà du constat, c’est la prise de conscience de la valeur de la place occupée qui importe. Les "réponses" de l’auteur de la performance sont bien "jugées" par comparaison avec celles du groupe de référence. L’usage du terme de norme est, certes, très ambigu, sinon "regrettable" comme le dit G. de Landsheere. »

L’évaluation normative trouve également sa place dans des dispositifs pédagogiques différenciés. Dans ce cas cependant, elle se présente de façon quelque peu différente : l’objectif n’est plus de distribuer les élèves dans une perspective de classement les uns par rapport aux autres, mais bien d’assurer la progression de tous vers les objectifs retenus, en donnant notamment à chacun tous les moyens ( temps, aide notionnelle et méthodologique... ) d’atteindre un niveau optimal de progrès.

Ce qu’évalue alors une telle épreuve normative c’est la quantité des progrès, bien sûr, c’est-à-dire les différents apprentissages réalisés, mais surtout la qualité de la progression vers un objectif déterminé. On pourrait penser qu’il s’agit là pratiquement d’une évaluation de type formatif, à cette exception près que l’épreuve est sommative, non critérielle, parce que chaque élève est évalué en fonction de son point de départ dans la séquence d’apprentissage, en vertu de l’évaluation initiale réalisée. La courbe des notes devrait se rapprocher dans ce cas d’une courbe en " J ".

« Alors que la courbe de Gauss est sous-tendue par une logique de discrimination, la courbe en J s’inscrit dans une logique d’homogénéisation. » B. Maccario ²²

b- L’évaluation critérielle

L’évaluation critérielle vérifie les performances d’un élève en fonction d’un ensemble de compétences ( savoirs, savoir-faire, savoir-être ) constituées en critères par rapport à un modèle défini par avance. Dans l’enseignement technique par exemple, les référentiels de diplômes sont ces modèles, à un niveau donné et pour une formation donnée.

R. Glaser, cité par V. de Landsheere ²³, précise

« Comme les tests critériels sont spécialement conçus pour fournir une information ( directement interprétable ) sur les niveaux de performance, ces niveaux doivent être définis avant de construire le tes. Le but du testing est d’évaluer la position de chaque individu par rapport à ces niveaux. »

Contrairement à l’évaluation normative, la démarche critérielle ne situe pas les élèves les uns par rapport aux autres; ce qui est pris en compte, c’est l’écart des performances ( que ce soit en plus ou en moins ) par rapport à une sorte de « capital-cible » , pour reprendre l’expression de V. de Landsheere ²⁴. Le but poursuivi est, bien entendu, 100 % de réussite.

Il n’y a pas de questions trop faciles ou de questions plus difficiles puisqu’il n’est pas question d’aboutir à un classement des élèves sur une échelle ordinale. Les tâches proposées permettent d’évaluer à quel point

« d’un continuum dans l’acquisition de la connaissance, allant de l’absence totale de compétence à la performance parfaite » ²⁵

se situe un élève.

Évaluer des compétences en situation

Une tâche inscrite dans une situation réelle donnée, aussi proche que possible d’une situation sociale ou professionnelle, est particulièrement complexe à évaluer. On se trouve, en effet, sur un terrain où les facteurs cognitifs, affectifs, conatifs et gestuels sont massivement présents et où ils interagissent constamment. Dans des situations de ce type, les connaissances et les savoirs ( facteur cognitif ), les actions ( facteur gestuel ), les comportements ( facteur conatif ) et les émotions ( facteur affectif ) sont intimement liés.

Si l’évaluation a lieu en cours de formation ( évaluation formative critérielle ), certaines compétences sont déjà acquises antérieurement à la tâche, on peut alors évaluer leur degré de transfert si la tâche s’inscrit dans une situation nouvelle par rapport à la situation d’apprentissage. Si ce n’est pas le cas, on évaluera leur degré de réinvestissement.

D’autres ont fait l’objet des apprentissages visés en cours de séquence. Ce sont ces compétences qui seront évaluées prioritairement, mais sans négliger leurs relations avec les autres paramètres de la situation. Les critères de performance retenus pour l’évaluation devront prendre en compte le caractère facilitateur ou non des autres compétences mises en oeuvre dans la situation.

Certaines, enfin, ne sont pas évaluées parce qu’elles n’ont pas fait l’objet d’apprentissages spécifiques. Il faut veiller alors à ce que la non-maîtrise de ces compétences-là ne rendent pas la tâche impossible ou problématique. Au contraire, les situations scolaires plus traditionnelles ne font intervenir, le plus souvent, que les dimensions cognitives ( connaissances sur les objets, surtout ) et gestuelles. Qui plus est, elles tendent à présenter ces compétences de manière unidimensionnelle en éliminant, souvent implicitement, la complexité des situations : évaluer une compétence telle que « décoder un message écrit » en la coupant de toute situation sociale ou professionnelle, la réduit à une activité « simple », facilement évaluable certes, mais considérablement appauvrie, sans enjeu réel. La même compétence, en situation, se conjugue avec un faisceau d’autres compétences qui lui sont irréductiblement liées; elle est plus difficile à maîtriser parce que d’autres compétences, de nature différente, interagissent avec elle; il est donc plus difficile de l’évaluer parce qu’il faut considérer en même temps les autres facteurs, les autres types de compétences à maîtriser et leurs relations; cela rend bien plus complexe la définition des critères de performance.

V. de Landsheere ²⁶ distingue quatre composantes principales de l’évaluation des compétences :

	le produit ( la compétence );
	les indicateurs de la présence de la compétence ²⁷;
	les instruments de mesure adéquats;
	le niveau requis.

Si la compétence à évaluer est une connaissance, déclarative ou procédurale, alors les indicateurs de sa présence sont des énoncés déclaratifs : connaissance, savoir-dire et savoir sur un savoir-faire. Ainsi, énoncer de façon correcte le théorème de Pythagore est un savoir-dire une connaissance. Expliquer la méthode de calcul de l’hypoténuse d’un triangle rectangle est un savoir sur un savoir-faire associé à des savoir-dire des connaissances ( concept de rectangle, angle droit, notion de carré... ).

Lorsque la compétence à évaluer est un savoir-faire, les indicateurs sont alors des actions, celles qui sont nécessaires, selon des stratégies et des méthodes imposées ou propres à l’élève, pour réussir la tâche fixée. Si ce qui importe, c’est la réussite de la tâche, seule l’observation de l’activité de l’élève permettra une évaluation cohérente. L’apprentissage se fait pendant l’action, l’évaluation également; mais bien entendu pas au même moment ou à l’occasion de la même tâche. Pour évaluer ces savoir-faire, il faudrait aller, avec P. MENDELSOHN ²⁸, jusqu’à faire l’éloge du « bricolage » :

« Bien que formés à raisonner à l’aide d’outils formels puissants, il faut bien reconnaître qu’il nous arrive souvent de bricoler des solutions ad hoc dans les situations de la vie quotidienne comme dans la vie professionnelle. Pour cela, nous utilisons les outils qui sont à la portée de notre main ( artefacts ), outils beaucoup plus rudimentaires mais souvent tout aussi efficaces que les modèles formels et abstraits. »

On peut évaluer le savoir-faire d’un élève dans le domaine de la formation des adverbes à partir des adjectifs en observant ses actions, ses méthodes, ses stratégies à l’occasion d’une tâche qui nécessite, entre autres, la mise en oeuvre de cette compétence.

Si l’évaluation porte sur un savoir-être, une attitude, alors l’indicateur de la présence d’une telle compétence doit être un comportement, habituel ou non. Ainsi, dans le travail d’un groupe, pourra-t-on évaluer les attitudes, positives ou négatives, d’un élève dans les différents domaines du travail de ce groupe : recherche d’information, interactions dans la poursuite de la tâche, régulation des activités et de la vie du groupe...

Critérier l’évaluation des compétences

Les critères à retenir pour l’évaluation des compétences, pour être pertinents, doivent distinguer ceux qui sont orientés vers le but de la tâche, notamment dans sa dimension pragmatique, ceux qui sont orientés vers l’action, les processus d’accomplissement de la tâche par exemple et ceux qui sont orientés vers le produit de l’activité. Les critères orientés vers les buts sont ceux qui permettent d’évaluer l’adéquation de la performance réalisée par un élève aux finalités, buts et objectifs généraux de la formation. Ils évaluent également l’adéquation et la cohérence du produit de l’activité de l’élève par rapport à des normes, sociales ou professionnelles ( intelligibilité, acceptabilité, fonctionnalité du produit ). En ce sens, il peut y avoir maîtrise complète ou seulement partielle du faisceau de compétences ( capacité 1 ) considéré pour l’accomplissement de la tâche proposée ou encore absence totale de maîtrise.

Les critères orientés vers l’action permettent d’évaluer les processus mis en oeuvre dans l’exécution d’une tâche : choix de techniques, de méthodes; choix d’opérations, d’outils; mobilisation de savoirs; décentration métacognitive et ajustements; durée impartie... Ces critères sont centrés sur les objectifs spécifiques de la formation et plus particulièrement sur les compétences spécifiques à mobiliser pour la réussite de la tâche proposée. Il n’y a, le plus généralement, que deux possibilités d’accomplissement : réussite ou non-réussite, cohérence ou incohérence, validité ou non-validité.

Les critères orientés vers le produit l’évaluent en tant que tel, indépendamment de sa portée pragmatique et des processus et conditions de sa réalisation. L’évaluation porte donc sur la forme et le contenu du produit : esthétique, correction, exactitude...

Pour illustrer ce propos, prenons l’exemple d’une tâche en situation : prendre la parole, de façon adaptée en termes de forme et de contenu, lors d’une réunion de travail.

Deux critères principaux, orientés tout à la fois vers les buts, l’action et vers le produit, peuvent être retenus :

	l’intelligibilité du message ( forme : phonologie et syntaxe );
	l’acceptabilité de ce message ( contenu sémantique et pragmatique ).

Les compétences spécifiques à maîtriser relèvent des différentes composantes d’un tâche : cognitives, conatives, affectives, gestuelles. On voit bien quelles seront les compétences à évaluer :

	Composantes cognitives ( savoirs )
		connaissances sur ce qu’est la situation réunion de travail : ses enjeux, ses formes, ses modalités...
		connaissances sur l’action : prendre la parole pour exposer, expliquer, argumenter, réfuter...
		connaissances sur les objets : thème de la réunion, informations et données pertinentes, matériel...
	Composantes conatives ( savoir-être )
		comportements à adopter dans cette situation : attitudes, nature des interactions verbales...
		habitudes à maîtriser : posturales, verbales...
	Composantes affectives ( savoir-être )
		émotions : maîtrise...
		jugements : pertinence, effets...
	Composantes gestuelles ( savoir-faire)
		demander / prendre la parole
		expliquer, illustrer, argumenter, réfuter...
		utiliser les différents outils de communication : voix, gestes, matériel audio-visuel...

Toutes ces compétences n’ont pas le même statut. Certaines sont des compétences « globales » qui assurent l’essentiel de ce qui doit être maîtrisé : la pertinence sémantique et la cohérence pragmatique du discours produit. D’autres, plus "locales", facilitent, améliorent certes la pertinence et la cohérence du discours mais sans toujours le rendre inacceptable si elles ne sont pas maîtrisées. Ainsi en est-il, par exemple, de certaines caractéristiques syntaxiques qui peuvent rendre un discours formellement incorrect sans pour autant altérer sa portée sémantico-pragmatique : le destinataire perçoit le sens et l’intention du propos. La non-réussite formelle ( syntaxe fautive ²⁹ ) n’est pas un critère de non-réussite par rapport au but de la tâche. On pourra cependant évaluer la tâche comme partiellement réussie puisque certaines compétences caractéristiques ne sont pas maîtrisées. Pour évaluer toutes ces compétences, constituées en critères, la prise en compte du seul produit ne suffit pas; il faut également élaborer des instruments d’observation de l’activité de l’élève, des processus qu’il met en oeuvre tant dans ses stratégies que dans ses méthodes de résolution.

Séquence d’apprentissage : quand évaluer ?

a- Les moments de l’évaluation

Comme le montre la figure, les moments de l’évaluation sont très fréquents en cours de séquence d’apprentissage. Ils ouvrent et ferment toute séance de travail. Il est même pratiquement impossible, dans des conditions habituelles, de les observer tous, surtout si l’on y intègre ceux nécessaires à l’évaluation des tâches et activités de consolidation, d’approfondissement, de soutien ou de remédiation qui ne figurent pas sur ce schéma.

Quelques-uns de ces moments, toutefois, doivent absolument être respectés; ainsi, il n’est pas possible de faire l’économie des différentes évaluations formatives, pronostiques ou diagnostiques, qui interviennent en fin de séance de travail parce qu’elles sont les indicateurs principaux des apprentissages réalisés ou à réaliser. C’est en fonction des résultats à ces évaluations que le professeur pourra décider des activités à proposer à un élève : consolidation des apprentissages, soutien - notionnel ou méthodologique -, remédiation.

Dans ce cas, l’objet de l’évaluation se confond avec les activités d’apprentissage définis pour cette séance. La tâche définie dans l’objectif spécifique de la séance doit, en effet, permettre à l’élève de mettre en oeuvre des compétences diverses. Ni les activités de réinvestissement, ni celles qui ne font pas l’objet de l’apprentissage spécifique ne devraient être évaluées, si ce n’est les premières parfois, de façon sommative. Mais cela multiplie les critères d’évaluation, de même que les instruments d’évaluation. Il est donc plus sage de limiter, dans la plupart des cas, l’évaluation formative aux apprentissages réalisés à l’occasion de la tâche proposée.

Quant à l’évaluation sommative, il faut insister sur le fait qu’elle n’est possible que pour évaluer des apprentissages consolidés :

« Elle porte normalement sur des résultats acquis de façon relativement stable, car totaliser des acquisitions qui s’oublieraient immédiatement n’aurait pas de sens. » J. Cardinet ³⁰

Elle devrait donc n’intervenir qu’en fin de séquence, éventuellement avec un temps de latence permettant un réel apprentissage. Bien entendu, cela remet en cause une pratique courante dans l’institution scolaire : la multiplication des notes et des relevés de notes comme indicateur du travail accompli par un élève ³¹. Tout le monde - parents, élèves, enseignants et administration scolaire - semble investir les notes d’une fonction certainement excessive :

« Un enfant qui « n’apporte » pas beaucoup de notes avec une périodicité régulière devient un enfant qui n’apprend rien, de même les enseignants seront jugés à la quantité de notes remises [...] Ainsi les parents exercent fréquemment sur l’institution scolaire une réelle pression pour que le système de notes, parfois celui du classement, soit valorisé. » C. Delorme ³²

La pratique des différentes formes d’évaluation, au début, pendant et à la fin des apprentissage devrait conduire à relativiser l’importance de notes trop fréquentes, en ce sens qu’elles n’auraient, dans ce contexte, que peu de pertinence. Mieux vaut, certainement, n’obtenir qu’une seule note, à l’issue d’une séquence d’apprentissage, mais qui fasse réellement la « somme » des apprentissages réalisés et consolidés. C’est d’ailleurs ce que préconisent, à la suite de B.S. BLOOM, les théoriciens de la pédagogie de maîtrise ³³ :

« A la fin de la séquence des unités d’enseignement ( ou à une échéance fixée par l’institution, par ex., fin de trimestre ), les résultats des élèves sont évalués par une épreuve sommative à référence critérielle. Si les procédés d’évaluation formative et de remédiation ont bien fonctionné tout au long de la séquence, un pourcentage très élevé d’élèves ( 80%, voire 90% ) devrait atteindre les critères de maîtrise fixés pour l’épreuve sommative. »

b- Apprentissages et évaluation

« ... la fonction remplie par l’école est [...] celle d’une présentation des savoirs, immédiatement suivie de leur évaluation. Mais entre les deux, le temps essentiel de l’appropriation se trouve comme escamoté, laminé. » ³⁴

Sans vouloir forcer le trait, on ne peut nier que le propos de J.-P. ASTOLFI corresponde à une réalité trop fréquente. Il pose de façon aiguë la question de ce qui est exactement évalué lorsqu’un temps trop court sépare le moment de la présentation des savoirs, souvent abusivement tenu comme un moment d’apprentissage, et celui de l’évaluation, qu’elle soit formative ou sommative d’ailleurs.

Une séance d’apprentissage est un moment de contact de l’élève avec un objet d’apprentissage, parfois de premier contact. Il est rare qu’elle soit également un moment d’appropriation, tout simplement parce que celle-ci nécessite, outre l’acquisition des savoirs, leur consolidation et leur assimilation. Et seuls le temps et l’exercice le permettent. Il en résulte, qu’à suivre de trop près le repérage ³⁵ des objets d’apprentissage proposés, l’évaluation court le risque de se tromper de cible. J.-P. ASTOLFI ³⁶ note fort justement que

« Lorsque, après une leçon qui porte sur une notion nouvelle, suivie de deux ou trois exercices d’application, l’enseignant décide d’une évaluation notée, il ne se rend pas compte que, au moins pour une fraction de la classe, ce moment, dit d’évaluation, est souvent le premier où les élèves sont vraiment... en situation d’apprentissage; autrement dit le premier où ils ont à mobiliser de façon personnelle, des connaissances qui ne leur ont été antérieurement que présentées. »

On n’évalue donc que la capacité d’attention de l’élève, l’efficacité de sa mémoire immédiate, le poids relatif du conflit entre ses représentations spontanées et ses représentations « apprises », ou tout autre facteur de ce type. Il semble, par conséquent, nécessaire de différer le moment de l’évaluation pour lui assurer une validité et une cohérence suffisantes.

Dans ce sens, il faudrait être plus que circonspect face à des pratiques comme celles du contrôle en cours de formation qui, souvent, consiste à évaluer ( de façon sommative ) des apprentissages maîtrisés, certes, mais insuffisamment ou momentanément, parce que l’évaluation intervient trop tôt dans le processus d’assimilation.

Des outils pour l’évaluation

Certains outils sont plus adaptées que d’autres à l’évaluation de certaines capacités ou compétences. Celles-ci ne peuvent être appréhendées qu’à travers une performance de l’élève. Il faut, par conséquent adapter la forme de la performance à la compétence à évaluer. Comme le souligne Y. Abernot ³⁷

« La performance doit [...] porter sur un contenu représentatif de la compétence, mais aussi être produite sous une forme permettant de l’apprécier. Il suffit de proposer sur le même sujet un Q.C.M. ( questionnaire à choix multiple ) et un sujet de synthèse pour apprécier l’importance de la forme de l’évaluation sur le résultat. »

Bien entendu, les outils d’évaluation seront très largement déterminés par les objectifs, mais il est possible, suivant en cela l’exemple d’Y. Abernot, de mettre en relation ces outils et la taxonomie du domaine cognitif proposée par B.S. Bloom. Les outils d’évaluation les plus fermés sont parfaitement adaptés à des objectifs dont le niveau d’exigence les situe sur les premiers degrés de cette taxonomie, alors qu’aux niveaux les plus élevés correspondent des outils plus ouverts. En utilisant la terminologie de J.P. Guilford ³⁸, on peut estimer que les outils d’évaluation fermés font prioritairement appel à la pensée convergente, alors que les outils ouverts sont dédiés à la pensée divergente. Un tableau permet de donner une idée précise de ces correspondances; il faut toutefois ajouter qu’il n’a qu’une valeur indicative : en effet, une catégorie d’objectifs, à un niveau d’exigence déterminé, peut être évalué à l’aide de plusieurs types d’outils voisins.

Les outils fermés, ceux dont les réponses peuvent généralement s’apprécier en juste ou faux, sont nombreux. Leur degré d’ouverture peut être modulé en fonction des compétences à évaluer et du type d’évaluation ( formative / sommative, normative / critérielle ) qu’on veut pratiquer ³⁹.

	Q.C.M.	questionnaire à choix multiple; Il s’adapte idéalement au contrôle d’une connaissance, d’un savoir sur un savoir-faire. Complexité, difficulté des items sont variables.
	Tableau de production à double entrée	il s’agit, pour l’élève de proposer lui-même une réponse. C’est là que débutent les difficultés d’évaluation parce que des éléments parasites à la compétence évaluée peuvent interférer : dysorthographie, synonymie, réponse correcte mais non attendue etc.
	Question	le niveau d’exigence peut varier selon qu’il s’agit de reproduire un savoir ou d’appliquer une règle, une formule etc.
	Texte lacunaire	il permet de vérifier des connaissances et leur application dans un contexte particulier.
	Test de closure	c’est un texte à trous qui permet de mesurer la capacité de compréhension d’un élève et d’application d’une notion particulière.
	Questionnaire à réponses ouvertes courtes	forme et contenu de la réponse sont libres mais il n’est pas nécessaire de développer la réponse : donner une définition par exemple.
	Texte induit	il s’agit, pour l’élève de rédiger un texte à partir d’une liste de notions. Le degré d’ouverture de cet outil est très variable; il se situe, en fait, à la charnière des outils fermés et des outils ouverts.

Les outils d’évaluation ouverts requièrent de l’élève une plus grande maîtrise; ils mettent en oeuvre des compétences de plus haut niveau et supposent la maîtrise d’un faisceau de plus en plus large de compétences.

	Problème	il requiert une plus grande autonomie de l’élève dans la mesure où, après avoir analysé la situation, il doit choisir lui-même les savoirs et les savoir-faire à mobiliser, contrairement à l’exercice d’application d’une règle donnée.
	Dissertation	on peut regrouper sous ce terme générique tous les travaux pour lesquels l’élève doit mobiliser un grand nombre de savoirs et de compétences dans une production dont il est entièrement libre de définir la forme ( dans certaines limites cependant ) et le contenu. Difficilement évaluable de façon objective, une telle production fait également intervenir des paramètres d’évaluation qui ne sont pas toujours bien définis.
	Création	l’élève est entièrement libre quant au choix, à la forme, au contenu de son travail. Des facteurs comme les moyens utilisés, le temps imparti sont difficilement prévisibles. C’est la forme la plus ouverte d’épreuve, la plus difficile à juger également.

Ces outils sont parmi ceux qui sont le plus fréquemment utilisés, cela ne limite en rien la possibilité d’en imaginer d’autres. En ce domaine, tout dépend des compétences à évaluer, et les seuls outils pertinents sont ceux qui permettent d’évaluer avec le plus de précision et de la manière la plus fiable les compétences souhaitées.

Parallèlement à ces outils d’évaluation, Y. ABERNOT ⁴⁰ présente deux autres instrument, précieux pour le professeur, qui pourront efficacement le guider dans la mise en place d’un enseignement différencié : la matrice d’objectifs et le tableau des systèmes d’erreurs de l’élève.

Une matrice brute d’objectifs permet de visualiser le déroulement d’une séquence d’apprentissage en fournissant au professeur une double information : le pourcentage des réussites par objectif et une visualisation du parcours de chaque élève dans la séquence. Le pourcentage de réussites par objectif permet d’évaluer leur pertinence par rapport au niveau de compétences de la classe. Ainsi, dans une perspective de pédagogie de maîtrise, des réussites inférieures à 80 % doivent alerter le professeur sur la difficulté excessive de l’objectif considéré; cela devrait lui permettre de proposer aux élèves, dans les séances de travail suivantes, des activités d’application adaptées aux réussites et non-réussites constatées. La matrice permet également de suivre le parcours individuel d’un élève et de voir où se situent les points de rupture dans la progression vers l’objectif général de la séquence.

Une matrice ordonnée permet de constater les compétences acquises par la majorité des élèves ( à gauche ) et les élèves ayant maîtrisé le plus de compétences ( de haut en bas ).

Le tableau des système d’erreurs est un autre outil d’évaluation et de régulation intéressant à utiliser dans la perspective d’une évaluation formative différenciée. Il exige une réflexion didactique pertinente sur les difficultés d’apprentissage d’une notion ou d’une compétence et permet, à cette condition, de repérer, au fil des travaux des élèves et des évaluations réalisées, les erreurs les plus systématiques. Le tableau recense toutes les difficultés d’apprentissage probables qu’un élève peut rencontrer dans l’exécution d’une tâche : difficultés liées aux représentations initiales, au produit demandé, aux savoirs et savoir-faire à mobiliser etc. Il fournit ainsi un « programme » de travail différencié en vue de surmonter ces obstacles.

Dans l’exemple choisi, le système d’erreurs s’articule autour de la notion de récit. La tâche demandée consiste à produire une séquence narrative. La typologie des erreurs retenue ne concerne que le texte narratif et ses marques constitutives; d’autres erreurs ne sont pas prises en compte : lexique, syntaxe, orthographe... Elles peuvent faire l’objet d’un autre tableau qui regroupe les erreurs relatives à l’écriture d’un texte, quelle que soit sa nature.

L’utilisation de ce tableau fait apparaître les erreurs récurrentes de l’élève et fournit donc au professeur un indicateur précieux qui lui permettra de proposer des travaux de remédiation appropriés : il apparaît, dans cet exemple - fictif, bien entendu, que la récurrence des erreurs dans l’utilisation du passé-simple ou celles relevant de la structuration du texte nécessitent de travailler plus particulièrement ces points en proposant à l’élève des activités qui tiennent compte également de la cause de ces erreurs.

Les difficultés de l’évaluation

Il n’est peut-être pas inutile de terminer en rappelant quelques problèmes, souvent évoqués, liés à l’évaluation du travail des élèves.

a- Fidélité

La fidélité de l’évaluation est très fréquemment remise en question. En effet, c’est un lieu commun de signaler que les enseignants ne formulent pas les mêmes jugements devant le même produit à évaluer. Ainsi, F. Viallet et P. Maisonneuve ⁴¹ notent que

« [...] pour obtenir la "vraie note" d’une copie, il a été calculé que le nombre d’évaluateurs nécessaires était, pour chaque matière, le suivant : [...]

468 évaluateurs en français,

168 évaluateurs en anglais,

78 évaluateurs en mathématiques,

762 évaluateurs en philosophie,

95 évaluateurs en physique,

autrement dit, qu’il fallait faire les moyennes de 468, [168, 78...] notes d’une même copie pour obtenir une note quasi indiscutable. »

Il faut ajouter que, dès que l’on veut évaluer des attitudes par exemple ⁴², la subjectivité de l’évaluation et les jugements de valeur propres à l’évaluateur interviennent de façon plus importante encore.

De même, tous les évaluateurs n’utilisent pas l’échelle d’évaluation dont ils disposent de manière identique. Certains l’utilisent dans sa totalité, de 0 à 20; d’autres la restreignent, n’allant pratiquement jamais en-deçà de 5 ou au-delà de 15. L’écart-type n’est donc pas le même selon les évaluateurs: certains, en ne donnant que des notes moyennes le restreignent; d’autres, au contraire, en accordant des notes extrêmes, obtiennent un écart-type plus important.

On peut toutefois observer, avec Y. Abernot ⁴³, que

« D’une manière générale, les matières les plus normées (dictées, exercices de mathématiques) et les outils les plus fermés (questionnaire à choix multiples) donnent lieu à une fidélité meilleure et à une utilisation plus large de l’échelle de notes (on peut atteindre 0 ou 20). En revanche, en dissertation, version, travaux de synthèse, c’est plus rare. »

b- Validité

Le problème de la validité de l’évaluation est l’un des plus épineux qui soit.

« Non seulement un test valide doit mesurer ce qu’il prétend mesurer, mais, en outre, il ne doit pas mesurer quelque chose d’autre. » G. de Landsheere ⁴⁴

Or des " variables parasites " ⁴⁵ viennent presque toujours interférer dans les pratiques d’évaluation. Quelques-unes de ces variables sont bien connues :

	le favoritisme ( ou son contraire )	les élèves qui renvoient une image gratifiante au professeur sont surévalués, les autres souvent défavorisés;
	l’effet d’ancre	une copie est surévaluée lorsqu’elle est corrigée après une mauvaise, et inversement;la fatigue : au fur et à mesure des corrections, à cause de la fatigue du correcteur, la moyenne des notes attribuées a tendance à baisser, les écarts de notes entre copies sont plus importants. Ce phénomène est particulièrement visible dans les circonstances où un enseignant doit corriger un grand nombre de copies ( plus de 30 ).
	la stéréotypie	lorsqu’un enseignant a " établi " son jugement sur un élève, il a tendance à se conformer à ce jugement;l’effet de halo : la sympathie pour un candidat, sa façon de s’habiller, de s’exprimer, l’écriture, la présentation d’une copie etc., peuvent influencer l’évaluateur.

D’autres variables encore peuvent entrer en ligne de compte lors d’une évaluation, celles qu’Y. Abernot appelle les « variables choc » et les « variables de débordement ».

Les « variables choc » sont représentées par les éléments sur lesquels les enseignants sont intraitables, ce qu’ils souhaitent rencontrer, ou au contraire ne jamais voir, dans une production d’élèves. Ces variables peuvent donc être positives ( idée développée par l’élève et qui « plaît » tout particulièrement à l’enseignant ) ou négatives ( si tel ou tel élément, des abréviations par exemple, apparaît dans un devoir, l’enseignant refuse de corriger ou note très sévèrement, en tout cas très en-dessous de la valeur « réelle » du travail fourni ).

Les « variables de débordement » sont celles qui sont prises en compte dès que leur nombre dépasse un certain seuil, comme la goutte d’eau qui fait déborder le vase : la ponctuation, les accents, l’écriture... Si certaines peuvent constituer, parfois, des critères d’évaluation, d’autres, en revanche, sont plus difficiles à accepter comme tels. Faire entrer, dans une évaluation sommative des savoirs et des savoir-faire d’un élève, des paramètres comme par exemple le délai de remise d’un travail ou encore le comportement de cet élève, fausse tout particulièrement la validité de cette évaluation. Or beaucoup d’élèves en difficulté sont évalués sur des paramètres qui ne recouvrent pas toujours leurs capacités effectives, tant il est vrai qu’ils cumulent les « handicaps », cognitifs, procéduraux et comportementaux. A trop faire intervenir des variables de débordement, on se prive des moyens d’assurer les conditions de la réussite.

c- Sensibilité

Une évaluation sensible doit être adaptée au produit à évaluer. Il n’est pas toujours nécessaire de noter un travail de 0 à 20. Dans certains cas, une évaluation dichotomique est suffisante : réussi / non réussi; dans d’autres, un élargissement de l’échelle d’évaluation peut être souhaitable : 40, 50... 100. C’est d’ailleurs ce qui se passe lorsque l’échelle de 0 à 20 est subdivisée par ½ ou ¼ de point : d’une échelle à 21 degrés on passe ainsi à une échelle à 81 degrés si les notes sont calculées au ¼ de point !

Si tous les problèmes évoqués - et ce sont loin d’être les seuls - peuvent donner à croire que les enseignants évaluent « n’importe comment », il ne faut pas perdre de vue que la grande majorité ont le sentiment d’évaluer honnêtement le travail de leurs élèves. L’évaluation est l’une des pratiques les plus sensibles du métier d’enseignant, l’une des plus difficiles aussi. Et c’est malheureusement aussi celle pour laquelle ils sont le moins préparés.

Mais, au fond, une des ambiguïtés principales de l’évaluation ne réside-t-elle pas surtout dans le fait que si on sait assez souvent ce qui est évalué, on ne sait jamais avec précision qui est évalué?

« D’une manière générale, la note comporte toujours une auto-évaluation de l’enseignant. Ainsi l’enseignant consciencieux ne peut que s’interroger sur l’adaptation de ses méthodes et du contenu de son enseignement lorsque la majorité des notes est systématiquement inférieure à la moyenne. Il ne sera pas le seul à s’interroger, car les notes sont aussi un indice de ce qui se passe dans la classe et donne lieu à une évaluation extérieure. Les parents, l’administration s’inquiéteront de notes systématiquement trop hautes ou trop basses. L’image que l’enseignant veut se donner et donner aux autres est donc une variable parasite, sans rapport avec la qualité des productions des élèves, mais qui institue la distribution normale des notes comme règle : peu de très mauvaises notes, beaucoup de moyennes et peu d’excellentes. L’enseignant qui s’en éloigne risque de se faire une réputation parfois injuste et toujours difficile à vivre. » Y. Abernot ⁴⁶

- septembre 1996 -

NOTES

1 CARDINET, J. : (1988), Pour apprécier le travail des élèves, De Boeck, 2ème édition.     retour au texte

2 De LANDSHEERE, G. : (1992), Dictionnaire de l’évaluation et de la recherche en éducation, Presses Universitaires de France, 2ème édition revue et augmentée.     retour au texte

3 On peut en voir une confirmation dans bien des remarques qui accompagnent les notes des élèves et qui ne sont que redondance : ainsi il n’est pas rare que la note ou la moyenne de 10 soit assortie de la remarque, pourtant inutile puisque la note apporte la même information, « élève moyen ».     retour au texte

4 Y. Abernot, L’évaluation scolaire in J. Houssaye (ss la dir. de ), La pédagogie : une encyclopédie pour aujourd’hui. Paris : ESF Editeur, 1993.     retour au texte

5 Le modèle présenté ici s’inspire très largement des idées développées par Goéry Delacôte dans un ouvrage qui présente, entre autres, les thèses des tenants du courant contextualiste, en psychologie et en pédagogie, dans les pays anglo-saxons ( situated cognition et situated learning ).
G. Delacôte, Savoir apprendre, Les nouvelles méthodes. Paris : Editions Odile Jacob, 1996.     retour au texte

6 Une note de 0 à 20, une échelle réduite de 1 à 5, une échelle étendue par la prise en compte de ½ ou de ¼ de points, des lettres A, B, C... etc.     retour au texte

7 Jean Berbaum, Développer la capacité d’apprendre. Paris : ESF Éditeur, 1991.     retour au texte

8 L.S. Vygotsky, Pensée et langage. Paris : Editions Sociales, 1985.     retour au texte

9 Exercice d’automatisation d’un savoir ( ex. apprentissage par coeur des tables de multiplication ), d’un geste ( ex. tour de main professionnel ) ou d’une procédure ( ex. effectuer une règle de trois ). C’est ce que les psychologues appellent un drill, par opposition à un skill, habileté centrée sur une tâche.
Cf. G. de Land-sheere, op. cit., p. 84.     retour au texte

10 G. de Landsheere, op. cit., 1992, p. 125.     retour au texte

11 Le groupe-classe ou l’équipe pédagogique impliquée dans l’action éducative peuvent naturellement être également destinataires des informations fournies à l’occasion d’une évaluation formative.     retour au texte

12 J. Cardinet, op. cit., 1988, p. 23.     retour au texte

13 C. Hadji, L’évaluation, règles du jeu, Des intentions aux outils. Paris : ESF Éditeur, 1989.     retour au texte

14 J. Cardinet, op. cit., 1988, p. 15-16.     retour au texte

15 J. Cardinet, op. cit., 1988, p. 23.     retour au texte

16 J. Cardinet, ibid.     retour au texte

17 On parle souvent, à tort, d’évaluation critériée pour désigner l’évaluation critérielle. Au-delà des polémiques sur le « jargon » et l’inflation des termes dès qu’il est question de théoriser, il convient de préciser que toute évaluation, quelle qu’elle soit, est critériée en ce sens qu’elle repose sur des critères, subjectifs ou objectifs. Évaluer sans critères est impossible; même « la tête du client » est un critère, absurde certes, mais un critère quand même.     retour au texte

18 G. de Landsheere, op. cit., 1992, p. 308.     retour au texte

19 G. de Landsheere, op. cit., 1992, p. 82.     retour au texte

20 Voir Y. Abernot, Les méthodes d’évaluation scolaire. Paris : Bordas, 1988, Utilisation de l’échelle de notes de 0 à 20, pp. 16-22.     retour au texte

21 C. Hadji, op. cit., 1989, p. 48.     retour au texte

22 B. Maccario, Ce que valent nos enfants, L’école à l’heure de l’évaluation. Paris : Milan / Education, 1988, p. 64.     retour au texte

23 V. de Landsheere, Faire réussir, faire échouer; La compétence minimale et son évaluation. Paris : Presses Universitaires de France, 1988, p. 62.     retour au texte

24 V. de Landsheere, op. cit., 1988, p. 60.     retour au texte

25 R. Glaser cité par V. de Landsheere, op. cit., 1988, p. 62.     retour au texte

26 V. de Landsheere, op. cit.,1988, p. 63.     retour au texte

27 Ces indicateurs doivent permettre, parce que de nombreuses compétences sont des complexes de compétences, impossibles à décrire dans le détail, d’inférer la maîtrise de la compétence. V. de Landsheere propose de les spécifier à partir de la question : « Que tiendra-t-on pour preuve que le produit existe ? ».     retour au texte

28 P. Mendelsohn, Peut-on vraiment opposer «savoirs» et «savoir-faire» quand on parle d’apprentissage ?, in A. Bentolila (ss la dir. de), Savoirs et Savoir-faire, Les Entretiens Nathan. Paris : NATHAN Pédagogie, 1995, p.29.     retour au texte

29 L’évaluation de la compétence à former un énoncé syntaxiquement correct ne peut cependant prendre que la forme réussi / non-réussi. En effet, un énoncé ne peut pas être partiellement fautif : il l’est ou il ne l’est pas.     retour au texte

30 J. Cardinet, op. cit., 1988, p. 15.     retour au texte

31 Il n’est pas rare de rencontrer des enseignants qui notent systématiquement les travaux des élèves; lors du premier relevé de notes de l’année ( vers le début du mois de décembre ), ils présentent, pour chaque élève, plus de 10 notes, ce qui revient à noter un travail par semaine en moyenne.     retour au texte

32 C. Delorme, Évaluer autrement pour assurer une formation meilleure... est-ce possible ? in C.E.P.E.C., C. Delorme (ss la dir. de ), L’évaluation en questions; Paris : Les Editions E.S.F., 1987, p. 24.     retour au texte

33 L. Allal, Vers un élargissement de la pédagogie de maîtrise : processus de régulation interactive, rétroactive et proactive, in M. Hubermann ( ss la dir. de ), Assurer la réussite des apprentissages scolaires ? Les propositions de la pédagogie de maîtrise. Neuchâtel - Paris : Delachaux & Niestlé, 1988, p.89.     retour au texte

34 J.-P. Astolfi, L’école pour apprendre. Paris : E.S.F. Éditeur, 1992, p. 56.     retour au texte

35 Au sens que donne P. Meirieu à ce terme. Cf. P. Meirieu, L’École, mode d’emploi. Paris: E.S.F. Éditeur, 2ème édition 1985.     retour au texte

36 J.-P. Astolfi, op. cit., ibid.     retour au texte

37 Y. Abernot, op. cit. , 1988, p. 84.     retour au texte

38 in documents produits par l’équipe GEREX-SOUTIEN sous la direction de F. Chirivella, I.U.F.M. de Toulouse.     retour au texte

39 Les outils présentés ainsi que certains développements doivent beaucoup à Y. Abernot, op. cit. , 1988, pp. 83-88.     retour au texte

40 Y. Abernot, L’évaluation scolaire in J. Houssaye ( ss la dir. de ) La pédagogie : une encyclopédie pour aujourd’hui, Paris, E.S.F. Éditeur, 1993, pp. 240-241.     retour au texte

41 Viallet et P. Maisonneuve, 80 fiches d’évaluation. Paris : Les Éditions d’Organisation, 1981, p.73.     retour au texte

42 Voir notamment D. Morissette - M. Gingras, Enseigner des attitudes? Planifier, intervenir, évaluer. Bruxelles : De Boeck, 3ème édition 1991, pp. 131-164.     retour au texte

43 Y. Abernot, op. cit., 1993, p. 237.     retour au texte

44 G. de Landsheere, op. cit., 1992, p. 324.     retour au texte

45 Cf. Y. Abernot, op. cit., 1988, pp. 11-37.     retour au texte

46 Cf. Y. Abernot, op. cit., 1988, p. 28.     retour au texte