Zoom sur ...

Entretien avec R. Pasquini

Quel est le problème avec la note ?

Le constat que nous faisons est que le problème est moins la note que la manière dont elle est construite. À ce niveau, il est souvent difficile de savoir sur quoi elle repose, et de comprendre les informations qu’elle délivre : savoir ce que l’élève réussit ou ne réussit pas est souvent peu clair. Les notes apparaissent en ce sens relativement opaques : on assigne 10, 15 ou 7 à un élève, mais l’enseignant est en difficulté pour dire ce que l’élève a appris et surtout ce qu’il doit encore apprendre. Par ailleurs, même lorsqu’ils utilisent des appréciations, des couleurs ou des emojis, les enseignants se réfèrent implicitement à la note chiffrée.

Malgré le fait que l’on reconnaisse que l’effet des notes peut être délétère sur les élèves, du fait de leur omniprésence, de la sélectivité du système et de la quantophrénie qu’elles induisent (Hadji parle de la folie évaluative), malgré le fait que beaucoup de gens s’érigent contre l’obsession de la quantification, on constate qu’une proportion non négligeable des enseignants ont un rapport ambigu aux notes. D’un côté, ils les détestent, et de l’autre, ils les considèrent irremplaçables. En effet, les notes sont fréquemment utilisées pour « tenir » les élèves, asseoir une légitimité du professeur ; elles peuvent aussi être employées comme une menace. Autant de fonctions non pertinentes, mais réelles, qui constituent le deuxième problème.

Une conséquence de cela, et c’est le problème global, c’est que dans un système sélectif qui base la sélection des élèves uniquement sur des notes et que ces notes sont peu en liens avec les apprentissages évalués, et donc peu cohérentes, on a un gros souci de justice, de validité. De plus, les élèves ont une capacité importante à entrer dans la prophétie autoréalisatrice : moins on leur explique pourquoi ils réussissent ou échouent, et moins ils vont le demander. Et le système incohérent s’auto-valide.

Comment faire pour que les notes disent des choses intéressantes ?

Quels sont les principes et les forces d’une « évaluation constructive » ? Comment la note peut-elle se référer aux apprentissages ? Une piste est de sortir des notes comme seuls produits arithmétiques pour engager les élèves dans une démarche pédagogique. Se borner à donner un total de points à un élève n’est pas porteur. Cela lui donne un message tronqué, du type « il manque tant de points pour aller plus haut », qui n’apporte rien.

Afin de rendre les pratiques de notation à haute valeur informative, on travaille autour de trois approches complémentaires : l’alignement curriculaire, la planification à rebours, et l’évaluation critériée. Il n’est pas possible de travailler sur une note constructive, c’est-à-dire qui se réfère aux apprentissages réussis et en construction, sans parler du système enseignement-apprentissage-évaluation. En d’autres termes, si des enseignants rencontrent des difficultés à exprimer ce qu’ils attendent de leurs élèves en termes d’apprentissages, de progression des contenus, de progression du développement des compétences, alors travailler sur une notation constructive est impossible.

L’alignement curriculaire : une approche puissante

L’alignement curriculaire est une approche théorique puissante, malheureusement sous-estimée en formation, qui théorise la cohérence nécessaire entre l’enseignement, l’apprentissage et l’évaluation. On travaille dans cette perspective depuis plusieurs années. Pour ce faire, on demande aux enseignants de réfléchir du point de vue des compétences du programme qu’ils poursuivent avec leurs élèves. Cette question peut paraitre basique, mais elle a pour objectif de faire expliciter aux enseignants l’implicite. En effet, les enseignants savent ce qu’ils font avec leurs élèves, mais ils ont souvent de la difficulté à l’expliciter. Ensuite, on demande : « en fonction de ces compétences, qu’est-ce que vous faites avec vos élèves, est-ce que ça a un rapport ? » Et on constate que ça n’a pas forcément de rapport. Par exemple, on observe des enseignants qui passent un temps considérable à mener avec leurs élèves des activités qui ne sont pas dans le programme, qui sont peu porteuses d’apprentissages clés, ou bien qui sont dans le programme d’une autre année. Déjà, on essaie d’aligner cela, et ça revient à poser la question : « est-ce qu’on est obligé d’enseigner tout ce qu’il y a dans le programme ? » On s’est rendu compte que les enseignants ne connaissent pas toujours bien le programme et, parfois, ont tendance à l’interpréter. Par exemple, en Suisse romande, on travaille régulièrement avec des enseignants de sciences qui ne parlent que très peu de démarche scientifique, qui figure clairement dans les programmes. On observe que les enseignants suivent ce qu’ils ont compris de ce que l’école doit être. Parfois je leur demande : « ce que vous dites, vous l’avez vu où ? Vous pouvez citer le texte où vous avez vu ça ? » Mais le texte n’existe parfois simplement pas…

La question des tâches emblématiques

Derrière cette question, il y a celle du choix : comment prioriser les contenus importants, les compétences de base, et les compétences incontournables dans chaque discipline ? Nous parlons à ce sujet de tâches emblématiques. Dans chaque discipline, quel que soit le degré, il y a des activités d’apprentissage qui reviennent souvent et qui sont très importantes : par exemple, écrire un texte en français, comprendre un récit en langues, réaliser une démarche scientifique en sciences, etc. D’où l’importance de mettre l’accent là-dessus, parce que les enseignants, dans notre expérience, se disent débordés, mais quand on va regarder en détail ce qu’ils font, ils font beaucoup de choses pas forcément fondamentales. Par exemple, on a observé une classe de cycle 3 qui a passé six semaines à faire un exposé sur un animal, consistant à sortir des informations de Wikipédia et réaliser un support PowerPoint, dans lequel il n’y avait pas grand-chose de disciplinaire, peu de science, pas de questionnement. Dans ce cas, il y a un souci d’alignement curriculaire.

Dans l’alignement curriculaire, on cherche enfin à comprendre les conditions nécessaires pour évaluer des choses qui sont dans le programme et évaluer des choses qui ont été travaillées en classe. On observe que, comme on n’enseigne pas toujours des choses qui sont dans les programmes, eh bien on évalue des choses qui ne sont pas dans le programme. Et ce qui est plus dangereux, c’est qu’on peut évaluer des choses qui n’ont pas été enseignées, ou pas suffisamment. Ce phénomène est souvent à la base de pratiques d’évaluation sommatives et de notations très peu cohérentes.

La question est donc de prioriser les contenus importants pour les compétences de base, les compétences incontournables dans chaque discipline, en liens avec ces fameuses tâches d’apprentissage emblématiques qui en découlent. La taxonomie est un bon outil pour travailler ces liens. Nous travaillons avec la taxonomie d’Anderson et Krathwohl, actualisée à la lumière des sciences cognitives au début des années 2000 à partir de la taxonomie de Bloom. Elle a le mérite d’être extrêmement explicite pour les enseignants. Elle permet de réaliser un alignement curriculaire et de comprendre à quel niveau de complexité on se situe et comment il est possible de travailler à cette cohérence. Elle permet de hiérarchiser les apprentissages et les compétences, car on peut déterminer ce qui est du ressort de la restitution, de la compréhension, de l’analyse, de l’évaluation, etc. La majorité des travaux de recherche sur l’alignement curriculaire se réfèrent à cette taxonomie. Dans les référentiels, c’est moins explicite. Elle n’est pas complètement appareillée à l’approche par compétences, mais dans les programmes du ministère, tous les libellés des programmes pourraient être exploités avec cette taxonomie il me semble.

Cette manière d’appréhender les choses part du postulat que dans toutes les disciplines, dans toutes les écoles, l’apprentissage doit être appréhendé comme un processus continu. Certes on change de thématique durant l’année scolaire, mais il y a des éléments qui reviennent. Les saisir dans l’alignement curriculaire constitue une réflexion profonde sur les apprentissages qui va permettre de construire des notes en liens avec ces derniers.

Vers une planification à rebours

Avec cette taxonomie, les enseignants peuvent comprendre et rendre visibles ces niveaux de complexité. En effet, certains enseignent à des niveaux de complexité importants, sans le savoir. Par exemple, lorsqu’un enseignant demande aux élèves d’écrire un texte sur leurs vacances, d’un point de vue de l’apprentissage, ça peut être relativement complexe. Inversement, on a des enseignants qui survalorisent la mémorisation et n’évaluent que ça, ce qui ne va pas non plus. Le fait de rentrer par des éléments taxonomiques permet par exemple de leur demander : « lorsque vous faites faire ça à vos élèves, êtes-vous en cohérence avec le programme, vu la simplicité de la tâche ? » Petit à petit, on travaille avec eux à nommer et hiérarchiser les apprentissages, expliciter la progression possible. À ce titre, comment « monter » en complexité dans l’apprentissage est une grande question des enseignants. Par exemple, pour faire l’analyse d’une source iconographique en histoire, l’enseignant va demander aux élèves de définir de quel type de source et de quelle période historique il s’agit. Et là, on travaille à verbaliser les attentes qu’il a par rapport à ça de manière très flexible : est-ce qu’il y a des tâches d’apprentissage qui apparaissent fondamentales pour faire ça ? Est-ce que certaines, trop longues ou pas en rapport, mériteraient d’être mises de côté ? Est-ce que certaines doivent être plus denses car elles sont vraiment importantes ? On travaille comme cela, et c’est ça qu’on appelle la planification à rebours.

L’idée de la planification à rebours, c’est de concrétiser cet alignement curriculaire et, pour l’enseignant, se dire : « je réfléchis d’abord à où je veux emmener les élèves en termes d’apprentissages, pas à ce que je veux leur faire faire. » Cette opposition entre faire et apprendre est ainsi fondamentale. À partir de là, l’enseignant démonte le système en identifiant ses attentes de manière flexible car la classe va bouger, les élèves vont rencontrer des difficultés auxquelles on ne pensait pas. Je peux alors poser un certain nombre de critères d’attente et c’est sur cette base in fine que je vais leur donner l’épreuve sommative et construire mes notes.

L’évaluation critériée

Le 3e élément fondamental, c’est que la notation doit se baser sur des critères, car les points sont foncièrement insuffisants. Poser des critères permet d’une part, pendant l’enseignement, de dire aux élèves clairement ce sur quoi on les attend, et de les soutenir dans leurs apprentissages. Par exemple : « aujourd’hui, on va comparer deux documents iconographiques. Il faut que vous soyez capables de poser une similitude, une différence par rapport, par exemple, à la nature du document. » Si on travaille là-dessus, ça veut donc dire que, probablement, c’est une attente qui risque de se concrétiser au moment de l’épreuve finale, en cohérence avec l’alignement curriculaire.

Puis, à partir de là, le critère peut entrer dans la construction de l’échelle. Dans l’idéal, il faudrait ainsi définir des seuils de réussite en disant par exemple qu’entre 10 et 12, ça correspond à ces critères-ci, entre 12 et 15, à ceux-là, entre 15 et 20, à ceux-là. C’est là-dessus qu’on travaille avec les enseignants : au lieu de dire que pour la suffisance il faut tant de points, on se demande : « qu’est-ce que j’attends en termes d’apprentissages pour dire que l’élève va réussir ? » C’est un renversement de questionnement. Mais l’ampleur de l’échelle est clairement une contrainte pour entrer dans de telles démarches. Dans notre contexte, les notes vont de 1 à 6 avec demi-notes, ce qui permet d’avoir 11 échelons de notes, avec un 4 pour la suffisance. Là, on observe que passablement d’enseignants qui travaillent par critères sont plus à même de définir, de façon déterminée et inéquivoque, à quoi correspond la suffisance, et de déterminer ensuite les seuils de l’excellence et de l’insuffisance. De manière très intéressante, on voit aussi qu’ils n’ont plus besoin de documenter l’insuffisance jusqu’au 1. Ils s’arrêtent avant, vers 2,5 ou 3. En effet, pour eux, ça n’a plus de sens du point de vue qualitatif de dire : « tu es archi mauvais, donc 1 ». Il suffit de dire : « tu n’as pas atteint les exigences que j’attendais, donc 3. » Les retours aux élèves deviennent constructifs, on leur dit : « voilà, tu as telle note, ça c’était bien, mais ça, il faut encore qu’on travaille, ça ne va toujours pas. » En France, vous avez 21 notes possibles, si l’on compte le 0. C’est beaucoup pour critérier des seuils de réussite pour chaque note, mais pas impossible je pense, surtout si l’on se concentre sur le 10 par exemple. À ce titre, la recherche tend à dire que le nombre d’échelons pour noter ne devrait pas être supérieur à 5, avec un seul échelon pour l’insuffisance, comme dans certains systèmes scandinaves par exemple. On est loin du compte, mais cela permet de réfléchir.

Avez-vous des exemples de critères particuliers ?

On a la chance de travailler avec de plus en plus d’enseignants dans cette démarche, donc j’ai beaucoup d’exemples. Mais on s’aperçoit que formuler des critères est une dimension éminemment contextuelle, très située. C’est difficile de dire : « nous avons trouvé les critères pour le texte argumentatif en 5e », car ça dépend du texte, de l’enseignement, des élèves, du temps d’enseignement, de la difficulté… Certes, on ne va pas inventer des critères inédits sur le texte argumentatif, ou la production écrite. En revanche, les banques de critères précis et toujours semblables donnent des messages intenables, comme si les critères pouvaient être transmissibles dans toute la France, et que tout le monde pouvait enseigner la même chose. C’est impossible. Quand le critère est saisi dans cette réflexion d’alignement curriculaire et de planification à rebours, il ne peut être standardisé, on va toujours être flexible, l’adapter. Il n’est pas possible de faire la même chose dans une 5e en zone difficile et une 5e en zone favorisée. Il faut prendre en compte la culture des élèves, leur rapport au savoir, les caractéristiques du milieu, les expériences… Tout ceci va conditionner les exigences légitimes que l’on peut avoir pour les élèves, et donc, le seuil des notes. Dans nos recherches, on observe que certains enseignants ont des attentes particulières concernant, par exemple, la compréhension de l’écrit par leurs élèves, mais ne parviennent pas à leur faire acquérir ces apprentissages. On peut penser que, dans ce cas, avec des critères standardisés, ces enseignants seraient obligés de tricher. Si un enseignant a la capacité de dire : « j’ai mis 10 à cet élève, je peux expliquer pourquoi c’est 10 du point de vue de l’apprentissage et je sais comment je vais l’amener possiblement à faire mieux la prochaine fois », c’est gagné.

Comment modifier les pratiques concrètement ?

Un enseignant ne peut changer des pratiques tout seul. Par ailleurs, les tentatives de changement à large échelle, venues d’en haut, lorsque par exemple c’est imposé par le directeur d’établissement, ne fonctionnent pas. Avec mon équipe en Suisse romande, même dans de gros établissements, on travaille avec des gens volontaires ; ce peuvent être des groupes de 8, 20 ou 40 personnes qui ont des questions sur l’évaluation, qui ont envie de faire bouger les choses depuis leurs pratiques réelles. Cela entraine du développement professionnel. Lors de nos travaux, il est fondamental d’être appuyés par la hiérarchie. Il faut que les chefs d’établissements valident et encouragent le fait que les enseignants se mettent en réflexion. La difficulté est de passer à une forme d’explicitation, pour définir ce qui est important pour eux, quels apprentissages sont fondamentaux, comment ils vont organiser les choses, comment faire des choix, c’est-à-dire mettre l’accent sur certaines compétences et sur d’autres un peu moins. C’est très complexe, car les enseignants vont devoir faire des deuils. Il y a des choses que l’on ne peut pas faire pour de bonnes raisons pédagogiques, et on peut expliquer pourquoi. Par exemple, on ne peut pas tout évaluer, tout le temps.

Pour aider les enseignants à établir une progression, on vient les questionner sur le contenu du programme : qu’est-ce qui est important ? Qu’est-ce qui pose problème pour les élèves ? Les questions des redondances... Une fois ce travail réalisé, on peut questionner les pratiques : est-ce que travailler sur l’écureuil en sciences pendant huit semaines en vaut la peine ? Ou comment mettre un peu de science dans ces exposés ? Ainsi, quand arrivent des pratiques de notation, les enseignants ont la possibilité de se référer au système qu’ils ont élaboré et de dire : « l’épreuve portera sur l’exposé sur un animal, on regardera s’il y a des hypothèses scientifiques, s’il y a des réponses incluant des éléments qui convoquent des contenus scientifiques, sur la vie, les ordres des mammifères, leur répartition géographique, etc. » Cela donne des critères qui permettent d’aboutir à une note.

La pierre angulaire de tout cela, c’est d’amener les enseignants à réfléchir sur ce qu’ils attendent de leurs élèves du point de vue de l’apprentissage. On a vu dans nos travaux que cette réflexion-là fait que les enseignants enseignent différemment. Ils mettent l’accent sur des choses sur lesquelles ils ne mettaient pas l’accent, il y a des choses qu’ils font plus ou moins, il y des éléments de discussions avec les élèves qui changent. Par exemple, ils se demandent moins « est-ce que tu as fini le manuel ? », mais plutôt « est-ce que ces exercices-là, le 2, le 8 et le 11, sont fondamentaux ? », ce qui constitue un gros renversement.

On part donc de la question : « comment l’enseignant comprend-il l’apprentissage qu’il doit mener avec ses élèves ? » Par exemple, on a eu une fois de gros débats avec des enseignantes de français au sujet de la compréhension de l’écrit pour des élèves en difficulté. Une des enseignantes disait : « moi, j’en ai marre de leur demander des informations basiques et non-intéressantes, comme l’âge du capitaine ou le nombre de personnages sur l’ile. Je veux régler ce problème de la compréhension. » Avec la taxonomie, on a commencé à travailler en disant : « c’est quoi comprendre un texte ? » Cela peut paraitre vraiment basique. Mais, selon la perspective d’Anderson et Krathwohl, la réflexion part du point de vue de ce qui se passe dans la tête de l’élève lorsqu’on l’amène à comprendre quelque chose. Avec ces outils, les enseignantes ont réfléchi par rapport à leurs élèves et leur contexte. Tout d’un coup, l’une a commencé à dire : « comprendre un texte, c’est faire des inférences. En ce qui me concerne, je ne travaille jamais les inférences avec mes élèves ». L’autre a renchéri : « comprendre, c’est résumer, et moi je ne travaille jamais le résumé en compréhension de l’écrit. » Elles ont donc décortiqué ce qu’elles entendaient par « comprendre un texte ». À partir de l’étude d’un polar, elles ont amené leurs élèves de 13 ans à travailler sur des tâches de résumé, des tâches d’inférences, à réaliser des synthèses qui sont, du point de vue de cette démarche taxonomique, toutes des habiletés qui participent à la compréhension. J’ai eu l’occasion d’observer cette classe, l’enseignante m’avait invité et c’était fabuleux de voir ces élèves se poser la question de comment résumer : « quels sont tes critères de choix ? Pourquoi tu prends ça et pas ça ? », puis hiérarchiser des informations.

Pour que l’enseignant gère la hiérarchisation et la progression des apprentissages, il y a un facteur expérience, un facteur connaissances du programme, un facteur élève, un facteur conception personnelle de ce qu’est comprendre un texte de polar jeunesse pour des élèves de 13 ans. La taxonomie apparait comme un outil compréhensif pour guider l’analyse des apprentissages à mener, et pas comme quelque chose de prescriptif où l’on détaille l’ordre des opérations du type : « il faut commencer par mémoriser puis comprendre, puis appliquer. » Ce n’est pas du tout cela, c’est une démarche bien plus systémique.

Pour des pratiques de notation constructive, cette réflexion est fondamentale. Cela va permettre notamment de hiérarchiser ce qu’on peut attendre d’un élève afin de distinguer une réussite moyenne (« tu réussis mais sans plus ») d’un échec que l’on peut expliciter (« tu es en échec et je peux te dire pourquoi et sur quoi ») ou d’un travail excellent. Et d’éviter les discussions stériles sur la notation qui font perdre beaucoup de temps (« mais Madame, pourquoi vous m’avez mis un seul point ici ? »). Plusieurs enseignants nous ont dit que quand ils travaillent avec des critères - avec parfois des pratiques assez extrêmes où il n’y a plus de points -, les élèves viennent discuter (parce que ça arrive toujours) mais ils ne parlent plus de points. Ils parlent du contenu, ils parlent d’histoire, de sciences, de mathématiques, ils viennent argumenter. Par exemple : « Monsieur, on m’a demandé de formuler une hypothèse historique, je l’ai faite », ce qui entraine un dialogue avec l’élève : « ah tu l’as faite, montre-moi, pourquoi c’est une hypothèse ? Etc. » On a une dimension constructive de retour à l’élève, c’est extrêmement intéressant. Enfin, les exigences sont toujours les mêmes, et ont parfois tendance à augmenter.

Au sujet de la formation des enseignants à l’évaluation

Selon les sources de recherche, dans tous les coins du monde, les enseignants sont sous-formés en évaluation dans leur cursus académique. En formation continue, les ressources manquent. Les enseignants font donc ce qu’ils ont toujours fait, ce qu’ils ont vécu en tant qu’élèves, ce qu’on leur dit de faire. Ils ont de la difficulté à bouger dans ces croyances que, par exemple, une note de 15/20 est précise. On observe, en formation initiale et en formation continue, que pour faire bouger ces croyances, il faut du temps, il ne suffit pas d’un exposé de deux heures dans une école.

En Suisse romande, on est assez bien lotis : dans ma Haute École, un module facultatif de six crédits introductifs est dédié à ce sujet et permet d’approfondir la démarche ; mais à ce moment, les enseignants ne sont pas vraiment sur le terrain, donc certains vont faire bouger les choses et d’autres pas du tout. En formation continue, on a des formats de douze heures, c’est-à-dire des séances de travail de trois demi-journées, ce qui ne représente pas beaucoup, mais c’est mieux que rien : certaines équipes développent de réelles compétences.

Mais cela dit, en matière de notation, je suis surpris de voir que tous degrés confondus, bon nombre d’enseignants ont lâché prise. Ils se sont remis à des choses très techniques, très systématiques, ont laissé tomber la réflexion sur les apprentissages. C’est vraiment quelque chose qui me frappe et qui m’inquiète. Je peux imaginer que c’est pour de bonnes raisons, les gens sont stressés, débordés, les élèves sont de plus en plus difficiles, il y a la montée des injonctions à apprendre pour les tests, beaucoup d’administration et de contrôle. Mais il faut passer par-dessus la culture du test, le fait d’embarquer tout le monde dans des tonnes d’activités pour les préparer à un test. De la même façon, en France, la question du contrôle continu semble anxiogène. Il y a une question de culture ; les cultures d’évaluation des enseignants sont extrêmement influencées par les cultures des écoles, et du système scolaire. En France, vous avez une culture méritocratique et élitiste ; cela colore beaucoup les croyances des uns et des autres. Il faudrait redonner aux enseignants cette capacité à réfléchir, à faire des choix, à reprendre les manettes pédagogiques et à dire : « voilà, moi je décide que c’est ça qui est le plus porteur pour mes élèves, je pense que c’est ça qu’il y a de mieux à faire, et je décide de mes exigences. » Je suis admiratif du travail que font les enseignants avec lesquels on collabore, qui arrivent à aller vers des démarches de notation très qualitatives, avec des feedbacks aux élèves. Vraiment, c’est fabuleux. Mais cela demande du temps, des ressources et un investissement de tous les partenaires.

Raphaël Pasquini, professeur associé en évaluation scolaire à la Haute école pédagogique du canton de Vaud (Lausanne), en Suisse romande.

Pour aller plus loin :
Pasquini, Raphaël, Quand la note devient constructive. Évaluer pour certifier et soutenir les apprentissages. Presses de l’Université Laval, 2021.
Voir l'intervention de R.Pasquini au Cnesco : À quelles conditions développer des pratiques de notation au service des décisions des enseignant·es et des apprentissages des élèves ?