1. Se familiariser avec les pratiques d’évaluation

Partie F : IE-NCLC

L’intégration de l’évaluation basée sur les NCLC dans votre classe de FLS

Le chapitre 1 présente les principes et les stratégies d’évaluation sur lesquelles s’appuie la présente trousse de soutien à l’évaluation. Il sera question des aspects particuliers des pratiques d’évaluation dans les chapitres suivants et d’exemples pratiques à la fin de la trousse. Nous verrons d’abord la différence entre évaluation sommative et évaluation formative, puis présenterons cinq stratégies pouvant guider l’intégration de l’évaluation et des activités d’apprentissage en classe.

Quelle est la différence entre l’évaluation au service de l’apprentissage et l’évaluation de l’apprentissage?

Jusqu’ici, on considérait que l’évaluation était soit sommative, c’est-à-dire visant à mesurer les acquis à la fin d’une unité ou d’un cours, soit formative, ou destinée à fournir aux apprenants de la rétroaction, souvent informelle, tout au long du processus d’apprentissage. Bien que les deux types d’évaluation diffèrent quant au moment d’exécution et au niveau de formalité, d’aucuns soutiennent qu’ils ont souvent joué le même rôle, celui de déterminer si l’apprentissage a eu lieu « en fournissant des instantanés de l’avancement des apprenants, plutôt que du niveau suivant qu’ils pourraient atteindre » (Torrance, 1993, p. 340). Ce type d’évaluation peut n’avoir que peu d’incidence sur l’apprentissage.

Pratiques d’évaluation favorisant l’apprentissage

Que savons-nous des pratiques d’évaluation qui favorisent le plus l’apprentissage? En 1989, un groupe hétéroclite de chercheurs du Royaume-Uni s’est penché sur la question et a tenté d’établir un lien plus probant entre les pratiques d’évaluation et les résultats de recherche. Ces chercheurs, devenus les « réformateurs de l’évaluation », ont poursuivi l’étude des pratiques d’évaluation et la défense de leur réforme jusque dans les années 2000. À leurs débuts, pour vérifier les résultats de recherche indiquant une plus grande incidence de certaines pratiques d’évaluation sur l’apprentissage, Paul Black et Dylan Wiliam ont passé en revue plus de 250 études quantitatives sur l’évaluation, afin de déterminer quelles pratiques influençaient positivement l’apprentissage (Black & Wiliam, 1998). Ils ont conclu que toutes les pratiques d’évaluation n’avaient pas d’effet positif sur l’apprentissage, mais que c’était le cas des pratiques formatives (Black & Wiliam, 1998). Cette revue majeure a jeté un nouvel éclairage fondamental : l’évaluation formative innovante pouvait améliorer l’apprentissage.

Black et Wiliam ont constaté que le fait d’accorder une importance accrue à ce qu’ils appelaient l’évaluation au service de l’apprentissage contribuait au bilan de réalisations positives des apprenants. L’objectif principal de l’évaluation au service de l’apprentissage est de donner de la rétroaction qui favorisera l’apprentissage des apprenants, les aidera à déterminer où ils sont rendus et les mesures suivantes à prendre. Cette évaluation formative est souvent informelle, et intégrée à tous les aspects du processus d’enseignement et d’apprentissage; elle se fait pendant l’apprentissage. Les preuves servent à déceler les besoins des apprenants, à planifier les étapes suivantes de l’enseignement et à donner aux apprenants de la rétroaction pouvant leur servir à améliorer leur rendement. On peut comparer ce type d’évaluation à l’évaluation de l’apprentissage, soit l’évaluation sommative faite « après l’apprentissage présumé pour vérifier les acquis » (Stiggins, Arter, Chappuis, & Chappuis, 2004, p. 31).

Les « réformateurs de l’évaluation » ont aussi indiqué que tous les types d’évaluation devraient améliorer l’apprentissage; et que même l’évaluation sommative devrait inclure des éléments formatifs (Harlen & Gardner, 2010, p. 19). Une tâche d’évaluation à la fin d’une unité d’enseignement, par exemple, peut fournir de l’information qui servira à l’évaluation sommative (l’apprenant répond-il ou non aux critères de succès de la tâche), ainsi qu’à l’évaluation formative : analyser l’écart entre l’apprentissage et les objectifs d’apprentissage, donner de la rétroaction dynamique aux apprenants, et adapter l’enseignement et les activités d’apprentissage courantes.

« Selon les approches classiques de l’enseignement et de l’évaluation, l’instructeur présente sa leçon, après quoi il vérifie les acquis des apprenants – comme le contrôle de la qualité dans le secteur de la fabrication. En revanche, l’évaluation au service de l’apprentissage suppose d’adapter l’enseignement au fil de l’apprentissage – cela revient à l’assurance qualité. »

(Leahy, Lyon, Thompson, & Wiliam, 2005, p. 19).

Évaluation au service de l’apprentissage en classe

Le contexte de l’instructeur requerra probablement à la fois l’évaluation de l’apprentissage et l’évaluation au service de l’apprentissage. Il peut devoir déterminer si les apprenants satisfont aux attentes d’un niveau de compétence donné (évaluation de l’apprentissage), mais leur donne sans doute aussi de la rétroaction précise qui contribuera à améliorer leurs habiletés langagières (évaluation au service de l’apprentissage) par des méthodes formelles et informelles. La présente trousse fournit à l’instructeur des exemples d’évaluation à ces deux fins, tout en insistant sur l’intégration de l’évaluation au service de l’apprentissage dans toutes les démarches.

L’évaluation authentique en cours d’apprentissage fournit-elle des données fiables sur les progrès des apprenants?

L’évaluation authentique en cours d’apprentissage est préparée par l’instructeur, plutôt que par des experts tiers. L’instructeur adapte l’évaluation aux besoins et aux objectifs des apprenants, de même qu’au contexte d’apprentissage; il n’a pas recours à des tests normalisés conçus par des tiers. Ce type d’évaluation a suscité des débats animés quant à la fiabilité de l’information qu’elle permet de collecter, les données n’étant utiles, après tout, que si elles brossent un tableau raisonnablement précis de la position des apprenants par rapport aux objectifs d’apprentissage.

Habituellement, la notion de précision renvoie à la validité, c’est-à-dire au degré de correspondance entre ce qui est évalué et les résultats d’apprentissage; la notion de fiabilité, quant à elle, renvoie à l’uniformité des résultats d’évaluation, lorsque l’évaluation est répétée.

Concilier validité et fiabilité dans la pratique de l’évaluation authentique en cours d’apprentissage

Nombreux sont les environnements d’apprentissage où la validité et la fiabilité se font concurrence. Si la fiabilité augmente, c’est souvent au détriment de la validité, et vice versa. Ce rapport inverse est un facteur important dans les cours de langue où on utilise l’évaluation authentique en cours d’apprentissage. Dans ces cours, les activités d’apprentissage sont adaptées au contexte, et définies tant par les cadres de référence linguistiques, comme celui des Niveaux de compétence linguistique canadiens (NCLC), que par les besoins des apprenants, cernés par ces derniers. Un processus de planification ainsi dépendant du contexte accroît la validité de l’évaluation. Les activités et outils d’évaluation sont également adaptés et peuvent, par conséquent, varier considérablement d’un cours à l’autre – accroissant encore la validité, mais posant des défis à l’égard de notions traditionnelles de fiabilité.

De plus, l’évaluation authentique en cours d’apprentissage implique souvent de revoir les habiletés et compétences, étant donné que leur mise en pratique et leur évaluation se font dans des situations sociales et contextes divers. Bien que cette méthode d’évaluation multidimensionnelle et continue soit conforme aux notions de validité, elle cadre mal avec les notions traditionnelles liées à une évaluation fiable et reproductible.

« La marche à suivre d’une méthode d’évaluation doit être explicite pour garantir que l’information est valide et qu’elle est suffisamment fiable pour son usage. »

(Harlen, 2010, p. 19)

Ainsi, la fiabilité est-elle réalisable dans des environnements d’apprentissage dynamique souvent observés en cours de langue? Les réformateurs de l’évaluation soutiendraient qu’une fiabilité acceptable est possible si nous acceptons que la fiabilité soit établie par des évaluations formelles et informelles fréquentes. Conséquemment, dans le cadre de l’évaluation authentique en cours d’apprentissage, la fiabilité peut être appuyée par la collecte fréquente, au fil du temps, d’information sur le rendement des apprenants. Ce faisant, l’instructeur amasse un important volume d’information au sujet des apprenants, qui lui permettra de juger plus facilement et de façon fiable s’ils ont ou non les acquis visés (Harlen, 2010; Black, Harrison, Hodgen, Marshall, & Serret, 2010, and 2011).

Considérer l’évaluation comme une approximation

Outre la notion de fiabilité, les réformateurs ont remis en question celle de l’exactitude de l’évaluation, nous obligeant ainsi à reconnaître que toute évaluation est approximative. Même les meilleures pratiques d’évaluation, font-ils valoir, ne peuvent fournir qu’une image partielle des capacités des apprenants (Harlen, 2010, pp. 38-39). Un certain nombre de raisons expliquent cet état de fait :

Circonstances du jour de l’évaluation : Le rendement des apprenants peut s’avérer supérieur ou inférieur le jour de l’évaluation qu’il l’aurait été un autre jour. Le stress, la fatigue et une multitude d’autres facteurs influent en effet sur le rendement. Les évaluations étant aussi nécessairement soumises à des contraintes de temps et de ressources, elles ne peuvent porter que sur un échantillon du rendement.

Nature de la langue : Dans les cours de langue, la nature même de la langue complique encore l’évaluation. La langue est beaucoup plus qu’un simple outil de communication; elle façonne notre façon de voir le monde et d’interpréter notre expérience. La langue fait partie intégrante de qui nous sommes; c’est grâce à elle que nous accédons à notre expérience. L’usage de la langue varie selon des facteurs contextuels complexes liés à la personnalité, à la situation et aux liens que nous avons avec l’interlocuteur. L’apprentissage d’une langue est donc un processus extrêmement complexe, non linéaire ainsi que difficilement mesurable et quantifiable.

Le cadre des NCLC vise les compétences de quatre domaines généraux (Relations interpersonnelles, Consignes, Persuasion et Information). Il s’agit de compétences servant dans de nombreux contextes et qui sont directement observables. Elles ne représentent toutefois qu’un échantillon des habiletés d’un apprenant à un niveau donné, un peu comme « la pointe de l’iceberg » (Pawlikowska-Smith, 2000, p. 25). Certains aspects des habiletés langagières d’un apprenant peuvent en effet ne pas être décrits dans le cadre des NCLC et donc ne pas faire l’objet des tâches d’évaluation.

Interprétation de l’instructeur : L’évaluation de la compétence langagière repose sur l’interprétation tant du cadre des NCLC que du rendement de l’apprenant. L’instructeur use de son jugement professionnel pour déterminer si le rendement d’un apprenant concorde avec les descripteurs d’un domaine de compétence donnée. Il y a inévitablement une certaine variabilité.

Fixer les conditions de fiabilité

Malgré la complexité des facteurs susmentionnés, la recherche indique que les jugements portés dans le cadre de l’évaluation authentique en cours d’apprentissage peuvent être fiables, sous certaines conditions (Harlen, 2004; Black et al., 2010, 2011). Ce point de vue est étayé par deux initiatives innovantes entreprises par les réformateurs de l’évaluation, soit une revue de 30 études par Harlen (2004) et une étude longitudinale auprès d’enseignants et de chercheurs, KOSAP (Black et al., 2010, 2011).

Ces deux études ont conclu que la fiabilité augmentait quand les instructeurs interprétaient ensemble les critères d’évaluation. Dans les deux cas, on a démontré l’utilité pour les instructeurs de se réunir pour examiner de concert le travail des apprenants, et en venir à une compréhension commune des objectifs d’apprentissage et des critères d’évaluation.

Les études ont aussi révélé que la fiabilité des jugements liés à l’évaluation augmentait quand les instructeurs participaient à la conception des tâches, ce qui favorisait également une compréhension approfondie des objectifs d’apprentissage et des critères d’évaluation. Dans le cas de l’étude Harlen, les instructeurs ont acquis leur compréhension par la préparation de tâches d’évaluation (2004, p. 267). Pour ce qui est de l’étude KOSAP, leur compréhension découle de la mise en œuvre minutieuse des tâches, y compris la présentation aux apprenants des tâches et des critères, le choix du degré d’étayage et la mise en place de l’évaluation par les pairs (Black et al., 2010, 2011).

Comment appliquer les principes de l’évaluation au service de l’apprentissage?

Les réformateurs de l’évaluation ont certes des arguments convaincants au sujet du lien étroit entre les pratiques d’évaluation au service de l’apprentissage et un meilleur apprentissage, il reste que l’application de ces pratiques en classe exige une approche sérieuse et réfléchie.

Cinq stratégies d’évaluation au service de l’apprentissage

Cinq stratégies d’évaluation au service de l’apprentissage, établies par Leahy, Lyon, Thompson, and Wiliam (2005), se sont révélées efficaces pour améliorer considérablement l’apprentissage dans diverses classes et contextes d’apprentissage (Black, Harrison, Lee, Marshal, & Wiliam, 2003; Wiliam 2007).

Stratégie 1 : Clarifier les objectifs d’apprentissage et les critères de succès

« Un faible rendement est souvent dû au fait que les apprenants n’ont pas compris ce que l’instructeur attendait d’eux. »

(Harlen, 2010, p. 19)

Selon les recherches, l’apprentissage est rehaussé quand les objectifs d’apprentissage et les critères d’évaluation sont évidents pour les apprenants (Black & Wiliam, 1998, Leahy et al., 2005). Dans le cadre de l’évaluation au service de l’apprentissage, les instructeurs se servent d’information de diverses sources pour clarifier les objectifs d’apprentissage. Dans les programmes qui utilisent les NCLC, cette information comprend :

les objectifs du programme, déterminés par le contexte du programme;
le cadre des NCLC;
les besoins cernés par les apprenants eux-mêmes, issus des discussions initiales avec les apprenants et de leur rétroaction continue pendant le processus d’apprentissage et d’évaluation;
l’information tirée de l’évaluation, soit des évaluations authentiques en cours d’apprentissage et intégrées au processus d’apprentissage.

Pour faciliter l’apprentissage, les instructeurs communiquent ces objectifs d’apprentissage aux apprenants, ainsi que les critères de succès, et prennent des mesures précises pour s’assurer que les apprenants les comprennent dans le contexte de leur propre apprentissage; il s’agit de mesures qui vont au-delà du simple fait d’indiquer les objectifs d’apprentissage au début d’une tâche (Leahy et al., 2005).

Stratégie 2 : Intégrer des activités en classe qui suscitent des preuves de l’apprentissage

Nous savons aussi que l’instructeur peut améliorer l’apprentissage quand il intègre des activités en classe offrant à tous l’occasion de participer, plutôt que de simplement recueillir de bonnes et de mauvaises réponses. Avec l’évaluation au service de l’apprentissage, l’instructeur pratique l’écoute interprétative pour déterminer les acquis et les lacunes des apprenants, et adapte son enseignement en conséquence (Leahy et al., 2005).

Les auteurs suggèrent à l’instructeur d’employer des stratégies qui encourageront la participation, qui susciteront des réponses aux questions de la part de tous les apprenants, et non seulement de ceux désireux de répondre. Pour susciter des preuves de l’apprentissage chez le plus grand nombre possible d’apprenants, l’instructeur pourra se servir d’outils tels que le journal de bord, ou encore de stratégies de réponse en petits groupes ou deux par deux.

Stratégie 3 : Donner de la rétroaction dynamique pour faire progresser les apprenants

« La rétroaction donnée à l’apprenant doit porter sur les qualités particulières de son travail et comporter des conseils sur la façon de s’améliorer. »

(Harlen, 2010, p. 19)

Les recherches montrent clairement que l’apprentissage se trouve amélioré lorsque la rétroaction, encadrée par des critères, vise des mesures concrètes et détaille les étapes de perfectionnement que doit suivre l’apprenant (Leahy et al., 2005). Avec l’évaluation au service de l’apprentissage, l’instructeur donne davantage de rétroaction descriptive qu’évaluative. Les instructeurs ayant fait l’expérience de commenter les tâches et devoirs ont signalé une incidence positive sur l’apprentissage (Leahy et al., 2005). Tandis que les notes peuvent motiver les apprenants les plus performants, elles ont tendance à décourager les plus faibles. Les recherchent indiquent en outre que lorsque l’évaluation ne comporte pas de notes, les apprenants se concentrent plus aisément sur les commentaires pouvant les aider à améliorer leur travail (Black & Wiliam, 1998).

Cependant, la rétroaction descriptive n’est pas utile dans tous les cas. Les commentaires généraux comme « Bon travail! » ne situent pas le travail de l’apprenant par rapport aux objectifs et ne lui indiquent pas comment progresser. Avec l’évaluation au service de l’apprentissage, l’instructeur tente de fournir de la rétroaction exacte, précise et axée sur la réussite. La rétroaction se fait en trois étapes, à l’origine proposées par Sadler (1989) puis adoptées par les réformateurs de l’évaluation, et aujourd’hui couramment utilisées dans la documentation sur l’évaluation au service de l’apprentissage :

reconnaissance de l’objectif souhaité;
preuves de la situation actuelle;
moyens de combler les lacunes.

Stratégie 4 : Inciter les apprenants à devenir des personnes-ressources les uns pour les autres

« L’adoption de l’évaluation au service de l’apprentissage implique de modifier l’entente implicite entre instructeurs et apprenants pour partager la responsabilité de l’apprentissage. »

(Harlen, 2010, p. 19)

D’après les recherches, le soutien que s’apportent entre eux les apprenants, y compris à l’occasion de l’évaluation par les pairs, améliore l’apprentissage (Leahy et al., 2005). Dans la pratique de l’évaluation au service de l’apprentissage, on constate que les apprenants sont souvent plus aptes à remarquer des choses dans le travail de leurs camarades que dans le leur. En ayant recours à des critères et à des outils d’évaluation bien conçus pour réviser le travail de leurs camarades, les apprenants parviennent à mieux comprendre les critères de la tâche et les outils.

Stratégie 5 : Inciter les apprenants à prendre leur propre apprentissage en charge

Les recherches donnent également à penser que l’apprentissage de la langue se fait mieux quand les apprenants utilisent des critères convenus pour effectuer leur réflexion sur l’apprentissage et évaluer leur apprentissage (Leahy et al., 2005). Avec l’évaluation au service de l’apprentissage, l’instructeur aide les apprenants à développer leurs habiletés en matière d’autoévaluation, et il organise des activités d’apprentissage qui favoriseront la réflexion des apprenants.

Les cinq stratégies précitées guideront le reste de la présente trousse. Elles seront expliquées en détail dans les chapitres sur les pratiques d’évaluation visées et dans des exemples en classe.

Évaluation et NCLC

Dans les programmes utilisant les NCLC, l’évaluation doit également tenir compte des quatre principes directeurs (NCLC, 2018, p. 2). Le tableau ci-dessous les résume, ainsi que leurs incidences sur la planification de l’évaluation.

*Principes directeurs des NCLC (NCLC, 2018, p. 2)*	Incidences sur la planification de l’évaluation
Les NCLC sont axés sur les compétences Les descripteurs de compétences clés indiquent les actes de communication que peut accomplir une personne en français. Le modèle de compétence langagière à la base des NCLC comprend cinq composants : connaissance grammaticale, connaissance textuelle, connaissance fonctionnelle, connaissance sociolinguistique et compétence stratégique.	Les tâches d’évaluation sont harmonisées aux compétences NCLC et enchâssent les cinq composants de la compétence langagière.
Les NCLC sont axés sur les apprenants Les compétences doivent être intégrées à des tâches et à des contextes définis, pertinents et compréhensibles pour l’apprenant.	Il est recommandé de faire participer les apprenants aux activités d’analyse des besoins et d’établissement des objectifs qui étayent la planification pédagogique.
Les NCLC sont axés sur les tâches Les NCLC reposent essentiellement sur la notion de tâche langagière – l’utilisation de la langue dans un cadre de communication authentique, pour atteindre un objectif précis, dans un contexte particulier.	L’évaluation devrait être axée sur les tâches et démontrer les habiletés des apprenants, c’est-à-dire dans quelle mesure ils accomplissent avec succès les tâches langagières dans des contextes particuliers.
Les NCLC privilégient les tâches qui s’inscrivent dans les contextes de la collectivité, des études et du travail Les NCLC ne précisent pas de contexte. Les tâches sont réalisées dans des contextes particuliers.	L’évaluation devrait refléter les contextes pertinents et significatifs pour les apprenants dans le cadre de la collectivité, des études et du travail.

Comment l’évaluation s’inscrit-elle dans l’ensemble de l’enseignement et de l’apprentissage?

Les tâches d’évaluation ne fonctionnent pas isolément, mais avec les autres tâches d’apprentissage et d’évaluation, au sein du cycle complexe d’apprentissage et d’évaluation mettant en jeu les stratégies d’évaluation et la planification subséquente. L’instructeur trouvera sans doute utile le modèle de planification qui suit. Ce modèle sous-tend le processus d’évaluation utilisé dans les exemples en classe de FLS à la fin de la présente trousse.

Références [1]

Black, P., Harrison, C., Hodgen, J., Marshall, B., & Serret, N. (2010). Validity in teachers’ summative assessments. Assessment in Education: Principles, Policy & Practice, 17(2), 217-34.

Black, P., Harrison, C., Hodgen, J., Marshall, B., & Serret, N. (2011). Can teachers’ summative assessments produce dependable results and also enhance classroom learning? Assessment in Education: Principles, Policy & Practice, 18(4), 451-469.

Black, P., Harrison, C., Lee, C., Marshall, B., & Wiliam, D. (2003). Assessment for learning: Putting it into practice. Buckingham: Open University Press.

Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. London, UK: King’s College London School of Education.

Centre for Canadian Language Benchmarks (CCLB). (2012). Canadian Language Benchmarks: English as a second language for adults. Ottawa, ON: Author. Retrieved from http://www.cic.gc.ca/english/pdf/pub/language-benchmarks.pdf

Harlen, W. (2004). A systematic review of the evidence of reliability and validity of assessment by teachers used for summative purposes. In EPPI Centre, Research Evidence in Education Library. London, UK: EPPI-Centre, Social Science Research Unit, Institute of Education. Retrieved from http://eppi.ioe.ac.uk/cms/LinkClick.aspx?fileticket=6_1H03rsumM%3d&tabid=117&mid=923

Harlen, W. (2010). What is quality teacher assessment? In J. Gardner, W. Harlen, L. Hayward, & G. Stobart (Eds.), Developing teacher assessment (pp. 29-51). Berkshire, UK: Open University Press.

Harlen, W., & Gardner, J. (2010). Assessment to support learning. In J. Gardner, W. Harlen, L. Hayward, & G. Stobart (Eds.), Developing teacher assessment (pp. 15-28). Berkshire, UK: Open University Press.

Leahy, S., Lyon, C., Thompson, M., & Wiliam, D. (2005). Classroom assessment: Minute-by-minute and day-by-day. Educational Leadership, 63(3), 19-24.

Pawlikowska-Smith, G. (2000). Canadian Language Benchmarks 2000: Theoretical framework. Ottawa, ON: Centre for Canadian Language Benchmarks.

Pettis, J.C. (2014). Portfolio-based language assessment (PBLA): Guide for teachers and programs. Ottawa, ON: Centre for Canadian Language Benchmarks. Retrieved from http://www.language.ca/documents/PBLA_Guide_e-version_2015.pdf

Sadler. R. (1989). Formative assessment and the design of instructional systems. Instructional Science, 18, 119-144.

Stiggins, R., Arter, J.A., Chappuis, J., & Chappuis, S. (2004). Classroom assessment for student learning: Doing it right – using it well. Portland, OR: Assessment Training Institute, Inc.

Torrance, H. (1993). Formative assessment: Some theoretical problems and empirical questions. Cambridge Journal of Education, 23, 333-343.

Wiliam, D., & Leahy, S.A. (2007). A theoretical foundation for formative assessment. In J. McMillan (Ed.), Formative classroom assessment: Theory into practice (pp. 29 – 42). New York: Teachers College Press.

[1] La plupart des références sont des ouvrages anglophones qui n’ont pas été traduits. Nous les laissons dans cette section à titre de référence pour ceux qui voudraient approfondir les sujets abordés.