J'interviens pour des TD en " gestion de projets et innovation " pour un Master 2. Il s'agit de deux groupes d'étudiants pour des cours en soirée de 18 h à 22 h 30. Je les évalue dans le cadre du contrôle continu et corrige également des copies de deux autres groupes de TD. Nous nous sommes réunis lundi dernier pour délibérer et étudier les étudiants reçus au module et ceux qui étaient ajournés, une minorité.
Il est important d'évaluer avec discernement alors que le niveau baisse (comme l'attestent les classements PISA notamment en mathématiques et en français sauf à Stanislas par exemple qui est décrié par les wokistes), que le redoublement est devenu tabou alors que des élèves ont de grosses difficultés de lecture au collège par exemple. Et avoir une réussite de 100 % à un examen le dévalorise par ailleurs sans compter que l'entrée dans la vie active risque d'être plus délicat. Certains pourraient tomber de haut si le sens de l'effort, de la juste récompense n'est pas la règle. Aussi une évaluation équitable est plus que jamais nécessaire.
Consécutivement à la communication des notes, j'ai reçu des réclamations de 2 étudiants qui étaient dans mes groupes. Je me permets de reproduire leurs méls anonymisés ci-après :
Bonjour M. Fayon,
J'espère que vous allez bien. Je me permets de vous contacter concernant mon examen final récemment passé et les résultats obtenus en contrôle continu.
Les 2 étudiants avaient eu respectivement 5 et 6 à l'examen alors que pour certaines matières une note inférieure à 8 est éliminatoire. Je leur ai répondu avec empathie pour la situation vécue au Liban pour l'un et tout en expliquant pourquoi il existait des différences de notes pour le contrôle continu lié à plusieurs paramètres : présence aux TD, participation, minis études de cas, etc. Tout ne repose pas uniquement sur l'exposé pour lequel les arguments défendus et leur maîtrise ainsi que l'aisance dans la présentation peuvent fluctuer entre les étudiants qui présentent. Ceci explique qu'un même binôme ou trinôme puisse avoir des notes différenciées.
Je me suis alors livré à un exercice car leurs copies comportaient par exemple des fautes d'orthographes et des erreurs rédactionnelles à la marge des erreurs commises dans les études de cas et des lacunes sur les notions transmises. J'ai alors effectué un copier-coller de chacun des méls des étudiants dans l' outil Smodin qui indique un pourcentage de probabilité qu'il soit rédigé par une IA générative. Le résultat est sans appel : 100 % ! J'ai également effectué le test avec mon mél de réponse et là avec mon style si particulier diraient certains, on tombe à moins de 10 % !
Voici une quinzaine d'années et encore aujourd'hui, on pouvait procéder à des copier-coller d'extraits de devoirs d'étudiants dont la rédaction de certaines parties semblait étrange. Il suffit de prendre un extrait de leurs travaux puis de le coller dans la zone de recherche d'un moteur de recherche. Ainsi on peut parfois retrouver la source utilisée, souvent Wikipédia du reste. Ceci permet de déceler le plagiat.
Ces résultats délivrés par l'outil de détection des contenus rédigés par des IA génératives ne font que renforcer mes convictions. L'IA générative est utilisée à mauvais escient, brute de fonderie, sans retravail. Cela devient une solution de facilité où il faut reconnaître que les étudiants ont réalisé de bons prompts et se sont contentés de reproduire le résultat sans le retraiter. La question est ne vaut-il pas mieux réviser ses examens avant plutôt que d'entrer dans une mécanique de la justification stérile et chronophage pour tous.