Le terme classement automatisé (AEG) signifie essentiellement lorsque l’intelligence artificielle (IA) et le traitement du langage naturel (PNL) sont utilisées pour évaluer et noter les essais écrits. Cette technologie utilise des algorithmes qui fonctionnent pour analyser les facteurs d’essai, notamment la grammaire, l’orthographe, le choix des mots, la syntaxe et autres, pour générer une observe ou un rating pour le contenu de l’essai.
Étant donné que les options de notation automatisées ont suscité l’intérêt et que leur adoption s’est développée récemment, l’éducation et les évaluations ont évolué de plus en plus vers des codecs plus en ligne et numériques. Les avocats soulignent de nombreux professionals potentiels, tels que gagner du temps des enseignants, se débarrasser du biais de notation et offrir une réponse immédiate aux étudiants. Les critiques soutiennent que les limitations de précision, la notation de l’intégrité et les effets sur les étudiants sont des inconvénients, mais ils n’existent pas.
Cet article look at les principaux avantages et inconvénients de l’utilisation de l’essai Intérimaire aujourd’hui et projections pour l’avenir. Nous analyserons les capacités et les limites des options actuelles, les cas d’utilisation actuels et les statistiques sur la mise en œuvre du monde réel, les impacts d’examen sur les éducateurs et les étudiants, et discuter des views de l’avancement à mesure que l’IA et la PNL évoluent.
La montée des options de classement automatisées
La technologie de notation automatisée est née dans les années 1960, mais ses capacités sont restées extrêmement limitées jusqu’à récentes percées dans l’intelligence artificielle et l’apprentissage automatique. Au cours de la dernière décennie, des progrès majeurs se sont produits dans la PNL et les réseaux de neurones qui peuvent analyser le texte écrit et le langage plus précisément que jamais.
Plusieurs fournisseurs fournissent désormais des options de notation des essais basées sur l’IA utilisées par des centaines d’universités, des districts scolaires publics et des organisations de take a look at du monde entier. Le plus grand fournisseur, EDX, prend en cost le classement des essais pour des exams comme le SAT, le GMAT et le TOEFL. Les écoles publiques d’au moins 21 États américains utilisent une notation automatisée pour gérer un nombre croissant d’examens écrits et des missions asynchrones.
L’utilisation proceed d’augmenter rapidement. Latest estimates mission that the worldwide automated essay scoring software program market dimension was valued at roughly USD 0.25 billion in 2023 and is predicted to succeed in USD 0.75 billion by 2032, rising at a compound annual progress fee (CAGR) of about 12% from 2023 à 2032. Cela représente un changement majeur dans l’adoption automatisée de classement pour suivre le rythme des tendances d’apprentissage à distance et numérique.
Avantages de classement des essais automatisés
Le notation des essais automatisés offre plusieurs avantages potentiels qui expliquent son utilisation croissante.
Fait gagner du temps aux enseignants
La observe des essais et des affectations écrits représente l’une des tâches les plus à forte intensité de main-d’œuvre des enseignants. Les options automatisées peuvent accélérer considérablement le processus et atténuer ce fardeau.
Par exemple, les estimations montrent que les enseignants peuvent passer plus de 10 à quarter-hour de classement un seul essai. Pour une classe de 25 élèves, cela équivaut à 4 à 6 heures passées. Le rating automatisé peut évaluer les essais en 1 minute ou moins par essai, permettant aux enseignants de travailler manuels et à libérer plus de temps pour la planification, l’enseignement et la fourniture des commentaires des élèves.
Fournit une rétroaction rapide des étudiants
Lié à la prise de temps des enseignants, la notation automatisée permet également aux étudiants de recevoir des scores et des commentaires sur les affectations écrites beaucoup plus rapidement. Plutôt que d’attendre des jours ou des semaines pour que les enseignants notent les articles, les systèmes automatisés peuvent évaluer les soumissions en quelques secondes et fournir instantanément aux étudiants leurs scores d’essais.
La rétroaction immédiate des performances permet aux étudiants de localiser les zones d’écriture pour s’améliorer plus tôt. Et la recherche montre que des commentaires plus rapides conduisent également à une meilleure rétention à lengthy terme et au développement des compétences.
Élimine les biais de notation subjectifs
Contrairement aux élèves humains qui appliquent intrinsèquement des biais et des préférences subjectifs à la notation des essais, les options de notation automatisées utilisent des algorithmes d’IA objectifs impartiaux. La plupart des systèmes sont formés à des thousands and thousands d’exemples d’essais pour développer des règles de notation qui notent les éléments comme la sémantique, le vocabulaire et la précision du contenu d’actualité sans favoritisme.
Grâce aux progrès de l’apprentissage automatique, les principaux moteurs de notation des essais ont également minimisé les biais algorithmiques. Il en résulte des scores impartiaux basés strictement sur la qualité des essais par rapport aux biais de niveleuse qui peuvent influencer négativement ou positivement les scores de qualité humaine.
Facilite les évaluations à grande échelle
Le classement automatisé fournit une answer évolutive pour répondre aux essais à haut quantity et aux besoins de notation à courtroom terme pour les grandes organisations de exams. Par exemple, l’outil de notation d’IA d’un fournisseur rapporte la capacité de marquer 400 milliards de questions à courtroom terme par an – un quantity pratiquement inconceivable pour les élèves humains.
Une telle capacité permet des évaluations plus fréquentes et à grande échelle pour mieux évaluer l’apprentissage des élèves et affiner les programmes d’enseignement à l’échelle du système. Quelques États administrent désormais des évaluations formatives toutes les 2 à 3 semaines et créditent une notation de l’IA pour avoir rendu cela potential, où la main-d’œuvre ne peut pas.
Inconvénients du classement des essais automatisés
Bien que le rating automatisé des essais offre une hausse notable, des inconvénients et des limitations légitimes existent.
Ne peut pas correspondre à la précision de classement humain
L’inconvénient le plus necessary est que le classement algorithmique ne peut pas encore correspondre à la précision et à la notion humaine. Bien que les capacités de l’IA avancent chaque année, imitant pleinement la compréhension et la cognition du langage humain reste complexe et difficile.
La plupart des moteurs automatisés ont encore du mal à analyser la sémantique, l’inférence, la créativité et d’autres compétences d’ordre supérieur que les élèves humains reconnaissent intuitivement par écrit. Des arguments sophistiqués, des idées originales, de l’humour, de l’ironie et d’autres qualités de langue subjective posent également des problèmes de précision.
Risques d’écriture formule et structurée
Les critiques soutiennent que la notation automatisée des essais, automobile les algorithmes analysent le model d’écriture et les constructions par rapport aux idées, incitent l’écriture formule et sans inspiration destinée à plaire aux modèles d’IA par rapport aux véritables compétences. Par exemple, de longs essais utilisant un vocabulaire complexe peuvent recevoir des scores solides quelle que soit la substance.
De plus, les modèles bien formés peuvent généralement reconnaître très bien le contenu avec un plagiat élevé. Cependant, les élèves peuvent découvrir des «astuces» pour manipuler légèrement le texte copié pour éviter la détection du plagiat. Cela pourrait favoriser la tricherie si elle est incorrecte aux évaluations à enjeux élevés.
Dans les deux cas, la préoccupation est que les limitations de la notation automatisée peuvent déformer l’enseignement de l’écriture si les enseignants et les élèves se fixent uniquement sur les types et constructions superficiels récompensés par l’IA. Sans équilibrer la notation humaine, la qualité de l’écriture peut se déplacer vers des constructions créatives basées sur des modèles par rapport à des constructions créatives, ce qui recommencerait le développement des compétences.
Manque de commentaires qualitatifs
La plupart des systèmes de notation automatisés peuvent attribuer des notes et fournir des commentaires quantitatifs de base expliquant les calculs de rating. Cependant, les algorithmes ont du mal à fournir une analyse qualitative significative avec des strategies constructives pour s’améliorer, comme les élèves humains.
Les critères d’échelle de notation sont également limités, réduisant souvent la qualité des essais à un rating numérique 1-6. Ces mesures simplifiées ne saisissent pas les nuances et les opportunités de croissance que les commentaires individualisées des enseignants peuvent fournir. Les étudiants perdent un teaching necessary adapté à leurs besoins qui manquent à la rétroaction de l’IA générique actuellement.
Notion de l’impartialité
Enfin, malgré le fait de viser l’objectivité impartiale, les études montrent que les élèves considèrent souvent le rating automatisé comme moins équitable et digne de confiance que la notation des enseignants. Les élèves pensent que les lecteurs humains comprennent mieux les ideas et les contextes pour juger le travail de manière impartiale par rapport aux robots.
La notion négative érode la confiance des étudiants dans la notation de l’intégrité. De plus, certains observateurs croient que la sur-dépendance sur les algorithmes pour évaluer l’écriture des risques déshumanisant l’enseignement en tant que processus impersonnel et numérique par rapport aux abilities.
Views pour les progrès de la notation automatisée
Les inconvénients ci-dessus révèlent des inconvénients réels pour freiner la mise en œuvre plus omniprésente des applied sciences automatisées d’évaluation des essais aujourd’hui. Cependant, l’évolution rapide se poursuit, ce qui suggère que les capacités de l’IA progresseront considérablement dans les années à venir pour aborder de nombreuses limites actuelles.
Plusieurs développements montrent une forte promesse. Premièrement, la précision du rating proceed de progresser à mesure que les modèles d’apprentissage automatique reçoivent davantage de données de formation. Par exemple, les principaux fournisseurs réclament désormais la parité de notation avec les élèves humains, la prévision des modèles dépassera la précision moyenne des enseignants d’ici 2025.
Les progrès de la génération du langage naturel montrent également un potentiel de rétroaction automatisée. De nouveaux modèles comme GPT-4 démontrent l’amélioration des capacités, le résumé des factors clés et la génération de commentaires qualitatifs spécifiques supérieurs aux commentaires de modèle actuels.
De plus, pour contrer les risques d’écriture formule, les algorithmes de notation adaptatifs sont prometteurs en évaluant les analyses d’ordre supérieur comme la pensée critique par rapport au model d’écriture seul. Les modèles de développement visent également à mieux détecter les tentatives de triche sophistiquées.
Enfin, une validation améliorée du système et des audits externes sur l’équité de rating peuvent encore renforcer la confiance et l’acceptation des utilisateurs s’ils sont appliqués correctement pour faciliter les problèmes de notion.
Conclusion
La development de l’intelligence artificielle a le potentiel de conduire à une software automatisée de notation des essais d’une grande valeur transformationnelle dans l’éducation. Les avantages réels tels que les économies de temps des enseignants, les scores rapides et impartiaux pour améliorer les évaluations de la rédaction sont déjà livrés par des systèmes de premier plan.
Cependant, comme pour tout inconvénient légitime, les limites de précision et l’impression sur la qualité de l’écriture montrent qu’il y a encore une certaine évolution à venir. Il est concevable à courtroom terme que les options de notation automatisées deviendront des alternate options viables à l’évaluation à faible enjeux, et à lengthy terme, les partenaires pourraient continuer à jouer un rôle dans la classement des exams à enjeux élevés aux côtés de leurs homologues.