KI-Korrektur im Jurastudium: Bessere Klausurkorrekturen mit Rohpunkteschema

-Werbung-spot_imgspot_img

Die juristische Ausbildung kämpft seit Jahren mit einem strukturellen Problem: Die Bewertung von Klausuren gilt als intransparent, uneinheitlich und stark subjektiv. Eine aktuelle Untersuchung zeigt nun, wie groß die Abweichungen tatsächlich sind – und welche Rolle Künstliche Intelligenz (KI) künftig bei der Korrektur von Juraklausuren spielen könnte.

Das Problem: Über 80 Prozent der Jurastudierenden halten die Bewertung ihrer Prüfungsleistungen nicht für objektiv. Die Notenskala von 0 bis 18 Punkten wird kaum ausgeschöpft, klare Kriterien fehlen, und empirische Untersuchungen belegen extreme Streuungen. Eine Studie aus dem Jahr 2024 zeigte, dass die untersuchten Klausurkorrekturen an der LMU München im Durchschnitt um 6,47 Punkte voneinander abwichen.

Das DigitalProjekt, ein loser Zusammenschluss von Studierenden, Wissenschaftler:innen und Lehrenden will herausfinden, ob KI-Systeme diese Schwächen ausgleichen können. Veröffentlicht wurden die Ergebnisse der Untersuchung im Aufsatz „KI-Unterstützung und Rohpunkteschemata: Die Zukunft der juristischen Klausurkorrektur?“ (Ordnung der Wissenschaft, Ausgabe 1/2026). Zu den Autor:innen gehören: Michael B. Strecker, Susanne Hähnchen, Martin Heidebach, Marie Herberger, Simon Alexander Nonn, Sarah Großkopf, Gökhan Erol, Menaf Erol, Ilja Garber, Constantin Höhmann, Enci Huang, Clemens Hufeld, Louisa Zachmann.

KlausurenKIste und DeepWrite im Test

Die Ausgangslage: Getestet wurden zwei unterschiedliche KI-Korrektursysteme: „KlausurenKIste“, ein Kölner Start-up, das Klausuren absatzweise analysiert, und „DeepWrite“, ein vom Bundesforschungsministerium gefördertes Projekt der Universität Passau, das die Klausur als Ganzes bewertet. Beide Systeme greifen auf dieselbe Lösungsskizze zurück, unterscheiden sich aber in der technischen Herangehensweise und im Detailgrad der Analyse.

Die erste Projektphase fand im Wintersemester 2024/25 an der Universität Bielefeld statt. Dort wurde erstmals eine vollständig digitalisierte juristische Präsenzklausur geschrieben. Die Studierenden konnten neben der menschlichen Korrektur auch eine KI-Bewertung erhalten. Vorgaben für die KI gab es kaum; insbesondere fehlte ein einheitliches Rohpunkteschema, das die Bewertung strukturieren könnte.

In der zweiten Phase an der LMU München wurde das Projekt deutlich ausgeweitet. 16 Klausuren wurden zunächst vom Lehrenden selbst korrigiert und anschließend an 14 Korrekturassistent:innen verteilt. Acht von ihnen erhielten ein detailliertes Rohpunkteschema, sechs korrigierten wie üblich nur mit Lösungsskizze. Parallel dazu bewerteten beide KI-Systeme jede Klausur zweimal: einmal frei nach „Bauchgefühl“ undeinmal anhand desselben Rohpunkteschemas wie die menschlichen Korrektor:innen. Verwendet wurden dabei zwei große Sprachmodelle, GPT‑4o und Gemini 2.5 Pro.

Rohpunkteschemata erhöhen die Qualität

Die Ergebnisse dieser Phase sind der zentrale Befund des Projekts: Rohpunkteschemata erhöhen die Objektivität menschlicher Korrekturen signifikant. Die Spannweite der vergebenen Noten lag ohne Schema bei durchschnittlich 5,25 Punkten, mit Schema bei nur 2,94 Punkten – eine Reduktion der Streuung um 44 Prozent. Besonders deutlich wird der Effekt im unteren Notenbereich: Bei Klausuren unter vier Punkten lag die Spannbreite ohne Schema bei 4,4 Punkten, mit Schema bei nur 1,2 Punkten. Die Studie liefert damit erstmals belastbare empirische Daten für eine Forderung, die in der juristischen Didaktik seit Jahren erhoben wird: Ohne klare Bewertungsmaßstäbe ist Objektivität nicht erreichbar.

KI produziert weniger Notenausreißer

Auch die KI profitierte vom Rohpunkteschema. Die Bewertungen der Systeme lagen mit Schema deutlich näher am menschlichen Durchschnitt als ohne. Auffällig ist zudem, dass die KI weniger extreme Ausreißer produziert als einzelne menschliche Korrektor*innen. Während Menschen dazu neigen, besonders gute oder besonders schlechte Klausuren stark voneinander abweichend zu bewerten, bewegen sich die KI-Systeme stabiler im Mittelfeld. Das führt zwar zu einer gewissen „Mittelwertglättung“, spiegelt aber letztlich ein bekanntes Muster menschlicher Korrekturen wider.

Besonders positiv fiel das formative Feedback der KI auf. Während menschliche Korrekturen häufig aus knappen Randbemerkungen bestehen, lieferten beide Systeme ausführliche, strukturierte Rückmeldungen, die Studierende als nachvollziehbar und hilfreich bewerteten. Teilweise war das Feedback sogar so umfangreich, dass es als „zu detailliert“ empfunden wurde – ein Luxusproblem, das viele Studierende aus der analogen Korrekturpraxis nicht kennen.

Abhängigkeit von Qualität der Lösungsskizze

Technische Herausforderungen bleiben dennoch bestehen. Die KI ist stark abhängig von der Qualität der Lösungsskizze. Unklare Formulierungen oder alternative Lösungswege führen zu Fehlbewertungen. Auch die Frage, wie methodische Kompetenzen – etwa die Strukturierung eines Gutachtens – bewertet werden sollen, ist noch nicht abschließend geklärt. Diese Probleme betreffen jedoch gleichermaßen die menschliche Korrektur.

Das Projekt zeigt vor allem eines: KI zwingt die juristische Ausbildung dazu, ihre Bewertungsmaßstäbe zu präzisieren. Ohne klare Kriterien kann weder ein Mensch noch eine Maschine objektiv korrigieren. Die Autor:innen plädieren daher für eine flächendeckende Einführung von Rohpunkteschemata, eine Kombination aus menschlicher und KI-gestützter Korrektur sowie eine stärkere Digitalisierung der Prüfungsprozesse.

Die dritte Projektphase an der Universität Potsdam soll im Wintersemester 2025/26 weitere Erkenntnisse liefern, insbesondere zur Qualität des formativen Feedbacks und zu alternativen Bewertungsmodellen. Schon jetzt aber zeigt sich: KI-Korrekturen sind nicht fehlerfrei, aber sie sind konsistenter, schneller und transparenter als viele menschliche Bewertungen. Die größte Baustelle liegt nicht bei der Technologie, sondern im System selbst.

In unserem Aprilscherz 2025 hatten wir noch darüber gescherzt, dass KI bald die Korrektur von Juraklausuren übernehmen könnte. Es sieht immer mehr so aus, als würde das bald Realität werden können.

-Werbung-
Redaktion
Redaktion
JURios. Kuriose Rechtsnachrichten. Kontakt: redaktion@jurios.de

Ähnliche Artikel

Social Media

10,950FollowerFolgen
3,146FollowerFolgen
Download on the App Store
Jetzt bei Google Play
-Werbung-spot_img
-Werbung-

Letzte Artikel

Datenschutz-Übersicht

Diese Internetseiten verwenden teilweise so genannte Cookies. Cookies richten auf deinem Rechner keinen Schaden an und enthalten keine Viren. Cookies dienen dazu, unser Angebot nutzerfreundlicher, effektiver und sicherer zu machen. Cookies sind kleine Textdateien, die auf deinem Rechner abgelegt werden und die dein Browser speichert.

Die meisten der von uns verwendeten Cookies sind so genannte „Session-Cookies“. Sie werden nach Ende deines Besuchs automatisch gelöscht. Andere Cookies bleiben auf deinem Endgerät gespeichert, bis du diese löschst. Diese Cookies ermöglichen es uns, deinen Browser beim nächsten Besuch wiederzuerkennen.

Weitere Informationen findest du in der Datenschutzerklärung: Mehr erfahren