KI besteht erstmals deutsche Jura‑Hausarbeit an der Uni Bochum

-Werbung-spot_imgspot_img

Dass generative KI das Jurastudium verändern wird, ist seit Monaten Gegenstand hitziger Debatten. Doch wie weit die Entwicklung tatsächlich bereits fortgeschritten ist, zeigt nun ein Experiment an der Ruhr‑Universität Bochum: Erstmals hat ein frei zugängliches KI‑Modell eine reguläre juristische Hausarbeit im Allgemeinen Schuldrecht bestanden – und zwar ohne dass die Korrektorinnen und Korrektoren den Täuschungsversuch bemerkten. Den Versuch haben Dr. Jan David Hendricks und Fabien Josten, in einem Gastbeitrag bei LTO vorgestellt.

Ausgangspunkt des Experiments war die Beobachtung, dass Universitäten zwar versuchen, den Einsatz von KI in unbeaufsichtigten Prüfungen zu begrenzen, die tatsächliche Kontrolle aber kaum möglich ist. Selbstverpflichtungen und Kennzeichnungspflichten sollen Transparenz schaffen. So durften Studierende an der Uni Bielefeld im Rahmen ihrer Hausarbeit im Familienrecht erstmals ein auf KI basierendes Recherchetool nutzen. Gleichzeitig wächst die Sorge der Professor:innen, dass Hausarbeiten zunehmend zu einem Wettbewerb um die besten Prompts verkommen könnten.

Der Test: Eine Hausarbeit im Schuldrecht AT

Hendricks und Josten entschieden sich deswegen für einen Praxistest. Die vom Lehrstuhl von Prof. Dr. Jacob Joussen gestellte Hausarbeit im Schuldrecht AT wurde vollständig von ChatGPT bearbeitet – und zwar ausschließlich mit der kostenfreien Version der Modelle GPT‑5 und 4o. Ziel war es, realistische Bedingungen zu simulieren: Welche Ergebnisse können Studierende erzielen, die weder Spezialzugänge noch kostenpflichtige Tools nutzen, sondern lediglich über durchschnittliche KI‑Kompetenz verfügen?

Der Weg: Zunächst entwickelten die Autoren zwei Prompts: einen für eine ausführliche Lösungsskizze, einen weiteren für das ausformulierte Gutachten. Beide wurden in mehreren Testläufen so verfeinert, dass sie inhaltlich aufeinander aufbauten und identische Schwerpunkte setzten. Anschließend wurde der Sachverhalt gemeinsam mit einem Lehrbuch zum Allgemeinen Schuldrecht in das Modell geladen, um eine gewichtete Lösungsskizze zu erzeugen. Diese enthielt nicht nur die klassischen Prüfungsschritte, sondern auch prozentuale Angaben zur Bedeutung einzelner Punkte – ein entscheidender Kniff, um dem Modell später Orientierung zu geben.

Ein anderes Experiment hatte zuvor bereits herausgefunden, dass KI-Korrekturen dann die besten Ergebnisse erzielen, wenn der KI ein Rohpunkteschemata zur Verfügung gestellt wird.

KI schafft im Durchschnitt 5,75 Punkte

Die größte Herausforderung lag im Gutachten selbst. Die Aufgabenstellung war zu umfangreich, um sie in einem einzigen Durchlauf generieren zu lassen; zudem setzte die Freiversion enge Token‑Grenzen. Daher wurde das Gutachten in mehreren Teilen erzeugt, die später manuell zusammengeführt wurden. Inhaltliche Eingriffe erfolgten dabei bewusst nicht. Lediglich der Fußnotenapparat wurde nachträglich ergänzt, da ChatGPT keinen Zugriff auf juristische Datenbanken besitzt und daher keine belastbaren Fundstellen aus Kommentaren oder Fachliteratur liefern kann. Die Autoren entschieden sich für einen bewusst durchschnittlichen Aufwand, um weder positiv noch negativ aufzufallen.

Überraschend ist auch hier wieder die weite Notendifferenz zwischen den einzelnen Klausuren. Mit 8 Punkten hätten die Bearbeiter:innen beinahe ein Prädikat – mit 3 Punkten wären sie hingegen durchgefallen.

Das Ergebnis wurde anschließend vier nicht eingeweihten Korrektor:innen vorgelegt – mit bemerkenswertem Resultat. Die Bewertungen lagen bei 3, 6, 6 und 8 Punkten. Der Durchschnitt von 5,75 Punkten entspricht nahezu exakt dem Gesamtdurchschnitt aller 241 eingereichten Arbeiten. Mit anderen Worten: Die KI hat bestanden. Überraschend ist auch hier wieder die weite Notendifferenz zwischen den einzelnen Klausuren. Mit 8 Punkten hätten die Bearbeiter:innen beinahe ein Prädikat – mit 3 Punkten wären sie hingegen durchgefallen.

Keiner der Korrektoren bemerkte etwas!

Noch bemerkenswerter ist, dass keiner der Korrektor:innen den Verdacht äußerte, der Text könne KI‑generiert sein.

Die Kritikpunkte der Korrektor:innen an den KI bearbeitetend Klausuren ähnelten sich: fehlender Normbezug, unklare Schwerpunktsetzung, geringe argumentative Tiefe. Gleichzeitig wurde in den bestandenen Arbeiten positiv hervorgehoben, dass die Ergebnisse juristisch vertretbar seien und die KI zentrale Normen des BGB AT korrekt anwende. Die Musterlösung wurde nicht exakt getroffen, doch die Argumentation blieb nachvollziehbar und die wesentlichen Probleme wurden erkannt. Schwächen zeigten sich vor allem in Detailfragen und in der Tiefe der Erörterung.

Der Versuch bestätigt damit, was viele Lehrende bereits vermuten: Mit sorgfältig gestalteten Prompts und minimaler Nacharbeit lässt sich eine juristische Hausarbeit heute bereits mit durchschnittlicher Note bestehen. Der eigentliche Aufwand liegt weniger im Schreiben als in der Vorbereitung – ein Befund, der die These vom „Prompt‑Wettbewerb“ stützt. Wer bessere Noten anstrebt, muss weiterhin redigieren, vertiefen und den Gutachtenstil glätten. Doch die Grenze zwischen eigener Leistung und KI‑Unterstützung verschiebt sich spürbar.

In Zukunft keine Hausarbeiten mehr?

Besonders brisant ist die Frage, was das für das Prüfungsformat Hausarbeit bedeutet. Wenn KI‑Modelle in der Lage sind, ohne menschliche inhaltliche Eingriffe eine juristische Arbeit zu verfassen, die den Durchschnitt der Studierenden erreicht, verliert die Hausarbeit ihren Charakter als Leistungsnachweis. Schon die generierte Lösungsskizze – gewichtet und strukturiert – kann Studierenden einen erheblichen Vorteil verschaffen. Und das, ohne dass sie das Gutachten vollständig automatisieren müssten.

Hendricks und Josten plädieren daher für eine grundsätzliche Neubewertung. Die Hausarbeit, wie sie seit Jahrzehnten in der deutschen Juristenausbildung verankert ist, könnte vor einem tiefgreifenden Wandel stehen. Größere Stichproben, der Einsatz von Bezahlversionen oder KI‑Modellen mit Datenbankzugriff könnten die Ergebnisse künftig weiter verschieben. Doch schon jetzt zeigt der Bochumer Versuch: Die althergebrachte Hausarbeit steht unter Druck – und ihre Tage als zentrales Prüfungsformat könnten gezählt sein.

-Werbung-
Redaktion
Redaktion
JURios. Kuriose Rechtsnachrichten. Kontakt: redaktion@jurios.de

Ähnliche Artikel

Social Media

10,950FollowerFolgen
3,146FollowerFolgen
Download on the App Store
Jetzt bei Google Play
-Werbung-spot_img
-Werbung-

Letzte Artikel

Datenschutz-Übersicht

Diese Internetseiten verwenden teilweise so genannte Cookies. Cookies richten auf deinem Rechner keinen Schaden an und enthalten keine Viren. Cookies dienen dazu, unser Angebot nutzerfreundlicher, effektiver und sicherer zu machen. Cookies sind kleine Textdateien, die auf deinem Rechner abgelegt werden und die dein Browser speichert.

Die meisten der von uns verwendeten Cookies sind so genannte „Session-Cookies“. Sie werden nach Ende deines Besuchs automatisch gelöscht. Andere Cookies bleiben auf deinem Endgerät gespeichert, bis du diese löschst. Diese Cookies ermöglichen es uns, deinen Browser beim nächsten Besuch wiederzuerkennen.

Weitere Informationen findest du in der Datenschutzerklärung: Mehr erfahren