Ein ernüchternder Blick auf die durchschnittlichen Noten der Ersten juristischen Prüfung (und was sie – vielleicht – zu erzählen haben)

-Werbung-spot_imgspot_img

Eine Auswertung der von 528 Examenskandidaten geschriebenen 3696 Klausuren aus der Kampagne 1.2022/II des JPA Berlin/Brandenburg verrät Erstaunliches über den Zustand unserer Juristenausbildung und der Prüfungssituation im Ersten Staatsexamen.

Noten – will ich das überhaupt wissen?

Zu den ersten Informationen, die ein Jurastudent an der Universität bekommt, gehört, dass sich die Notenskala im Vergleich zum Abitur um eine Notenstufe und damit drei weitere Punkte erweitert: auf sieben Notenstufen und eine 18-Punkteskala. Geregelt ist das in der „Verordnung über eine Noten- und Punkteskala für die erste und zweite juristische Prüfung“, an der sich auch die Jurafakultäten orientieren. Gleichzeitig erfährt man gerüchteweise, dass die Gauß‘sche Normalverteilung im Notensystem der Juristen keine Rolle spielt. Was das tatsächlich heißt, speziell auch für die Notenvergabe in der Ersten juristischen Prüfung, wird einem erst später klar. Als Student wirft man einen Blick auf den Notenspiegel der Klausur in der Anfängerübung, vielleicht noch einen zögerlichen zweiten Blick auf die jährlich veröffentlichten Examensstatistiken des Bundesamts für Justiz – und dann lernt man für die nächste Klausur, was auch wirklich besser ist. Denn niederschmetternd sind die Zahlen allemal. Hinzukommt, dass sie meist hoch verdichtet sind. So hoch, dass das Einzelschicksal nicht mehr erkennbar ist.

Während es an den Universitäten immer wieder Hinweise auf Notendurchschnitte und Nichtbestehensquoten gibt, mal mehr mal weniger transparent, ist die Auskunftsfreudigkeit der Justizprüfungsämter – sagen wir – begrenzt. Will man also in Erfahrung bringen, wie die Kandidatenkohorte eines bestimmten Prüfungstermins abgeschnitten hat, welche Punkte im Durchschnitt und welche Notenstufen maximal erreicht wurden, wird es schwierig. Die Daten sind zwar anonymisiert verfügbar, veröffentlicht werden sie aber nicht. Die Ausnahme: Das JPA Berlin/Brandenburg hängt elektronisch die Noten der jeweils jüngsten Kampagne der schriftlichen Aufsichtsarbeiten vollumfänglich aus. Die Zahlen sind aufschlussreich, nicht zuletzt weil Berlin/Brandenburg sich statistisch mit Blick auf die Nichtbestehensquote bei der schriftlichen Pflichtfachprüfung im Mittelfeld bewegt und daher mit aller gebotenen Vorsicht als einigermaßen repräsentativ betrachtet werden kann. Zwar schneiden die Berliner Examenskandidaten besser ab als die Brandenburger; zusammen liegen sie aber ganz nah am Bundesdurchschnitt (Ausbildungsstatistik 2020 des Bundesamts für Justiz). Dass in B’n‘B sieben Klausuren geschrieben werden, im Rest der Republik dagegen nur sechs, dürfte an der Repräsentativität/Vergleichbarkeit der Ergebnisse wenig oder nichts ändern, erhöht vielleicht sogar die Aussagekraft der vorliegenden Zahlen.

Großkanzleien und Justiz müssen sich um 36 von über 500 Kandidaten streiten

Der Notenaushang der Kampagne 1.2022/II des JPA Berlin/Brandenburg umfasst die individuellen Ergebnisse von 528 Kandidaten, anonymisiert durch Prüfungslistennummern. Da diese jeweils sieben Klausuren schreiben, liegen 3696 Einzelnoten vor.

Beginnen wir mit den erfreulichen Notenbereichen: Eine 18-Punkte-Klausur konnten wir ebenso wenig entdecken wie eine 17-Punkte-Klausur. Dafür gab es aber sieben Klausuren, die mit 16 Punkten bewertet wurden, also ein „Sehr gut“ bzw. das Prädikat einer „besonders hervorragenden Leistung“ erhielten. Sieben von 3696, das sind immerhin zwei Promille. Beim „Gut“ steigt die Zahl dann leicht. Als „erheblich über den durchschnittlichen Anforderungen liegende Leistung“ wurden 75 der 3696 Klausuren eingestuft (15 Punkte: 10; 14 Punkte: 26; 13 Punkte: 39). Beim „Vollbefriedigend“, also einer „über den durchschnittlichen Anforderungen liegenden Leistung“ erhöht sich die Zahl nochmals. Bei 276 Aufsichtsarbeiten durften sich Kandidaten über diese Einzelnote freuen (12 Punkte: 60; 11 Punkte: 76; 10 Punkte: 131). Fast jede zehnte Klausur wurde damit als überdurchschnittliche Leistung bewertet: 349/3696).

Wer jetzt glaubt, die besten Kandidaten hätten vielleicht so richtig abgeräumt, wird bei einem Blick auf die besten Durchschnittspunktzahlen enttäuscht. Selbst der beste Kandidat kam nicht über 12,14 Punkte und damit über ein „Vollbefriedigend“ hinaus (allerdings wäre das nach der modifizierten Skala der Examens-Endnoten bereits ein „Gut“). Und nur 17 der 528 Kandidaten erreichten einen zweistelligen Punktedurchschnitt, 19 weitere einen Punkteschnitt von 9 bis 9,9. So finden sich insgesamt nur 36 von 528 Kandidaten im Prädikatsbereich. Bei isolierter Betrachtung (ohne Berücksichtigung der Notenverbesserungen im mündlichen Prüfungsteil und ohne die Noten aus dem universitären Schwerpunktbereich) würden sich die Großkanzleien, die Justiz, Ministerien etc. also nur um 36 Kandidaten streiten müssen.

Die Zahl der mit einem „Befriedigend“ benoteten Klausuren, welches eine Leistung ausweist, die „in jeder Hinsicht durchschnittlichen Anforderungen entspricht“, liegt bei 731 (9 Punkte: 183; 8 Punkte: 245; 7 Punkte: 304). Bei Orientierung der durchschnittlichen „Anforderungen“ an den realen durchschnittlichen Leistungen müssten hier eigentlich 3000 befriedigende Bewertungen gegeben sein. Vielmehr machen die Klausuren mit 7 bis 9 Punkten nur ein gutes Fünftel der gesamten 3696 Klausuren aus.

Ein Drittel landet „unter dem Strich“!

Die weitaus größte Gruppe muss also unterhalb der durchschnittlichen Anforderungen liegen – und so ist es dann auch. Als eine „Leistung, die trotz ihrer Mängel durchschnittlichen Anforderungen noch entspricht“ und damit mit „Ausreichend“ werden 1296 Klausuren bewertet (6 Punkte: 402; 5 Punkte: 428; 4 Punkte: 466). Und wie man erahnt, liegt fast ein weiteres Drittel unter dem Strich, nämlich 1046 Klausuren (3 Punkte: 406; 2 Punkte: 458; 1 Punkt: 163; 0 Punkte: 19; letztere können auch einem Nichtantritt oder einer Nichtabgabe geschuldet sein, fallen aber zahlenmäßig nicht ins Gewicht).

Der Gesamtdurchschnitt aller Noten liegt bei 5,38, wie man den Berechnungen von examenstats.de entnehmen kann, die nicht nur die Gesamtergebnisse für diese und frühere Prüfungskampagnen liefern, sondern auch gleich Kuchendiagramme und Grafiken zur Notenverteilung. Dieser ist leicht schlechter als der Gesamtdurchschnitt von 5,578 der ebenfalls abrufbaren vorherigen zehn Kampagnen (aber nicht der schlechteste: Die Kampagne 2017/II lag bei 5,36). Die einzelnen Klausuren der Kampagne wurden nach den Auswertungen von examenstats.de im Schnitt wie folgt bewertet: Zivilrecht I: 4,79; Z II: 5,74; Z III: 5,59; Strafrecht I: 5,13; S II: 5,85; Öffentliches Recht I: 4,97; ÖR II: 5,59.

Welche Geschichte erzählen diese Noten?

Vordergründig liegt eine wichtige Folgerung für das eigene gebeutelte studentische Selbstwertgefühl auf der Hand: Alle die Typen, die ständig so tun, als hätten sie die Weisheit mit Löffeln gefressen, und die persönlich die Einsicht gepachtet haben, was „vertretbar“ und was „abwegig“ ist, haben mit großer Wahrscheinlichkeit entweder Examensklausuren mit etwa den dargestellten bescheidenen Resultaten geschrieben oder werden sie bald schreiben. Es handelt sich also ungeachtet ihres selbstbewussten Auftretens um ausreichende oder befriedigende Juristen mit staatlichem Siegel. Von denen muss man sich als Student im zweiten Semester nicht die Butter vom Brot und den Mut aus dem Herzen nehmen lassen.

Jenseits dieser tröstlichen Erkenntnis fragen wir im Folgenden, ob man aus den Zahlen Erkenntnisse über das juristische Prüfungswesen ableiten kann. Sind die Noten in der Gesamtschau tatsächlich unangemessen streng, gar im Einzelfall unfair oder willkürlich?

Die Kandidaten erreichen im universitären Teil an den Berliner und Brandenburgischen Universitäten im Durchschnitt knapp über 10,0 Punkte (DJFT Übersicht Schwerpunkte 2021). Weiter ist statistisch belegt, dass diejenigen, die zur mündlichen Prüfung zugelassen werden, dort im Durchschnitt ca. 9,5 Punkte holen (beispielhaft Jahresbericht des JPA Schleswig-Holstein, Prüfjahr 2021, S. 4 (JPA Schleswig-Holstein Jahresbericht 2021). Die Ergebnisse der schriftlichen Aufsichtsarbeiten weichen hiervor um eine volle Notenstufe nach unten ab – aber wieso eigentlich? Wer bestimmt, dass die durchschnittlichen Leistungen unterhalb der durchschnittlichen Anforderungen liegen, und wonach sich letztere bemessen? Ist nicht eigentlich der reale Leistungsdurchschnitt eine Größe, an der sich auch das Bewertungssystem messen lassen muss? Der Gesetzgeber wird sich sicherlich etwas dabei gedacht haben, wenn er von „Anforderungen“ statt von „Leistungen“ gesprochen hat, womöglich aber nichts Gutes. Der Begriff der Anforderungen könnte unbestimmter kaum sein.

Nicht einmal die Besten erreichen die Bestnote!

Beginnen wir die genauere Betrachtung bei den guten Notenstufen: Das obere Drittel der Notenskala wird mit Blick auf die Durchschnittsnoten noch nicht einmal von den Besten erreicht. Selbst mit Blick auf einzelne Klausuren bleiben Spitzenleistungen die absolute Ausnahme. An der Zumutbarkeit von Klausuren, die bei einer Kohorte von über 500 Kandidaten noch nicht einmal von den Besten mit Bestnote absolviert werden können, mag man Zweifel anmelden. Dies gilt umso mehr für einen Satz von Prüfungsarbeiten, der in der Gesamtschau nur ganz vereinzelt mit über 12 Punkten im Schnitt bewertet wird. Waren einzelne Klausuren zu schwer oder der Satz in seiner Gesamtheit? Zwar schaffen es in jeder Klausur einige Kandidaten, 14 bis 16 Punkte als jeweilige Bestleistung zu erreichen. Die Durchschnittsnoten der Klausuren zwischen 4,79 und 5,85 sprechen hingegen dafür, dass die Klausuren sowohl einzeln wie auch als Klausurensatz zu anspruchsvoll waren. Wie kann es sonst sein, dass nur wenige Topdurchschnittsleistungen an der oberen Grenze des mittleren Notendrittels liegen? Wir sprechen hier immerhin über potenzielle Kandidaten für Bundesgerichte, Hochschulen oder führende Großkanzleien.

Wenn noch nicht einmal die Durchschnittsleistung der Allerbesten in die Nähe der Bestnoten in der Skala kommt, kann das auch auf einen deutlich überladenen und von niemandem zu bewältigenden Prüfungsstoffkanon hinweisen. Der Prüfungsrechtler spricht hier von einem „überfrachteten Prüfungsstoff“, bei dem das Prüfungsergebnis von Zufälligkeiten abhängig gemacht wird, so dass die Chancengleichheit in Frage gestellt ist (Fischer/Jeremias/Dieterich, Prüfungsrecht, 8. Aufl., Rdn. 376). Die Zahlen legen nahe, dass dies ein wesentliches Problem der Prüfung sein könnte.

Auch sonst kann man die Frage aufwerfen, ob gute Leistungen angemessen bewertet werden. Würden wir es als wirklich bemerkenswerte Leistung betrachten, wenn Kandidaten es geschafft hätten, alle sieben Klausuren zu bestehen? Angesichts der 30 % Klausurnoten, die unter dem Strich lagen, scheint das kein Selbstläufer zu sein. Bemerkenswerte 143 Kandidaten haben es tatsächlich geschafft. Im Schnitt haben diese Kandidaten für ihre Leistung aber nur 7,79 Punkte erhalten, und damit noch nicht einmal die Hälfte des Notenspektrums erreicht.

Interessant ist, dass sich einige in der Gruppe der richtig Erfolgreichen immer auch mal einen Ausrutscher erlauben und ein oder zwei nichtbestandene Klausuren aufweisen. Das kann man als weiteren Beleg dafür sehen, dass die Klausurensätze in der Breite womöglich zu anspruchsvoll sind oder der Prüfungsstoff überladen.

Niemand tritt das Examen völlig unvorbereitet „zum Spaß“ an

Werfen wir als nächstes einen Blick auf die Teilnehmer an der Bestehensgrenze, also die vermeintlich schwächeren Kandidaten. Ob es objektiv wirklich schwächere Kandidaten sind, scheint uns allein aufgrund der Klausurleistung schwer bewertbar zu sein, aber vorläufig nehmen wir die Aufsichtsarbeitsnoten mal als entsprechenden Indikator. Nur zur Klarstellung: Wir sprechen hier nicht über Kandidaten, die entweder übermütig und kaum vorbereitet auf gut Glück in den Freischuss gehen oder in der Vorbereitung tatsächlich so faul waren, dass sie nur mit ordentlich Dusel mal eine Klausur bestehen und sonst deutlich unter dem Strich bei Durchschnittsnoten unter 2,5 verharren (an begrenzten intellektuellen Möglichkeiten liegt es nach unserem Eindruck fast nie). Hiervon finden sich in der Liste nur ca. 40 Fälle.

Für die „Bestehensgrenze“ zeigt examenstats.de sehr anschaulich die unerfreulichen Nichtbestehensquoten auf. Diese liegen für den betrachteten Termin bei 24,5 %. Bereits an dem geforderten Mindestpunktedurchschnitt von 3,5 scheitern nach unserer Zählung 108 Kandidaten, an der zusätzlichen Regel der mindestens vier von sieben bestandenen Klausuren weitere 22. Darunter finden sich nicht wenige, die in einzelnen Klausuren sehr ansprechende Leistungen erbracht haben. Augenfällig wird das an zwei Teilnehmern, die mit einem Schnitt von 4,71 (!) infolge zweistelliger Punkte in einer Klausur an der Regel der vier bestandenen Klausuren gescheitert sind.

Bestehenshürde zu hoch!

Eine so nah an der tatsächlichen Durchschnittspunktzahl der Klausuren liegende Bestehensgrenze führt dazu, dass offenbar stets ein Drittel der Kandidaten nicht besteht. Wären die Mindestleistungsregeln großzügiger gestaltet und würde man den universitären Teil sowie das Mündliche als einen potenziellen Kompensationsraum für schwache Leistungen im schriftlichen Pflichtfachteil nehmen, wäre schon viel geholfen. Zudem würden ein anderer Schweregrad und ein abgespeckter Prüfungsstoff diesen Kandidaten erlauben, aus eigener Kraft über die Bestehenshürde zu kommen. Möchte man tatsächlich mit Mindestleistungsregeln arbeiten, dann muss gewährleistet sein, dass hier keine geeigneten Kandidaten vorschnell auf der Strecke bleiben.

Wenn nach einem langjährigen Studium am Ende so viele Teilnehmer scheitern, muss man fragen, ob der Fehler auch im System und nicht bloß bei den Kandidaten zu suchen ist. Wir sehen ihn eindeutig in einem vollständig überladenen und in der Vorbereitung nicht zu bewältigenden Prüfungsstoffkanon. Die Durchschnittsleistungen der Besten belegen dies eindrücklich.

Fazit: Fehler bei der Aufgabenstellung, Fehler im System

Die Aufsichtsarbeiten sind in ihrer Gesamtheit so gestaltet, dass gute Kandidaten nicht ausreichend zeigen können, welch außergewöhnliche Fähigkeiten sie haben. Und vielen eigentlich geeigneten Kandidaten kann es zugleich passieren, dass sie ihr Können nicht zeigen können, sondern scheitern.

Wenn es in unserer Prüfungspraxis nicht möglich war, Bestnoten in einer Klausur zu erreichen, fragen wir uns, was wir im Unterricht oder bei der Aufgabenstellung falsch gemacht haben. Gleiches gilt, wenn eine übermäßige Zahl von Prüflingen scheitert. Es greift zu kurz, die „Schuld“ nur bei den Kandidaten zu suchen.

Bei den schriftlichen Aufsichtsarbeiten der Ersten juristischen Prüfung scheint es umgekehrt zu sein, und dies seit ewigen Zeiten. Ist die Ausbildung zu schlecht, sind die Klausuren zu streng oder ist der Prüfungsstoffkanon zu groß? Wir könnten hier die Nichtbestehensquoten in anderen Studienfächern heranziehen, aber dabei vergleicht man schnell Äpfel mit Birnen, selbst wenn man nur die Staatsexamensstudiengänge zugrunde legte. Interessanter erscheint es uns, die Durchschnittsnoten der weiteren an der Endnote beteiligten Prüfungsteile einzubeziehen. Danach sind die Aufsichtsarbeiten und nicht die Leistungsfähigkeit der Kandidaten das eigentliche Problem. Einen solchen Prüfungsteil mögen andere noch als zumutbar betrachten – überzeugend oder sinnvoll ist das nicht.


Jörn Griebel und Roland Schimmel haben die Staatsprüfungen schon eine ganze Weile hinter sich. Heute arbeiten sie in Lehre, Forschung und Prüfung – und fragen sich, ob die Erste Juristische Prüfung nicht mal gelegentlich reformiert gehört.

Projekt zum Sammeln von Examensergebnissen: Examens Stats

-Werbung-

Ähnliche Artikel

Social Media

6,795FollowerFolgen
2,166FollowerFolgen
Download on the App Store
Jetzt bei Google Play
-Werbung-spot_img
-Werbung-

Letzte Artikel