Aus der intensiven Beschäftigung mit Fragen von Lernen, Leistung und Leistungsüberprüfung meine ich eine Lösung für drei Probleme erdacht zu haben, die mich seit einiger Zeit beschäftigen. Die Frage danach, inwiefern Leistungsüberprüfungen an die digitale Wirklichkeit angepasst werden können. Die Frage, inwiefern kooperatives Handeln auch in solchen Prüfungen möglich ist und die Frage danach, ob dies auf eine Weise möglich ist, die dennoch eine individuelle Rückmeldung auf den Leistungsstand erlaubt. Ein Gedankenexperiment mit Umsetzungspotenzial.
Vorrede
Dieser Beitrag mag ein paar Gedankengänge erfordern, aber ich denke, dass er dennoch Mehrwert für alle bietet, die unzufrieden sind mit der Diskrepanz von tradierten Klausuren und Prüfungsformaten und deren Aussagekraft für ein tiefergehendes Verständnis. Dies sei deshalb angemerkt, weil ich schon, während ich diese Zeilen schreibe, davon ausgehe, dass man einige Argumente, die zunächst wenig verbunden scheinen, mitdenken sollte, um den Lösungsansatz zu verstehen.
Die Probleme
Die drei Probleme sind schon in der Einleitung vermerkt. Aber auch sie bedürfen einer kurzen Kontextuierung. Denn sind sind voraussetzungsreich. Sie werden erst dann als Probleme erkannt, wenn die Zielsetzung der einzelnen Lehrkraft auch ist, Prüfungen überhaupt als wenig aussagekräftig zu betrachten. Mit anderen Worten: Wer meint, dass eine Klausur alle 6 Wochen (je nach Fach) valide ist, sich bewährt hat und keiner Änderung bedarf, der hat auch kein Problem.
Zumindest keines, das bewusst wäre. Denn schon längst wissen Schülerinnen und Schüler, wer jedes Jahr dieselbe Arbeit schreibt. Und sie reichen diese weiter. Wieso auch nicht? Eine solche (natürlich vonseiten der Institution ungewünschte) Form der Kooperation nutzt die Schwachstelle eines Systems, die in diesem Fall von der Lehrkraft verkörpert wird. Es gibt auch andere Schwachstellen, gravierende. Wenn es in der Schule weniger um den Prozess des Lernens als um dessen Produkt geht, kann man den Schüler*innen nicht verdenken, wenn sie dies in ihrem Sinne nutzen. Das stimmt einmal mehr, als dass diese Produkte ja oftmals beziffert werden, als dass sie die Grundlage für das weitere Lernen sind. Konkret: Wieso sollte ChatGPT auch nicht meinen Essay schreiben, wenn es zu dem Zeitpunkt, an dem ich es noch nicht geübt habe, einen sehr viel überzeugenderen schreiben kann als ich? Wer würde nicht diese Effizienz eintauschen gegen eine oder mehrere Ziffern, die letztlich ein Zeugnis ausmachen? Damit entfremdet man sich aber von dem, was man, dann, nicht lernt.
Das alles bedeutet: Nur wenn aus der Haltung der Offenheit für eine sich ändernde Welt die Überzeugung erwächst, dass sich auch formale Strukturen der Leistungsüberprüfung ändern müssen, hat man überhaupt die Probleme, die ich hier „lösen“ möchte.
Die Lösung schreibe ich deshalb in Anführungszeichen, weil sie noch nicht erprobt ist. Das werde ich (in dem Fall in Rücksprache mit Abteilungsleitung und/ oder Schulleitung) aber tun. Damit ist der Ansatz aber zunächst ein Hirngespinst und als solches der Beitrag ein lautes Denken.
Die Herleitung
Gerade bei Fragen der Leistungsüberprüfung gibt es einige Ansätze, dies aus meiner Sicht wenig durchdacht sind. So beispielsweise eine Durchführung mithilfe von Erwachsenen - die dann aber angegeben werden müssen. Unabhängig davon, dass man in der Tat in der Welt außerhalb der Schule nachfragen kann, wenn man denn in der Lage ist, kennen nicht alle Kinder Erwachsene mit demselben Vorwissen. In dem Fall können also alle jemanden nennen, aber ob dieser Jemand Akademiker ist oder nicht, das bestimmt wieder der familiäre Kontext.
Der zweite Punkt ist jener, der diesen Fall als für die Überprüfung unsinnig werden lässt. Denn selbst wenn man der Überzeugung ist, dass Leistung als Prozess gedacht werden muss (was ich auch tue), ist Leistungsorientierung per se gar nichts Schlechtes. Im Gegenteil: Wilhelm von Humboldt pries die Leistungsorientierung - zu Recht - als Möglichkeit an, Standesunterschiede zu überwinden. Freilich, eine andere Zeit. Aber der Punkt ist: Das bedeutet nicht, dass Chancengleichheit herrscht, da ja der soziale Kontext Leistung überhaupt erst katalysieren kann. Aber es bedeutet eben auch, dass die individuelle Leistung (sofern sie unter annähernd gleichen Bedingungen zustande kommt), einen Wert für denjenigen hat, der sie erbringt. Dass dies nicht zwangsläufig eine Benotung bedeuten muss, sei hier am Rande erwähnt.
Vor diesem Hintergrund ist es wichtig, nicht nur von der Prüfungssituation her zu denken, sondern von der Vorbereitung auf dieselbe. Und genau hier begann der Gedankengang: Ich überlegte mir, wie ich den funktionalen Einsatz von ChatGPT für das Lernen (und nicht gegen dasselbe) im Unterricht thematisieren könnte.
Die Vorbereitung Auch hier gehe ich noch davon aus, dass ich bessere Argumente haben werde. Und dies deshalb, weil ich nicht denke, dass die Schüler*innen einfach so die richtigen Strategien anwenden werden. Auch hier mag ich mich eines besseren belehren lassen, das wäre sogar wünschenswert, aber jedenfalls werden es nicht alle Gruppen schaffen.
Alleine diese Tatsache, so meine Vermutung, führt zu der interessierten oder genervten Nachfrage, wie sie es denn nun schaffen werden, mich zu überzeugen.
Das ist deren Problem! Und meine Lösung ist, dass wir den konstruktiven Gebrauch gemeinsam einüben. Dabei werden Prompts genauso eine Rolle spielen wie der Hinweis darauf, wie diese zu besseren Argumenten, und vor allem, zu validen Belegen führen.
Das allein stellt also einen Prozess in den Mittelpunkt, der ich einfach von einer intuitiven Nutzung ausgeht, sondern KI im Sinne einer Vertiefung des eigenen Lernens nutzbar macht.
Die Problemlösung bei der Klausur
Diese Gedanken sind es, die mich, mal wieder, zu den drei Problemen geführt haben, die ich hier nochmals wiederhole.
- Die Frage danach, inwiefern Leistungsüberprüfungen an die digitale Wirklichkeit angepasst werden können.
- Die Frage, inwiefern kooperatives Handeln auch in solchen Prüfungen möglich sind.
- Die Frage danach, ob dies auf eine Weise möglich ist, die dennoch eine individuelle Rückmeldung auf den Leistungsstand erlaubt.
Wenn wir davon ausgehen, dass Schülerinnen und Schüler nach weiteren Wiederholungs- und Vertiefungsschlaufen, in der Lage sind, ChatGPT zu nutzen (und zu überprüfen, ob die dort präsentierten Ergebnisse valide sind), dann lässt sich aus meiner Sicht eine Prüfungsleistung erbringen, die in der Klasse durchgeführt werden kann, also eine Art Abschlussprüfung (oder Klausur) darstellt, die aber gleichzeitig kooperative Elemente beinhaltet als auch eine individuelle Leistung erbringen lässt. Nebenbei ist sogar die Prüfung selbst eine weitere Übung.
Eine solche Prüfungsleistung besteht in meinem ersten Ansatz aus vier voneinander abgegrenzten Teilen:
- Der genauen Betrachtung der Aufgabe (oder eines dazu angehängten Textes, um den es gehen soll).
- Der individuellen Überlegung, welcher Prompt eingesetzt werden könnte, um die Frage am besten zu beantworten.
- Der Diskussion über die Prompts.
- Der Eingabe und die Einbeziehung.
- Und der anschließenden Erstellung eines individuellen Textes, der die Ergebnisse einbeziehen kann (aber nicht muss).
Mit anderen Worten: Wenn die Schülerinnen und Schüler die Klausuraufgabe bekommen haben (nehmen wir an einen Meinungstext zu einem Thema), dann können sie einen Befehl erstellen, der ihnen, aus ihrer Sicht, bei der Beantwortung hilft. Und nun kommt es: Dann haben die Schülerinnen im Plenum (oder in Gruppen, das muss ich noch durchdenken) Zeit, sich auf EINEN Prompt zu einigen. Die Argumente für den einen und gegen den anderen ist das, was einen zusätzlichen Lerneffekt IN der Klausur beinhaltet. Denn es muss hier ja schon über mögliche Ausgänge nachgedacht und diskutiert werden.
Wenn eine Einigung stattfindet (wie und wann genau muss ich auch noch überdenken), haben alle die Möglichkeit, das Ergebnis einzubeziehen.
Aus meiner Sicht führt das zu drei elementaren Konsequenzen:
- Alle sind auf das kommende Thema vorbereitet, der „Zufall“, ob das Thema einem liegt, spielt eine viel kleinere Rolle.
- Die Einbeziehung der KI ermöglicht eine Prüfungsleistung, die sehr viel näher an einer Problemlösung außerhalb der Schule ist, in der man, wenn man dazu in der Lage ist, ja auch KI nutzen oder Websites aufrufen würde.
- Die tatsächliche Überprüfung durch die Lehrkraft muss sehr viel mehr auf diese Angleichung eingehen, so dass es nicht „einfacher“ wird in dem Sinne, das keine Überprüfung mehr möglich ist (alle haben den Zaubertrank getrunken), sondern sehr viel mehr auf das geachtet wird, das wiederum auch außerhalb der Schule Betrachtung findet: Nämlich die Art und Weise, wie eine Erkenntnis, ein Beleg oder ein Fund in die eigene Argumentation eingebaut wird.
Letzterer Punkt macht es auch nötig, genau diese Art und Weise zu üben, sonst würde man von der einen unfairen Praxis auf die andere Schwenken (und es geht ja bei Überprüfungen auch darum, valide zu prüfen).
Offene Fragen
Führt eine solche Praxis nicht dazu, dass einfach alle sehr gut sind? Nun, wenn Punkt drei berücksichtigt wird, nicht. Vor allem aber wäre hier die Frage, ob ein solches Kompetenzerlebnis denn unbedingt schlecht sein muss. Denn das Argument, dass alle die gleichen Chancen haben, wenn man nur genügend jener Mittel ausschließt, die ansonsten überall aufgerufen werden können, ist längst hinfällig: Ob jemand auf dem falschen Fuß erwischt wird, das falsche Thema hat, eine Jugendliche ihre Tage hat oder sonstige Unwägbarkeiten Einfluss haben, weiß man bei tradierten Formaten auch nicht.
Vielmehr wird mit Prüfungen insbesondere die Fähigkeit bewertet, einem standardisierten Format zu genügen. Löst sich das mit diesem Ansatz komplett auf? Nein. Aber in gewisser Weise ist dies im Sinne der Leistungsmessung auch durchaus gut. Denn wenn der Unterricht erlaubt, dass alle lernen und üben (und die wichtigsten Phasen nicht in die Hausaufgaben verlegt werden, die es dann wieder unfair machen) haben jene, die konzentriert arbeiten und danach streben, sich zu verbessern natürlich einen Vorteil. Oder anders gesagt: Den Schülerinnen und Schülern muss klar sein, dass der Unterricht selbst jene Übungszeit ist, die ihnen später ermöglicht, bei der Prüfung ihr Können zu zeigen. Das muss durch die Lehrkraft deutlich gemacht werden, ist dann aber keine Floskel mehr, weil man ja tatsächlich einen nutzen von der Übung hat.
Fazit
In den Ausführungen gibt es noch einige Leerstellen. Die größte darunter, dass hier von einer Praxis gesprochen wird, die sowohl in der Vorbereitung als auch in der Durchführung so noch nicht erprobt worden ist. Insofern werde ich darüber berichten, sofern ich diese Form der Überprüfung ausprobieren kann.
Ich bin aber optimistisch. Auch deshalb, weil die Einbeziehung von KI mehr bedeutet als eine Angleichung der Voraussetzungen und der realen Welt. Längst ist bewiesen, dass die Motivation für Leistungserbringung vor allem damit zusammenhängt, ob man sich in der Lage sieht (durch Anstrengung und Übung) zu zeigen, wie man sich weiterentwickelt hat. Dies ist durch diese Idee, aus meiner Sicht, gegeben.
Ich freue mich über die Gedanken all derer, die bis hierhin gelesen haben und werde über die Durchführung berichten.