
Was hat dein letztes Lehrkonzept gelernt? Nicht deine Studierenden. Das Konzept selbst.
Die Frage klingt ungewohnt. Sie ist es auch.
Wir sind daran gewöhnt, Evaluation auf Studierende zu beziehen: Klausurergebnisse, Semesterabschlussfórmulare, Bewertungen auf Plattformen. Diese Daten existieren. Sie werden gesammelt, manchmal gelesen, selten wirklich ausgewertet – und noch seltener in konkrete Änderungen übersetzt, die das nächste Semester besser machen.
Dabei ist Evaluation im ADDIE-Modell keine Messung von Studierendenleistung. Sie ist eine Messung der Lehrarchitektur. Die Frage ist nicht: Haben die Studierenden die Lernziele erreicht? Sondern: Hat das Lehrkonzept die Bedingungen geschaffen, unter denen Lernen möglich war? Wo hat die Architektur funktioniert – und wo nicht?
Diese Frage ist unbequem. Sie richtet sich an die Planung, das Design, die Materialien, die Durchführung. An Entscheidungen, die man selbst getroffen hat. Genau deshalb wird Evaluation so oft übersprungen. Nicht aus Desinteresse – sondern weil das Semester weiterläuft, das nächste Modul wartet und das Gefühl als ausreichende Grundlage gilt.
Die Evaluationsphase: Abschluss und Neustart
Im ADDIE-Modell ist Evaluation keine Endstation. Sie ist die Phase, die den Kreislauf schließt – und den nächsten öffnet. Was die Evaluation sichtbar macht, fließt zurück in die Analyse des nächsten Semesters: Was hat gelernt? Was braucht die nächste Gruppe? Was muss im Design verändert werden?
Dabei gibt es zwei Arten von Evaluation, die beide gebraucht werden.
Formative Evaluation findet während der Lehrveranstaltung statt: kurze Stimmungsbilder, Blitzlicht-Reflexionen, Exit-Tickets nach einzelnen Sitzungen. Ihr Ziel ist nicht die Rückschau, sondern die Echtzeitsteuerung. Was braucht die Gruppe jetzt, damit die nächste Sitzung besser passt?
Summative Evaluation findet am Ende statt: strukturierte Abschlussbefragungen, Analyse von Klausurergebnissen im Vergleich zur Designgrundlage, Reflexion auf das gesamte Semester. Ihr Ziel ist die Rückkopplungsschleife – was geht verändert in den nächsten Zyklus?
Beide sind ohne KI möglich. Aber KI macht den entscheidenden Schritt kürzer: die Übersetzung von Daten in Konsequenzen.
Was KI in der Evaluationsphase leistet – und was Urteil bleibt
Das häufigste Problem der Evaluationsphase ist nicht das Fehlen von Daten. Es ist das Fehlen von Zeit und Struktur, um Daten in nutzbare Erkenntnisse zu übersetzen. Abschlussbefragungen werden exportiert, aber nicht ausgewertet. Beobachtungen aus dem Semester existieren – aber sie bleiben im Gefühl, nicht in der Dokumentation.
Genau hier greift KI sinnvoll ein. Sie kann Feedback-Daten aus einem Abschlussformular analysieren, Muster identifizieren und diese mit dem Designkonzept abgleichen: Hat das, was geplant war, auch das geleistet, was es sollte? Sie kann die Sitzungsreflexionen, die nach der Implementation entstanden sind, zu einem Semesterrückblick verdichten. Und sie kann konkrete Empfehlungen formulieren – nicht als Urteil, sondern als Impulse für die nächste Analysephase.
Was KI nicht kann: einschätzen, was in den Beziehungen des Semesters passiert ist. Verstehen, warum ein Studierender schweigend im Hintergrund blieb. Entscheiden, ob eine Methode scheiterte, weil sie falsch war – oder weil der Zeitpunkt falsch war. Diese Einschätzungen erfordern pädagogische Erfahrung und menschliches Urteil. Sie sind nicht delegierbar.
Hands-on: Zwei Prompts für die Evaluationsphase
Prompt 1: Die formative Mini-Evaluation – während des Semesters
Dieser Prompt eignet sich für den Einsatz nach einzelnen Sitzungen oder Modulphasen. Er hilft, aus kurzen Stimmungsbildern oder Exit-Tickets schnell auswertbare Rückmeldungen zu ziehen – und direkt in die nächste Planung zu übersetzen.
Ich habe nach der heutigen Sitzung zu [Thema] folgende kurze Rückmeldungen von der Gruppe gesammelt: [Freitext oder Kurzantworten einfügen].
Werte diese Rückmeldungen aus:
1. Was wird am häufigsten als positiv beschrieben – und was davon war eine bewusste Designentscheidung?
2. Was wird am häufigsten als hemmend oder unklar beschrieben? Gibt es ein erkennbares Muster?
3. Was sollte ich in der nächsten Sitzung direkt anpassen – und was kann bis zur summativen Evaluation warten?
Beziehe dich auf mein Designkonzept und mein Teaching Statement. Ich möchte wissen, ob die Rückmeldungen auf ein strukturelles Problem hinweisen oder auf eine situative Ausnahme.
Prompt 2: Die summative Auswertung – nach dem Semester
Dieser Prompt schließt den ADDIE-Zyklus – und öffnet den nächsten. Er nutzt alle Daten, die im Laufe des Semesters gesammelt wurden: Abschlussfeedback, Sitzungsreflexionen, Klausurergebnisse, eigene Beobachtungen.
Das Semester ist abgeschlossen. Ich lade die folgenden Daten hoch: [Abschlussbefragung / Sitzungsreflexionen / Klausurergebnisse / eigene Notizen].
Erstelle einen strukturierten Semesterrückblick:
1. Lernziel-Abgleich: Welche Lernziele aus dem Designkonzept wurden laut den Daten erreicht – und wo gibt es Hinweise, dass sie nicht oder nur teilweise erreicht wurden?
2. Designentscheidungen bewerten: Welche Methoden, Sozialformen oder Materialien haben nachweislich gut funktioniert? Welche weniger – und was könnten Gründe sein?
3. Systemische Muster: Gibt es Beobachtungen, die sich über mehrere Sitzungen wiederholen und auf etwas Strukturelles hinweisen?
4. Empfehlungen für den nächsten Zyklus: Welche drei konkreten Fragen sollten am Beginn der nächsten Analysephase stehen?
Formuliere die Empfehlungen als Impulse, nicht als Urteile. Ich entscheide, was ich daraus mache.
Das Ergebnis des zweiten Prompts ist nicht das Ende. Es ist die Rückkopplungsschleife zurück in die Analysephase – zu Artikel 1 dieser Reihe. Was die Evaluation sichtbar gemacht hat, fließt in das nächste Semester ein: als schärfere Fragen, als bewusstere Designentscheidungen, als Lehrkonzept, das gelernt hat.
Eine Frage zum Schluss
Wenn du an dein letztes vollständiges Semester zurückdenkst: Was wäre im nächsten anders gewesen, wenn du eine strukturierte Auswertung gemacht hättest? Und was hat dich davon abgehalten?




