Bildung•7 Min. Lesezeit

Lernerfolg messen: Das Kirkpatrick-Modell einfach erklärt

FelixCo-Founder, Scibly

Veröffentlicht am21. März 2026

Lernerfolg messen: Das Kirkpatrick-Modell einfach erklärt

In den meisten Unternehmen wird L&D-Erfolg mit einer Kennzahl gemessen: Abschlussquote. Hat der Mitarbeiter den Kurs abgeschlossen? Ja. Fertig.

Das ist so, als würde man den Erfolg einer Arztbehandlung daran messen, ob der Patient die Praxis verlassen hat.

Das Kirkpatrick-Modell, 1959 vom Ausbildungsexperten Donald Kirkpatrick entwickelt, war die erste systematische Antwort auf die Frage: Wie messen wir wirklich, ob eine Schulung gewirkt hat? Bis heute ist es das meistgenutzte Evaluationsframework im Bereich L&D.

#Die vier Ebenen des Kirkpatrick-Modells

Das Modell beschreibt vier Ebenen, auf denen Schulungswirksamkeit gemessen werden kann – von der einfachsten bis zur aussagekräftigsten.

#Ebene 1: Reaktion – Wie hat die Schulung gefallen?

Die erste und häufigste Messung: Was sagen die Lernenden direkt nach der Schulung? Das ist der Zufriedenheitsfragebogen am Ende des Kurses, das Smileys-Rating, die Nachfrage „War das hilfreich?"

Das ist nützlich – aber begrenzt. Eine Schulung, die gut bewertet wird, muss nicht wirksam sein. Menschen mögen oft Schulungen, die unterhaltsam sind oder wenig fordern. Und umgekehrt: Herausfordernde, wirksame Schulungen werden manchmal schlechter bewertet als leichte, wirkungslose.

Was man messen kann: Zufriedenheitsbefragungen, Net Promoter Score für Trainings, qualitatives Feedback.

#Ebene 2: Lernen – Was wurde tatsächlich gelernt?

Hier wird gemessen, ob Wissen, Fähigkeiten oder Haltungen sich verändert haben. Das klassische Instrument: Wissenstests vor und nach der Schulung (Pre- und Post-Test).

Das ist deutlich aussagekräftiger als Zufriedenheitsmessungen. Ein Wissensgewinn zeigt, dass etwas übertragen wurde. Es sagt aber noch nichts darüber aus, ob dieses Wissen im Arbeitsalltag angewendet wird.

Was man messen kann: Wissenstests, Kompetenzbewertungen, Verhaltensbeobachtungen in Simulationen.

Ein häufiger Fehler: Wissenstests werden direkt nach dem Training durchgeführt und als Beweis für Lernerfolg gewertet. Besser: Test nach 30 Tagen – dann zeigt sich, was wirklich hängen geblieben ist.

#Ebene 3: Verhalten – Wird das Gelernte angewendet?

Das ist der kritische Sprung. Wissen und Können sind notwendige Voraussetzungen – aber kein Garant dafür, dass sich das Verhalten am Arbeitsplatz ändert.

Mitarbeiter können nach einer Schulung über Datenschutz alles richtig beantworten – und trotzdem weiterhin Kundendaten unsicher behandeln. Nicht aus böser Absicht, sondern weil das Arbeitsumfeld die gewünschten Verhaltensänderungen nicht unterstützt.

Ebene 3 zu messen ist aufwendiger: Vorgesetzte beobachten Verhalten, Kunden werden befragt, Fehlerraten werden erfasst. Aber erst hier wird sichtbar, ob die Schulung im Alltag angekommen ist.

Was man messen kann: 360-Grad-Feedback, Vorgesetztenbeurteilungen, Fehlerraten, Customer-Feedback.

#Ebene 4: Ergebnisse – Was hat sich für das Unternehmen verändert?

Die aussagekräftigste und schwierigste Ebene: Welchen Einfluss hat die Schulung auf Geschäftsergebnisse gehabt?

Ist die Fehlerquote in der Produktion gesunken?
Haben Verkäufer, die die Produktschulung abgeschlossen haben, mehr verkauft als vorher?
Ist die Kundenzufriedenheit nach dem Servicemeeting-Training gestiegen?

Das klingt einfach – ist es aber nicht. Geschäftsergebnisse werden von vielen Faktoren beeinflusst, und die Schulung aus diesem Bündel herauszulösen erfordert saubere Messdesigns. In der Praxis wird Ebene 4 deshalb selten konsequent gemessen.

Starte mit Ebene 2 und 3. Wissenstests nach 30 Tagen (nicht direkt danach) und einfache Verhaltensbeobachtungen durch Vorgesetzte sind deutlich aussagekräftiger als die Abschlussquote allein – und in den meisten Unternehmen bereits eine erhebliche Verbesserung.

#Warum die meisten Unternehmen bei Ebene 1 stecken

Ebene 1 ist billig und schnell. Ein Fragebogen am Ende des Kurses kostet kaum etwas und liefert sofort Daten – auch wenn diese Daten wenig über Wirksamkeit aussagen.

Ebene 3 und 4 erfordern Zeit, Koordination mit Führungskräften, Follow-up-Prozesse und manchmal aufwendige Messdesigns. Das ist unbequem.

Die Konsequenz: L&D-Teams, die ausschließlich auf Zufriedenheitsdaten optimieren, bauen Schulungen, die gut bewertet werden – nicht solche, die Verhalten ändern. Und das merkt früher oder später jeder, der nach dem Wert von L&D-Investitionen fragt.

#Das Modell in der Praxis

Das Kirkpatrick-Modell ist kein All-or-nothing-Ansatz. Nicht jede Schulung braucht eine Ebene-4-Evaluation. Aber jede Organisation sollte wissen, auf welcher Ebene sie misst – und was das bedeutet.

Eine einfache Faustregel: Wenn du dich gegenüber dem Management für L&D-Investitionen rechtfertigen musst, reicht Ebene 1 nicht. Wenn Schulungen strategisch wichtig sind, miss mindestens Ebene 2 nach 30 Tagen und Ebene 3 mit Führungskräftefeedback.

Beitrag teilen

Vorheriger BeitragSCORM vs. xAPI: Was ist der Unterschied – und was brauche ich wirklich?Nächster BeitragGamification im E-Learning: Mehr als Punkte und Abzeichen

Zurück zum Blog