In 1954 schreef Kirkpatrick zijn proefschrift over het onderwerk ‘de vier niveaus van leeractiviteit,’ dat hij vertaald heeft naar een boek Evaluating Training Programs, dat gepubliceerd werd in 1994. Hij beschreef vier op elkaar voortbouwende niveaus om het resultaat van trainingen te meten en te beoordelen of de opgedane kennis van een training zich ook vertaalt naar veranderingen in houding en gedrag.
In dit model noemt Kirkpatrick een aantal niveaus van evaluatie:
Reactie: evalueren op tevredenheid en op relevantie en betrokkenheid (tevredenheid)
Het onderste en eerste niveau gaat in op de reactie en de evaluatie van de deelnemers:
- Hoe is de training ervaren door de deelnemers?
- Zijn zij tevreden over de training?
- Sluit de training aan bij de behoefte?
Hierbij moet wel opgemerkt worden dat een positieve evaluatie niet noodzakelijkerwijs een effectieve training signaleert. Een positieve evaluatie kan immers ook een indicatie zijn van sociaal wenselijke antwoorden, een hoge gunfactor van de trainer, of een training die weinig uitdaging heeft geboden en de deelnemers vooral gevoed heeft in hun comfort zone. Evaluatie op dit niveau bestaat vaak uit een schriftelijk evaluatieformulier dat ter plekke wordt ingevuld. Andersom kan een negatieve evaluatie duiden op een training die op lange(re) termijn zeer effectief bleek te zijn, juist omdat de trainer de deelnemers uit hun comfortzone heeft gehaald.
Leren: evalueren op de kennis en vaardigheden die de training als doel heeft (verworven kennis & vaardigheden)
Voortbouwend op de evaluatie bij de deelnemers wordt op dit niveau geëvalueerd of de kennis en vaardigheden ook is ‘blijven hangen’ bij de deelnemers.
- Is er een leereffect opgetreden?
- Wat weten de deelnemers nu meer/beter?
- Wat kunnen de deelnemers nu meer/makkelijker/effectiever/efficiënter?
Dit wordt vaak geëvalueerd door een examen, waarbij aangetoond wordt of de deelnemers de kennis kunnen reproduceren.
Gedrag: evalueren op het gedrag in de dagelijkse praktijk (transfer)
Op dit niveau wordt gekeken naar de transfer naar de praktijk: passen de deelnemers de kennis en vaardigheden ook daadwerkelijk toe in de dagelijkse praktijk?
- Is er transfer naar de toepassing in de praktijk?
- Is verandering in houding en gedrag merkbaar in de dagelijkse praktijk?
Een voorbeeld van toetsing op dit niveau is het praktijkgedeelte van het rijbewijs-examen.
Resultaat: evalueren op de impact van veranderingen in kennis, vaardigheden en gedrag (impact)
Op dit niveau wordt gekeken naar de impact van de veranderingen in houding en gedrag op de organisatiedoelstellingen
- Vertaalt de verandering in houding en gedrag zich naar de beoogde organisatiedoelstellingen?
- Is de verandering merkbaar voor cliënten, leidinggevenden, collega’s en/of voor ketenpartners?