msm/ Bildung/ Nature RCT 2025
Bildung · Nature · April 2025

KI‑Tutoren schlagen Frontalunterricht — statistisch belegt.

Neural · Tutor
Zusammenfassung

Eine 2025 in Nature Scientific Reports veröffentlichte randomisierte kontrollierte Studie (RCT) hat verglichen, wie viel Studierende mit einem KI‑Tutor zuhause lernen — verglichen mit aktivem Unterricht im Klassenzimmer mit denselben Inhalten. Ergebnis: Effektgröße 0,73 bis 1,3 Standardabweichungen zugunsten der KI‑Tutoren. Bei weniger Zeitaufwand. Eine der größten dokumentierten Wirkungen, die je in der Bildungsforschung gemessen wurden.

Wie groß ist eine Effektgröße von 1,0?

In der empirischen Bildungsforschung gilt:

  • 0,2 SD = kleiner, aber messbarer Effekt.
  • 0,5 SD = mittlerer Effekt — schon als bemerkenswert eingestuft.
  • 0,8 SD = großer Effekt — selten in randomisierten Bildungsstudien.
  • 1,0 SD und mehr = außergewöhnlich, vergleichbar mit Bloom's "Two‑Sigma‑Problem" — der berühmten 1984er Beobachtung, dass 1‑zu‑1‑Tutoring die Leistung um zwei Standardabweichungen steigern kann.

Die Nature‑Ergebnisse von 0,73–1,3 SD liegen in der Region, die Bloom für menschliche 1‑zu‑1‑Tutoren beobachtet hatte. Das ist die Antwort auf seine 40 Jahre alte Frage: "Wie geben wir jedem Schüler einen persönlichen Tutor?" — Die Antwort ist 2025 einigermaßen real geworden.

Was haben sie gemessen?

Studierende einer großen US‑Universität wurden in zwei Gruppen aufgeteilt:

  • Gruppe A: traditioneller Unterricht im Hörsaal mit aktiven Lernmethoden (peer instruction, problem solving)
  • Gruppe B: dieselben Inhalte, aber mit einem KI‑Tutor zuhause

Die KI‑Tutor‑Gruppe schnitt in den abschließenden Tests systematisch besser ab — und brauchte dafür weniger Zeit. Wichtig: Die KI war kein generischer Chatbot, sondern explizit nach research‑based design principles aufgebaut: aktives Lernen fördern, Cognitive Load managen, Feedback gezielt geben, Tempo individuell anpassen.

Effektgrößen großer Bildungsinterventionen
Cohen's d · Quelle: Hattie 2009, Nature 2025
0,73–1,3
Effektgröße SD
−40 %
Lernzeit bei besseren Ergebnissen
RCT
randomisiert kontrolliert

Was bedeutet das?

Die Studie ist nicht ein Beleg dafür, dass KI Lehrer:innen ersetzen sollte. Sondern dafür, dass gut designte KI‑Tutoring‑Systeme als Ergänzung enorme Effekte haben können. Lehrer:innen werden frei für das, was Menschen besser können: Beziehung, Motivation, ethische Einordnung, Prüfung von Verständnis durch echte Gespräche.

"Das ist nicht das Ende des Klassenzimmers — es ist das Ende der Idee, dass alle Schüler:innen im selben Tempo dieselbe Erklärung brauchen."

Limitationen

  • Eine Universität, ein Fachgebiet — Generalisierung steht noch aus.
  • Selbstdisziplin der Studierenden (zuhause lernen) war hoch.
  • Langzeit‑Retention nicht über mehrere Monate gemessen.

Original‑Studie

Direkt zur Open‑Access‑Publikation: nature.com/articles/s41598-025-97652-6

Quellen

  1. Nature Scientific Reports — AI tutoring outperforms in-class active learning: an RCT: nature.com
  2. Brookings — What the research shows about generative AI in tutoring: brookings.edu
  3. Hechinger Report — The quest to build a better AI tutor: hechingerreport.org
  4. Engageli — 25 AI in Education Statistics 2026: engageli.com