KI-Tutor im echten Klassenzimmer: sicher und messbar wirksam.

Stand: 2026-06-14 Quelle: arXiv-RCT, The 74, Eedi/Google Lesedauer: ca. 5 Min.

LearnLM · RCT · Mathematik

Zusammenfassung

Eine kontrollierte Studie (RCT) an fünf britischen Sekundarschulen hat geprüft, ob ein pädagogisch feingetuntes KI-Modell — Googles LearnLM — Schülerinnen und Schülern beim Mathelernen wirklich hilft. Ergebnis: Lernende, die zusätzlich mit dem KI-Tutor arbeiteten, lösten anschließend neue Aufgaben mit 66,2 % Erfolg, gegenüber 60,7 % bei rein menschlicher Betreuung — ein Plus von 5,5 Prozentpunkten. Wichtiger noch als die Zahl ist das „Wie": Die KI wurde in echten Unterrichtssettings getestet und erwies sich als sicher und verlässlich, nicht als Black Box.

Worum geht es?

KI-Tutoren werden seit Jahren euphorisch beschrieben — doch belastbare Belege aus echten Klassenzimmern sind selten. Die meisten beeindruckenden Zahlen stammen aus Laborsettings oder kleinen Pilotgruppen. Diese explorative randomisierte kontrollierte Studie schließt eine Lücke: Sie integrierte LearnLM, ein speziell für Lehr-Lern-Dialoge nachtrainiertes Sprachmodell, in chatbasierte Tutoring-Sitzungen auf der Mathematik-Plattform Eedi — und das mit 165 Schülerinnen und Schülern an fünf weiterführenden Schulen im Vereinigten Königreich.

Der entscheidende Vergleich: Eine Gruppe erhielt Tutoring allein durch Menschen, die andere zusätzlich Unterstützung durch LearnLM. Wer den KI-Tutor nutzte, war danach um 5,5 Prozentpunkte häufiger in der Lage, neue, bislang ungeübte Aufgaben zu lösen (66,2 % statt 60,7 %). Der Effekt zeigt sich also dort, wo es zählt: beim Transfer auf unbekannte Probleme, nicht beim bloßen Nachplappern.

Warum das eine positive Entwicklung ist

Evidenz statt Versprechen. Ein randomisiertes Design im realen Schulalltag ist der Goldstandard. Es trennt echten Lerngewinn von Begeisterung über neue Technik.
Sicherheit zuerst. Die Studie betont ausdrücklich, dass die KI Schülerinnen und Schüler „sicher und wirksam" unterstützte — pädagogisch eingehegt, nicht als unkontrollierter Chatbot.
Lehrkräfte bleiben im Zentrum. Getestet wurde KI als Ergänzung zum menschlichen Tutoring, nicht als Ersatz. Das ist das realistische und wünschenswerte Modell: Technik, die Lehrkräften Reichweite gibt.

Das Ergebnis in Zahlen

Erfolg bei neuen Aufgaben

Anteil korrekt gelöster Transferaufgaben · Quelle: UK-RCT (arXiv)

teilnehmende Sekundarschulen in UK

+5,5 Pp

mehr gelöste Transferaufgaben mit KI

165

Schülerinnen und Schüler im RCT

Eingeordnet in die Beweislage

Die UK-Studie fügt sich in eine wachsende Reihe sauberer Belege. An der Harvard-Universität lernten Studierende mit einem KI-Tutor in weniger Zeit mehr als im aktiven Präsenzunterricht. In Nigeria erreichten Schülerinnen und Schüler mit einem GPT-4-gestützten Nachhilfeprogramm in sechs Wochen Lernfortschritte, die sonst rund zwei Jahre brauchen. Und Stanfords „Tutor CoPilot" zeigte, dass schon eine KI-Assistenz für menschliche Tutoren die Lernergebnisse messbar hebt — besonders bei weniger erfahrenen Tutoren. Das gemeinsame Muster: KI wirkt am stärksten, wenn sie didaktisch geführt und mit menschlicher Begleitung kombiniert wird.

„Die Frage ist nicht mehr, ob KI-Tutoren wirken, sondern unter welchen Bedingungen sie sicher und gerecht wirken."

Was bleibt offen?

Die Studie ist explorativ und mit 165 Teilnehmenden überschaubar; größere, längere Untersuchungen müssen zeigen, ob der Vorsprung dauerhaft ist und sich auf andere Fächer überträgt. Offen bleiben auch Fragen zu Datenschutz, Abhängigkeit und dazu, ob schwächere Lernende ähnlich profitieren wie stärkere. Doch als sauber kontrollierter Nachweis aus echten Klassenzimmern verschiebt diese Arbeit die Debatte von „ob" zu „wie" — und genau dort sollte sie hin.

Original-Quellen

Vorabdruck der Studie: arxiv.org/abs/2512.23633

Quellen

arXiv — AI tutoring can safely and effectively support students: An exploratory RCT in UK classrooms: arxiv.org/abs/2512.23633
The 74 — AI Tutors, With a Little Human Help, Offer 'Reliable' Instruction, Study Finds: the74million.org
Scientific Reports — AI tutoring outperforms in-class active learning: an RCT (Harvard): nature.com
Stanford SCALE — How AI can improve tutor effectiveness (Tutor CoPilot): scale.stanford.edu
World Bank — From Chalkboards to Chatbots: Evaluating the Impact of Generative AI on Learning Outcomes in Nigeria: documents.worldbank.org