Stand: 18. Mai 2026
Diese Bibliothek sammelt Quellen, die für schulische KI-Didaktik belastbar genug sind, um Entscheidungen zu stützen. Sie trennt zwischen Lernwirkung, Risiko, Rahmenkompetenz und Governance. Die zentrale Lesart bleibt: Nicht das Tool ist die Intervention, sondern das didaktische Setting.
Kurzsynthese
- Tutor- und Feedback-Settings können wirksam sein, wenn sie eng geführt sind, fachliche Ziele verfolgen und nicht einfach Lösungen ausgeben.
- Ungebremste Antwortmaschinen sind riskant, weil sie kurzfristige Übungsleistung erhöhen können, ohne späteren Transfer ohne KI zu sichern.
- AI Literacy wird prüfungs- und governance-relevant, weil OECD/PISA, UNESCO und EU AI Act KI-Kompetenz nicht als Tooltraining, sondern als Urteilskompetenz definieren.
- Detektoren sind keine tragfähige Integritätsstrategie. Prozessnachweise, Deklaration, Transferaufgaben und mündliche Verteidigung sind fairer und didaktisch stärker.
Quellen
Bastani et al. 2025 · PNAS · Evidenz: hoch
Generative AI without guardrails can harm learning: Evidence from high school mathematics
Randomisierte Studie mit knapp 1000 High-School-Lernenden in Mathematik. Standard-GPT-4 half während der Übungsphase, führte aber im späteren Test ohne KI zu schwächerer Leistung als die Kontrollgruppe. Ein Tutor-Design mit Guardrails reduzierte diesen Effekt.
Didaktische Übersetzung: KI als Antwortmaschine ist nicht gleich KI als Tutor. Für Schule sind Guardrails, Transferaufgaben ohne KI und klare Rollenentscheidungen zentral.
Kestin et al. 2025 · Scientific Reports · Evidenz: hoch, Kontext: Hochschule
AI tutoring outperforms in-class active learning
Randomisierte Studie in einem authentischen STEM-Setting. Ein forschungsbasiert gestalteter AI-Tutor erzielte starke Lerngewinne gegenüber aktiver Präsenzlehre bei kürzerer Lernzeit. Die Autor:innen betonen, dass das Design stark strukturiert war und nicht einfach freier Chat.
Didaktische Übersetzung: Positive Tutor-Effekte sind möglich, aber sie hängen an Designqualität, Aufgabenpassung und fachlicher Kontrolle.
De Simone et al. 2025 · World Bank · Evidenz: hoch, Kontext: Entwicklungs- und Nachhilfeprogramm
Learning to Learn with AI: Evidence from a Randomized Controlled Trial in Nigeria
Randomisierte Studie zu einem sechswöchigen, begleiteten GPT-4/Copilot-Nachhilfeprogramm. Der Befund spricht für strukturierte, beaufsichtigte KI-Tutoring-Settings, nicht für freie unbegleitete Toolnutzung.
Didaktische Übersetzung: KI kann besonders dort helfen, wo Anleitung, Aufgabenstruktur und regelmäßige Lernzeit zusammenkommen.
Liu et al. 2025 · Journal of Educational Computing Research · Evidenz: mittel bis hoch
Effects of Generative Artificial Intelligence on K-12 and Higher Education Students' Learning Outcomes: A Meta-Analysis
Meta-Analyse zu GenAI in K-12 und Hochschule. Die durchschnittlichen Effekte auf Leistung und Motivation sind positiv, aber stark abhängig von Kontext, Dauer, Rolle des Tools und Lernsteuerung.
Didaktische Übersetzung: Meta-Analysen stützen kein pauschales "KI wirkt", sondern ein bedingtes "KI wirkt unter bestimmten didaktischen Bedingungen".
OECD 2026 · Digital Education Outlook · Evidenztyp: Policy-Synthese
Exploring Effective Uses of Generative AI in Education
Die OECD bündelt Evidenz und Policy-Perspektiven zu generativer KI in Bildung. Der Schwerpunkt liegt auf menschlicher Urteilskraft, Feedback, Lehrpersonenkompetenz und klarer Nutzungspraxis.
Didaktische Übersetzung: Schulen brauchen nicht nur Toolzugang, sondern eine lernbezogene Nutzungsordnung: Wo hilft KI? Wo braucht es KI-freie Diagnose? Wer prüft Qualität?
OECD / Europäische Kommission 2025-2026 · Evidenztyp: Kompetenzrahmen
Empowering Learners for the Age of AI / PISA 2029 MAIL
Der AI-Literacy-Rahmen für Primar- und Sekundarbildung und der PISA-2029-Bereich Media and Artificial Intelligence Literacy verschieben den Fokus von Toolbedienung zu kritischer, kreativer und verantwortlicher Teilhabe.
Didaktische Übersetzung: AI Literacy ist Querschnittskompetenz. Sie umfasst Erkennen, Prüfen, Gestalten, Grenzen setzen und Verantwortung übernehmen.
UNESCO 2024 · Evidenztyp: Kompetenz- und Governance-Rahmen
AI Competency Frameworks for Students and Teachers
UNESCO legt Kompetenzrahmen für Lernende und Lehrpersonen vor. Leitend sind Human Agency, Ethik, Datenschutz, kritisches Verständnis und verantwortlicher Einsatz.
Didaktische Übersetzung: Professionalisierung darf nicht bei Prompting stehenbleiben. Lehrpersonen brauchen didaktische, ethische und organisatorische Urteilskompetenz.
Liang et al. 2023 · Patterns · Evidenz: hoch für Detektor-Risiko
GPT detectors are biased against non-native English writers
Die Studie zeigt systematische Fehlerrisiken von KI-Detektoren, insbesondere bei Texten von Nicht-Muttersprachler:innen. Für Schulen ist das relevant, weil Detektorurteile soziale und bewertungsbezogene Folgen haben.
Didaktische Übersetzung: Detektoren dürfen keine Grundlage für Sanktionen sein. Fairer sind Prozessdokumentation, Deklaration, Transferaufgaben und Gespräch.
Arbeitsregel für Entscheidungen
Eine Quelle verändert erst dann Schulhandeln, wenn vier Fragen beantwortet sind:
- Setting: In welchem Fach, Alter, Vorwissen und Zeitrahmen wurde der Effekt gemessen?
- Rolle der KI: Antwortmaschine, Tutor, Feedbackgeber, Coach, Recherchewerkzeug oder Bewertungsassistenz?
- Nachweis: Wurde nur Leistung während der KI-Nutzung gemessen oder auch Transfer ohne KI?
- Übertragbarkeit: Welche Bedingungen müsste unsere Schule herstellen, damit der Befund überhaupt gelten kann?