Evidenzbibliothek: KI und Lernen

Stand: 18. Mai 2026

Diese Bibliothek sammelt Quellen, die für schulische KI-Didaktik belastbar genug sind, um Entscheidungen zu stützen. Sie trennt zwischen Lernwirkung, Risiko, Rahmenkompetenz und Governance. Die zentrale Lesart bleibt: Nicht das Tool ist die Intervention, sondern das didaktische Setting.

Kurzsynthese

Tutor- und Feedback-Settings können wirksam sein, wenn sie eng geführt sind, fachliche Ziele verfolgen und nicht einfach Lösungen ausgeben.
Ungebremste Antwortmaschinen sind riskant, weil sie kurzfristige Übungsleistung erhöhen können, ohne späteren Transfer ohne KI zu sichern.
AI Literacy wird prüfungs- und governance-relevant, weil OECD/PISA, UNESCO und EU AI Act KI-Kompetenz nicht als Tooltraining, sondern als Urteilskompetenz definieren.
Detektoren sind keine tragfähige Integritätsstrategie. Prozessnachweise, Deklaration, Transferaufgaben und mündliche Verteidigung sind fairer und didaktisch stärker.

Quellen

Bastani et al. 2025 · PNAS · Evidenz: hoch

Generative AI without guardrails can harm learning: Evidence from high school mathematics

Randomisierte Studie mit knapp 1000 High-School-Lernenden in Mathematik. Standard-GPT-4 half während der Übungsphase, führte aber im späteren Test ohne KI zu schwächerer Leistung als die Kontrollgruppe. Ein Tutor-Design mit Guardrails reduzierte diesen Effekt.

Didaktische Übersetzung: KI als Antwortmaschine ist nicht gleich KI als Tutor. Für Schule sind Guardrails, Transferaufgaben ohne KI und klare Rollenentscheidungen zentral.

Quelle öffnen

Kestin et al. 2025 · Scientific Reports · Evidenz: hoch, Kontext: Hochschule

AI tutoring outperforms in-class active learning

Randomisierte Studie in einem authentischen STEM-Setting. Ein forschungsbasiert gestalteter AI-Tutor erzielte starke Lerngewinne gegenüber aktiver Präsenzlehre bei kürzerer Lernzeit. Die Autor:innen betonen, dass das Design stark strukturiert war und nicht einfach freier Chat.

Didaktische Übersetzung: Positive Tutor-Effekte sind möglich, aber sie hängen an Designqualität, Aufgabenpassung und fachlicher Kontrolle.

Quelle öffnen

De Simone et al. 2025 · World Bank · Evidenz: hoch, Kontext: Entwicklungs- und Nachhilfeprogramm

Learning to Learn with AI: Evidence from a Randomized Controlled Trial in Nigeria

Randomisierte Studie zu einem sechswöchigen, begleiteten GPT-4/Copilot-Nachhilfeprogramm. Der Befund spricht für strukturierte, beaufsichtigte KI-Tutoring-Settings, nicht für freie unbegleitete Toolnutzung.

Didaktische Übersetzung: KI kann besonders dort helfen, wo Anleitung, Aufgabenstruktur und regelmäßige Lernzeit zusammenkommen.

Quelle öffnen

Liu et al. 2025 · Journal of Educational Computing Research · Evidenz: mittel bis hoch

Effects of Generative Artificial Intelligence on K-12 and Higher Education Students' Learning Outcomes: A Meta-Analysis

Meta-Analyse zu GenAI in K-12 und Hochschule. Die durchschnittlichen Effekte auf Leistung und Motivation sind positiv, aber stark abhängig von Kontext, Dauer, Rolle des Tools und Lernsteuerung.

Didaktische Übersetzung: Meta-Analysen stützen kein pauschales "KI wirkt", sondern ein bedingtes "KI wirkt unter bestimmten didaktischen Bedingungen".

Quelle öffnen

OECD 2026 · Digital Education Outlook · Evidenztyp: Policy-Synthese

Exploring Effective Uses of Generative AI in Education

Die OECD bündelt Evidenz und Policy-Perspektiven zu generativer KI in Bildung. Der Schwerpunkt liegt auf menschlicher Urteilskraft, Feedback, Lehrpersonenkompetenz und klarer Nutzungspraxis.

Didaktische Übersetzung: Schulen brauchen nicht nur Toolzugang, sondern eine lernbezogene Nutzungsordnung: Wo hilft KI? Wo braucht es KI-freie Diagnose? Wer prüft Qualität?

Quelle öffnen

OECD / Europäische Kommission 2025-2026 · Evidenztyp: Kompetenzrahmen

Empowering Learners for the Age of AI / PISA 2029 MAIL

Der AI-Literacy-Rahmen für Primar- und Sekundarbildung und der PISA-2029-Bereich Media and Artificial Intelligence Literacy verschieben den Fokus von Toolbedienung zu kritischer, kreativer und verantwortlicher Teilhabe.

Didaktische Übersetzung: AI Literacy ist Querschnittskompetenz. Sie umfasst Erkennen, Prüfen, Gestalten, Grenzen setzen und Verantwortung übernehmen.

AI-Literacy-Framework öffnen

PISA 2029 MAIL öffnen

UNESCO 2024 · Evidenztyp: Kompetenz- und Governance-Rahmen

AI Competency Frameworks for Students and Teachers

UNESCO legt Kompetenzrahmen für Lernende und Lehrpersonen vor. Leitend sind Human Agency, Ethik, Datenschutz, kritisches Verständnis und verantwortlicher Einsatz.

Didaktische Übersetzung: Professionalisierung darf nicht bei Prompting stehenbleiben. Lehrpersonen brauchen didaktische, ethische und organisatorische Urteilskompetenz.

Quelle öffnen

Liang et al. 2023 · Patterns · Evidenz: hoch für Detektor-Risiko

GPT detectors are biased against non-native English writers

Die Studie zeigt systematische Fehlerrisiken von KI-Detektoren, insbesondere bei Texten von Nicht-Muttersprachler:innen. Für Schulen ist das relevant, weil Detektorurteile soziale und bewertungsbezogene Folgen haben.

Didaktische Übersetzung: Detektoren dürfen keine Grundlage für Sanktionen sein. Fairer sind Prozessdokumentation, Deklaration, Transferaufgaben und Gespräch.

Quelle öffnen

Arbeitsregel für Entscheidungen

Eine Quelle verändert erst dann Schulhandeln, wenn vier Fragen beantwortet sind:

Setting: In welchem Fach, Alter, Vorwissen und Zeitrahmen wurde der Effekt gemessen?
Rolle der KI: Antwortmaschine, Tutor, Feedbackgeber, Coach, Recherchewerkzeug oder Bewertungsassistenz?
Nachweis: Wurde nur Leistung während der KI-Nutzung gemessen oder auch Transfer ohne KI?
Übertragbarkeit: Welche Bedingungen müsste unsere Schule herstellen, damit der Befund überhaupt gelten kann?