Wissen

Evidenzbibliothek: KI und Lernen

Kuratiertes Quellenfundament zu KI und Lernen: Metaanalysen, RCTs, Policy-Rahmen und Risiken für schulische Entscheidungen.

Stand
2026-05-18
Lesedauer
3 min
Zielgruppe
Forschende

Stand: 18. Mai 2026

Diese Bibliothek sammelt Quellen, die für schulische KI-Didaktik belastbar genug sind, um Entscheidungen zu stützen. Sie trennt zwischen Lernwirkung, Risiko, Rahmenkompetenz und Governance. Die zentrale Lesart bleibt: Nicht das Tool ist die Intervention, sondern das didaktische Setting.

Kurzsynthese

  • Tutor- und Feedback-Settings können wirksam sein, wenn sie eng geführt sind, fachliche Ziele verfolgen und nicht einfach Lösungen ausgeben.
  • Ungebremste Antwortmaschinen sind riskant, weil sie kurzfristige Übungsleistung erhöhen können, ohne späteren Transfer ohne KI zu sichern.
  • AI Literacy wird prüfungs- und governance-relevant, weil OECD/PISA, UNESCO und EU AI Act KI-Kompetenz nicht als Tooltraining, sondern als Urteilskompetenz definieren.
  • Detektoren sind keine tragfähige Integritätsstrategie. Prozessnachweise, Deklaration, Transferaufgaben und mündliche Verteidigung sind fairer und didaktisch stärker.

Quellen

Bastani et al. 2025 · PNAS · Evidenz: hoch

Generative AI without guardrails can harm learning: Evidence from high school mathematics

Randomisierte Studie mit knapp 1000 High-School-Lernenden in Mathematik. Standard-GPT-4 half während der Übungsphase, führte aber im späteren Test ohne KI zu schwächerer Leistung als die Kontrollgruppe. Ein Tutor-Design mit Guardrails reduzierte diesen Effekt.

Didaktische Übersetzung: KI als Antwortmaschine ist nicht gleich KI als Tutor. Für Schule sind Guardrails, Transferaufgaben ohne KI und klare Rollenentscheidungen zentral.

Quelle öffnen

Kestin et al. 2025 · Scientific Reports · Evidenz: hoch, Kontext: Hochschule

AI tutoring outperforms in-class active learning

Randomisierte Studie in einem authentischen STEM-Setting. Ein forschungsbasiert gestalteter AI-Tutor erzielte starke Lerngewinne gegenüber aktiver Präsenzlehre bei kürzerer Lernzeit. Die Autor:innen betonen, dass das Design stark strukturiert war und nicht einfach freier Chat.

Didaktische Übersetzung: Positive Tutor-Effekte sind möglich, aber sie hängen an Designqualität, Aufgabenpassung und fachlicher Kontrolle.

Quelle öffnen

De Simone et al. 2025 · World Bank · Evidenz: hoch, Kontext: Entwicklungs- und Nachhilfeprogramm

Learning to Learn with AI: Evidence from a Randomized Controlled Trial in Nigeria

Randomisierte Studie zu einem sechswöchigen, begleiteten GPT-4/Copilot-Nachhilfeprogramm. Der Befund spricht für strukturierte, beaufsichtigte KI-Tutoring-Settings, nicht für freie unbegleitete Toolnutzung.

Didaktische Übersetzung: KI kann besonders dort helfen, wo Anleitung, Aufgabenstruktur und regelmäßige Lernzeit zusammenkommen.

Quelle öffnen

Liu et al. 2025 · Journal of Educational Computing Research · Evidenz: mittel bis hoch

Effects of Generative Artificial Intelligence on K-12 and Higher Education Students' Learning Outcomes: A Meta-Analysis

Meta-Analyse zu GenAI in K-12 und Hochschule. Die durchschnittlichen Effekte auf Leistung und Motivation sind positiv, aber stark abhängig von Kontext, Dauer, Rolle des Tools und Lernsteuerung.

Didaktische Übersetzung: Meta-Analysen stützen kein pauschales "KI wirkt", sondern ein bedingtes "KI wirkt unter bestimmten didaktischen Bedingungen".

Quelle öffnen

OECD 2026 · Digital Education Outlook · Evidenztyp: Policy-Synthese

Exploring Effective Uses of Generative AI in Education

Die OECD bündelt Evidenz und Policy-Perspektiven zu generativer KI in Bildung. Der Schwerpunkt liegt auf menschlicher Urteilskraft, Feedback, Lehrpersonenkompetenz und klarer Nutzungspraxis.

Didaktische Übersetzung: Schulen brauchen nicht nur Toolzugang, sondern eine lernbezogene Nutzungsordnung: Wo hilft KI? Wo braucht es KI-freie Diagnose? Wer prüft Qualität?

Quelle öffnen

OECD / Europäische Kommission 2025-2026 · Evidenztyp: Kompetenzrahmen

Empowering Learners for the Age of AI / PISA 2029 MAIL

Der AI-Literacy-Rahmen für Primar- und Sekundarbildung und der PISA-2029-Bereich Media and Artificial Intelligence Literacy verschieben den Fokus von Toolbedienung zu kritischer, kreativer und verantwortlicher Teilhabe.

Didaktische Übersetzung: AI Literacy ist Querschnittskompetenz. Sie umfasst Erkennen, Prüfen, Gestalten, Grenzen setzen und Verantwortung übernehmen.

AI-Literacy-Framework öffnen

PISA 2029 MAIL öffnen

UNESCO 2024 · Evidenztyp: Kompetenz- und Governance-Rahmen

AI Competency Frameworks for Students and Teachers

UNESCO legt Kompetenzrahmen für Lernende und Lehrpersonen vor. Leitend sind Human Agency, Ethik, Datenschutz, kritisches Verständnis und verantwortlicher Einsatz.

Didaktische Übersetzung: Professionalisierung darf nicht bei Prompting stehenbleiben. Lehrpersonen brauchen didaktische, ethische und organisatorische Urteilskompetenz.

Quelle öffnen

Liang et al. 2023 · Patterns · Evidenz: hoch für Detektor-Risiko

GPT detectors are biased against non-native English writers

Die Studie zeigt systematische Fehlerrisiken von KI-Detektoren, insbesondere bei Texten von Nicht-Muttersprachler:innen. Für Schulen ist das relevant, weil Detektorurteile soziale und bewertungsbezogene Folgen haben.

Didaktische Übersetzung: Detektoren dürfen keine Grundlage für Sanktionen sein. Fairer sind Prozessdokumentation, Deklaration, Transferaufgaben und Gespräch.

Quelle öffnen

Arbeitsregel für Entscheidungen

Eine Quelle verändert erst dann Schulhandeln, wenn vier Fragen beantwortet sind:

  1. Setting: In welchem Fach, Alter, Vorwissen und Zeitrahmen wurde der Effekt gemessen?
  2. Rolle der KI: Antwortmaschine, Tutor, Feedbackgeber, Coach, Recherchewerkzeug oder Bewertungsassistenz?
  3. Nachweis: Wurde nur Leistung während der KI-Nutzung gemessen oder auch Transfer ohne KI?
  4. Übertragbarkeit: Welche Bedingungen müsste unsere Schule herstellen, damit der Befund überhaupt gelten kann?