Stand: 18. Mai 2026
Diese Seite bündelt aktuelle Evidenz zu generativer KI in Schule und Hochschule. Der Fokus liegt auf Quellen, die für schulische Entscheidungen belastbar sind: RCTs, Meta-Analysen, systematische Reviews und Policy-Rahmen von OECD, UNESCO und EU.
Zentrale These
Die Forschung stützt keine einfache Antwort wie "KI hilft" oder "KI schadet". Sie zeigt: Der Modus entscheidet. KI kann Tutor, Feedbackpartner, Denkcoach, Recherchewerkzeug oder Antwortmaschine sein. Lernwirksam wird sie vor allem dann, wenn Aufgabenarchitektur, Guardrails und Transfer ohne KI zusammenspielen.
Neu und priorisiert
Evidenzbibliothek: KI und Lernen
Kuratiertes Quellenfundament mit RCTs, Meta-Analysen, AI-Literacy-Rahmen und Detektor-Risiken. Jede Quelle ist mit didaktischer Übersetzung versehen.
Zur Evidenzbibliothek KI und Lernen
Meta-Review 2026
Konsolidierte Evidenz 2024-2026: Lernwirkung, Guardrails, Offloading, AI Literacy, Assessment und Governance.
Evidenzbibliothek: Vibe Coding
Kuratiertes Quellenfundament zu Vibe Coding in der Sek I mit Evidenzstatus, Clusterbezug und transparent markierten offenen Referenzen.
Zur Evidenzbibliothek Vibe Coding
Evidenzbibliothek: KI-Agenten
Verifizierte Primärquellen und transparent markierte offene Referenzen zu Agententaxonomie, Lernpsychologie, Governance, Assessment und Datenschutz.
Zur Evidenzbibliothek KI-Agenten
Aktuelle Schlüsselbefunde
Guardrails entscheiden über Transfer
Bastani et al. (2025) zeigen in PNAS: Standard-GPT-4 kann während der Übung helfen und im späteren Test ohne KI dennoch schwächere Leistung erzeugen. Ein Tutor-Design mit Guardrails ist deutlich belastbarer.
Strukturierte KI-Tutoren können starke Effekte erzielen
Kestin et al. (2025) und die World-Bank-RCT in Nigeria zeigen positive Effekte sorgfältig gestalteter Tutor-Settings. Entscheidend ist: Diese Befunde gelten für strukturierte Programme, nicht für freie Chatbot-Nutzung ohne Aufgabenrahmen.
Meta-Analysen sind positiv, aber heterogen
Aktuelle Meta-Analysen berichten im Mittel positive Effekte von GenAI auf Leistung und Motivation. Die Spannweite ist groß: Interventionstyp, Dauer, Fach, Vorwissen, Rolle des Tools und Selbstregulation moderieren die Wirkung.
AI Literacy wird zum Standard
OECD/PISA 2029 MAIL, OECD/EC AI Literacy Framework und UNESCO-Kompetenzrahmen machen deutlich: AI Literacy ist nicht Prompting, sondern kritische, kreative und verantwortliche Handlungsfähigkeit in einer KI-geprägten Informationsumgebung.
Detektoren sind keine faire Integritätsstrategie
Liang et al. (2023) zeigen Bias- und Fehlalarmrisiken von KI-Detektoren. Für Schulen sind Prozessnachweise, Deklaration, Transferaufgaben und mündliche Rückfragen robuster.
Drei robuste Ableitungen
- Struktur schlägt Extreme: Weder Totalverbot noch freie Nutzung sind evidenzbasiert. Entscheidend sind klare Modi pro Aufgabe.
- Transfer schlägt Komfort: Was Lernende mit KI flüssig lösen, muss punktuell ohne KI überprüfbar bleiben.
- Prozess schlägt Detektion: Schulen sollten Eigenleistung sichtbar machen, nicht nachträglich Maschinenurteile über Texte stellen.
Passende Modelle
Forschungsbefunde entfalten Wirkung erst im Modellkontext und in anschließenden Umsetzungsschritten.
Modell A Modul KI und Lernen Assessment KI-Mündigkeit Modell B Modell C