Forschung & Studien

Stand: 18. Mai 2026

Diese Seite bündelt aktuelle Evidenz zu generativer KI in Schule und Hochschule. Der Fokus liegt auf Quellen, die für schulische Entscheidungen belastbar sind: RCTs, Meta-Analysen, systematische Reviews und Policy-Rahmen von OECD, UNESCO und EU.

Zentrale These

Die Forschung stützt keine einfache Antwort wie "KI hilft" oder "KI schadet". Sie zeigt: Der Modus entscheidet. KI kann Tutor, Feedbackpartner, Denkcoach, Recherchewerkzeug oder Antwortmaschine sein. Lernwirksam wird sie vor allem dann, wenn Aufgabenarchitektur, Guardrails und Transfer ohne KI zusammenspielen.

Neu und priorisiert

Evidenzbibliothek: KI und Lernen

Kuratiertes Quellenfundament mit RCTs, Meta-Analysen, AI-Literacy-Rahmen und Detektor-Risiken. Jede Quelle ist mit didaktischer Übersetzung versehen.

Zur Evidenzbibliothek KI und Lernen

Meta-Review 2026

Konsolidierte Evidenz 2024-2026: Lernwirkung, Guardrails, Offloading, AI Literacy, Assessment und Governance.

Zum Meta-Review 2026

Evidenzbibliothek: Vibe Coding

Kuratiertes Quellenfundament zu Vibe Coding in der Sek I mit Evidenzstatus, Clusterbezug und transparent markierten offenen Referenzen.

Zur Evidenzbibliothek Vibe Coding

Evidenzbibliothek: KI-Agenten

Verifizierte Primärquellen und transparent markierte offene Referenzen zu Agententaxonomie, Lernpsychologie, Governance, Assessment und Datenschutz.

Zur Evidenzbibliothek KI-Agenten

Aktuelle Schlüsselbefunde

Guardrails entscheiden über Transfer

Bastani et al. (2025) zeigen in PNAS: Standard-GPT-4 kann während der Übung helfen und im späteren Test ohne KI dennoch schwächere Leistung erzeugen. Ein Tutor-Design mit Guardrails ist deutlich belastbarer.

Zur Studie

Strukturierte KI-Tutoren können starke Effekte erzielen

Kestin et al. (2025) und die World-Bank-RCT in Nigeria zeigen positive Effekte sorgfältig gestalteter Tutor-Settings. Entscheidend ist: Diese Befunde gelten für strukturierte Programme, nicht für freie Chatbot-Nutzung ohne Aufgabenrahmen.

Kestin et al. öffnen

World-Bank-Studie öffnen

Meta-Analysen sind positiv, aber heterogen

Aktuelle Meta-Analysen berichten im Mittel positive Effekte von GenAI auf Leistung und Motivation. Die Spannweite ist groß: Interventionstyp, Dauer, Fach, Vorwissen, Rolle des Tools und Selbstregulation moderieren die Wirkung.

Liu et al. 2025 öffnen

AI Literacy wird zum Standard

OECD/PISA 2029 MAIL, OECD/EC AI Literacy Framework und UNESCO-Kompetenzrahmen machen deutlich: AI Literacy ist nicht Prompting, sondern kritische, kreative und verantwortliche Handlungsfähigkeit in einer KI-geprägten Informationsumgebung.

PISA 2029 MAIL öffnen

UNESCO-Kompetenzrahmen öffnen

Detektoren sind keine faire Integritätsstrategie

Liang et al. (2023) zeigen Bias- und Fehlalarmrisiken von KI-Detektoren. Für Schulen sind Prozessnachweise, Deklaration, Transferaufgaben und mündliche Rückfragen robuster.

Liang et al. öffnen

Drei robuste Ableitungen

Struktur schlägt Extreme: Weder Totalverbot noch freie Nutzung sind evidenzbasiert. Entscheidend sind klare Modi pro Aufgabe.
Transfer schlägt Komfort: Was Lernende mit KI flüssig lösen, muss punktuell ohne KI überprüfbar bleiben.
Prozess schlägt Detektion: Schulen sollten Eigenleistung sichtbar machen, nicht nachträglich Maschinenurteile über Texte stellen.

Passende Modelle

Forschungsbefunde entfalten Wirkung erst im Modellkontext und in anschließenden Umsetzungsschritten.

Modell A Modul KI und Lernen Assessment KI-Mündigkeit Modell B Modell C