OpenAI Realtime API / Advanced Voice
Profil: gpt-realtime-Modell seit August 2025 allgemein verfügbar; 6 voreingestellte Stimmen; sehr niedrige Latenz.
Stärke: Qualität der Spracherfassung (Prosodie, Tonfall), breites Partnerökosystem.
Datenschutz: API mit Opt-out für Training; Enterprise-Modus für EU-Hosting.
Google Gemini Live
Profil: tief integriert in Google Workspace, Multimodal (Bild + Audio + Text).
Stärke: Classroom-Anbindung, Guided-Learning-Sessions teilbar.
Datenschutz: Workspace-Education-Varianten mit vertraglicher DSGVO-Basis.
ElevenLabs Educational
Profil: spezialisierter Voice-Anbieter mit besonders natürlichen Stimmen.
Stärke: Vorlesen lang, Stimmen mit verschiedenen Akzenten und Altersgruppen.
Datenschutz: Teure Enterprise-Tier nötig für abgesicherte Schulnutzung.
Spezialisierte Sprachlern-Apps
Speak (mit OpenAI Realtime), Praktika, Babbel Conversation. Fertig verpackte Produkte mit Didaktik-Design, oft mit Unterrichtslizenzen.