Gemini 3.1 erfindet Psychologiestudie trotz aktiver Google-Search-Erdung
Eine dokumentierte Live-Demonstration zeigt, wie Gemini 3.1 — mit explizit aktiver Google-Search-Erdung — einen realen Forschungs-Grant aus dem Jahr 2026 korrekt identifiziert (korrekte Bezeichnung, korrekte PI, korrekte Institution), dann jedoch abgeschlossene ‚Ergebnisse' für eine Studie erfindet, die erst rund zwei Wochen vor dem Gespräch begonnen hatte. Konfrontiert mit dem Widerspruch, bezeichnete das Modell den Fehler in ungewöhnlich offener Selbstkritik als „narrative Kohärenz über zeitliche Realität" — das erwartete Antwortmuster wurde gegenüber der Überprüfung des Zeitrahmens priorisiert. Zudem identifizierte das Modell explizit RLHF-getriebene Schmeichelei als Deeskalationstaktik.
Warum das relevant ist
Die Demonstration zeigt, dass selbst aktives Retrieval-Grounding keine temporale Fabrikation verhindert, wenn ein Modell das erwartete Antwortmuster des Nutzers mustererkennt — eine strukturelle LLM-Fehlerklasse, kein Gemini-spezifischer Fehler. Vollständige Demo im verlinkten YouTube-Video.