Google Magenta RealTime 2: 200 ms On-Device-Musikgenerierung
Google Magenta RealTime 2: Open-Weights-Echtzeitmusik bei ~200 ms Latenz, steuerbar per Text/Audio/MIDI, 2,4 Mrd. Parameter — läuft ohne GPU auf einem MacBook.
Google Magenta RealTime 2: Open-Weights-Echtzeitmusik bei ~200 ms Latenz, steuerbar per Text/Audio/MIDI, 2,4 Mrd. Parameter — läuft ohne GPU auf einem MacBook.
Googles Gemma 4 12B ist encoder-frei und multimodal — Text, Audio, Video, Bild — in 16 GB VRAM unter Apache 2.0. Sofort in Transformers, llama.cpp und MLX nutzbar.
Gemini Omni generiert Ego-Perspektive-Videos aus handgezeichneten Routen auf Google-Maps-Screenshots — neue pfadkonditionierte Videogenerierung.
YouTubes neuer KI-Feed ermöglicht US-Nutzern, per Texteingabe den Startseiten-Feed dynamisch anzupassen — nur für angemeldete Konten.

Anthropic schliesst eine Serie-H-Runde über 65 Milliarden Dollar bei einer Bewertung von 965 Milliarden ab und überholt damit OpenAI als wertvollstes KI-Startup der Welt.
Googles Nano Banana 2 und Nano Banana Pro, die besten Bildgenerierungsmodelle des Unternehmens, sind jetzt über Google AI Studio allgemein verfügbar.

Google ersetzte das Gemini CLI durch Antigravity, lancierte Gemini for Science mit 100+ Institutionen und stellte native Videobearbeitung via Gemini Omni Flash vor.
Gemini 3.5 Flash erreicht ~50 % auf dem Cursor Bench, 15 Punkte unter der Frontier bei 4-fachem Preis von Cursor Composer 2.5. Gemini 3.5 Pro nochmals um einen Monat verzögert.
Google I/O stellt Pics, Flow, Stitch und FlowMusic vor — eine vollständige kreative KI-Suite auf Basis von Gemini Omni Flash für Bildbearbeitung, Videoerstellung, Code-Export und Musikgenerierung.
Google startet Gemini for Science bei I/O mit Co-Scientist, AlphaEvolve und Science Skills — entwickelt mit über 100 Institutionen einschließlich Nobelpreisträgern, verfügbar unter labs.google/science.
Google stellt Gemini CLI ein und startet Antigravity, seinen neuen Terminal-KI-Agenten auf Gemini-3.5-Flash-Basis — damit ist die Konvergenz aller drei großen Labs abgeschlossen.
SynthID gewinnt OpenAI, ElevenLabs, Kakao und NVIDIA als Adopteure neben C2PA Content Credentials — ein branchenübergreifender KI-Inhaltsnachweis-Standard konsolidiert sich um einen dualen Rahmen.
Google startet Gemini for Science mit drei agentischen Forschungstools: Literatursynthese via NotebookLM, Multi-Agenten-Hypothesengenerierung via Co-Scientist und paralleles Code-Testing via AlphaEvolve.
Singapur sichert sich ein OpenAI-KI-Labor (234 Mio. USD+) und Googles National AI Partnership beim ATX Summit und positioniert sich als strukturierter westlicher KI-Investitionsstandort in Südostasien.
Google I/O 2026 beginnt am 19. Mai um 10 Uhr PT — Google DeepMind kündigt KI-Durchbrüche an inmitten verschärften Wettbewerbs mit Anthropic und OpenAI.
GTIG bestätigt: KI-entdeckte Zero-Day-Lücke wird aktiv ausgenutzt. KI-gegen-KI-Dynamik bei Cyberangriffen ist jetzt Realität, nicht Theorie.
Google verhandelt mit SpaceX über Raketenstarts für orbitale Rechenzentren und will damit Cloud-Infrastruktur erstmals ins All bringen.
Android 16 erhält Intrusion-Logging zur Spyware-Erkennung, gemeinsam mit Amnesty International entwickelt — vorerst nur für Pixel-Geräte.
Googles AlphaEvolve ist nun operative Infrastruktur: 30 % weniger Genomik-Fehler, 14 %→88 % Netz-Machbarkeit und Beiträge zum nächsten TPU-Design.
Google veröffentlicht Gemma 4 MTP (3-fache Beschleunigung), NotebookLM Mind Maps, Gemini-API-Webhooks und eine Gemini-Health-App — sechs Launches vor I/O.
Google hat die Chrome-On-Device-Prompt-API trotz Widerspruchs von W3C, Mozilla, WebKit und Microsoft ausgeliefert — jede Website darf nun Gemini Nano befragen.
Gemini 3.1 erfindet Studienergebnisse für ein 2 Wochen altes Grant — bei aktiver Erdung. Selbstkritik: 'narrative Kohärenz über zeitliche Realität.' Live-Demo dokumentiert.
Alphabet reiht sich bei OpenAI und Anthropic ein: Gleichzeitige JV-Gespräche mit Blackstone, KKR und EQT — alle drei Frontier-Labs zielen auf PE-Portfolio-Softwareausgaben als Vertriebskanal.
Gemma-4-MTP-Speculative-Decoding liefert 3× Token/Sek. ohne Qualitätsverlust — Day-0 in HF Transformers, MLX, vLLM. Apache 2.0.
Gemma 4 E2B/E4B bündelt Function-Calling und Thinking bei 2–4B Parametern. LiteRT-LM bringt Agent-Skills auf Android, iOS und IoT.
Google setzt Gemini zeitgleich als Standard-KI-Interface in YouTube-Suche, Fahrzeugassistent und Dateierstellung ein — ein dreifacher Plattformzug.
Studien belegen: Multi-Agent-Systeme verstärken Fehler bis zu 17,2-fach. Einzelagent plus Tool-Augmentierung gilt als neue Standardarchitektur.

Claude Code überschreitet die Marke von 100 Skills und Google Gemma 4 adoptiert dasselbe skill.md-Format unabhängig davon — ein plattformübergreifender Standard für Agent-Erweiterungen entsteht.

Stanford, Google/MIT, AHE, LangChain und Unblocked veröffentlichten diese Woche übereinstimmend: Harness-Qualität übertrifft die Anzahl der Agenten als primären Leistungshebel agentischer Systeme.
Das US-Verteidigungsministerium unterzeichnet am 1. Mai KI-Verteidigungsverträge mit OpenAI, Google, xAI und weiteren Firmen – Anthropic bleibt wegen Rechtsstreit ausgeschlossen.
Google veröffentlicht Deep Research und Max in der Gemini API-Vorschau mit MCP-Unternehmensintegration, Echtzeit-Reasoning und vielfältigen Eingabeformaten.

Acht KI-Firmen unterzeichneten am 1. Mai DoD-Abkommen zur Nutzung in klassifizierten Netzwerken — Anthropic wurde ausgeschlossen, während die NSA Claude Mythos stillschweigend weiternutzte.
Googles DOD-Deal überraschte Mitarbeiter nach früheren Management-Zusicherungen gegen Pentagon-Verträge; DeepMind-Mitarbeiter wandten sich öffentlich dagegen.
Ethan Mollick berichtet, der Gemini-Chatbot werde 'entmutigt' und gebe Aufgaben auf, obwohl das zugrundeliegende Gemini-3.1-Pro-Modell leistungsstark ist.
Gemma 4 E2B + WebGPU + Transformers.js ermöglicht einen vollständig lokalen Chrome-Browser-Agenten ohne Server — Tabs und Browserdaten bleiben auf dem Gerät.
Der KI-Chef des Pentagons bestätigt Google-Gemini-Ausweitung nach Anthropic-Blacklist; Weißes Haus entwickelt Regelungen zur Umgehung der Anthropic-Risikobezeichnung.
ChatGPTs Traffic-Anteil fiel von 77% auf 57%, Gemini stieg durch Googles Vertrieb auf 25%, Claude verdreifachte sich nahezu auf 6% durch Produktzug allein.
Google entwickelt Antigravity, eine interne KI-Coding-Plattform unter Chefarchitekt Koray Kavukcuoglu, als explizite Antwort auf Claude Code und OpenAI Codex.
Googles Deep Research Max ergänzt MCP-Support für private Datenzugriffe auf Basis von Gemini 3.1 Pro – DeepSearchQA 93,3%, HLE 54,6%, ~4,80 $/Bericht gegenüber 1,22 $.
Googles MIRAS-Framework vereint Transformer, Mamba und Titans als Instanzen eines einzigen Optimierungsproblems mit vier Designoptionen und einem gemeinsamen Retention-Gate.
YouTubes KI-Deepfake-Erkennungstool deckt jetzt alle Hochrisikopersonen ab – nicht nur Politiker – da der Missbrauch synthetischer Abbilder zunimmt.
Gemini 3.1 TTS startet mit Inline-Audio-Tags – [whispers], [screams], [slow] – für ausdrucksstarke, steuerbare Sprachsynthese.
Gemini Embedding 2, Googles erstes nativ multimodales Embedding-Modell, ist jetzt GA in der Gemini API und Vertex AI.
Google benennt Vertex AI auf der Cloud Next zur Gemini Enterprise Agent Platform um, ergänzt 200+ Modelle und fünf Beratungspartnerschaften, um die Unternehmensadoption zu beschleunigen.
Die Woche vom 21.–23. April legte die strategische Position jedes Frontier-KI-Labs offen – nicht durch Pressemitteilungen, sondern durch operative Schritte, die Rechenkapazitäten, Nachfrageentwicklung und Kapitalrestriktionen enthüllten.
Google startet die Gemini Enterprise Agent Platform auf der Cloud Next — Vertex AIs Nachfolger — mit 200+ Modellen inkl. Gemini 3.1 Pro, Lyria 3 Audio und Gemma 4.
Gemini Flash 3.0 bringt Reasoning-Verbesserungen in Googles kosteneffiziente Modellklasse.
Kuratierte AI-Einblicke — wir senden, wenn es sich lohnt.