xAI startet Voice-Cloning-API: 80+ Stimmen, 28 Sprachen, 2-Minuten-Training
xAI hat eine produktionsreife Voice-Cloning-API veröffentlicht, die 80+ Standardstimmen in 28 Sprachen unterstützt. Die Erstellung eigener Stimmen erfordert lediglich eine 2-minütige Referenzaufnahme; die Abrechnung erfolgt zu 3 $/Std. für Speech-to-Speech. Ein Verifizierungsgate beschränkt das Klonen auf die eigene Stimme des Nutzers, um beliebige Impersonation Dritter zu verhindern. Alle eigenen Stimmen erben das vollständige TTS-Funktionsspektrum von xAI – einschließlich Speech-Tags, mehrsprachiger Ausgabe sowie REST- und WebSocket-Streaming.
Einordnung
Sprachagenten lassen sich damit statt in wochenlanger Entwicklungsarbeit nun in zwei Minuten einrichten. Das Risiko für Marken-Impersonation verlagert sich weg von der technischen Zugänglichkeit hin zu xAIs Identitätsverifizierungsmechanismus – dieser wird zum entscheidenden Governance-Punkt für Unternehmen, die die API einsetzen.