Qwen3 35B MoE aus Claude Opus destilliert — kostenlos als quantisiertes GGUF veröffentlicht
Ein aus Claude Opus destilliertes Qwen3 35B Mixture-of-Experts-Modell wurde als kostenloses quantisiertes GGUF für lokale Inferenz freigegeben. Das Modell hatte zum Zeitpunkt des AlphaSignal-Digests vom 28. April rund 9.400 Downloads angesammelt. Durch die Destillation aus einem Frontier-Modell verfügen die Gewichte über nahezu Frontier-Qualität bei der Inferenz — zu einem Bruchteil der Serving-Kosten. Damit gehört es zu den leistungsfähigsten kostenlos verfügbaren Gewichten für lokales Deployment.
Warum das relevant ist
Frontier-Modell-Destillation in kostenlose quantisierte Gewichte komprimiert den Qualitätsabstand zwischen Cloud-API-Inferenz und lokalen Modellen schneller als erwartet. Ein Claude-Opus-destilliertes 35B MoE, das lokal läuft, stellt die ökonomische Grundlage für Cloud-Inferenz bei allen außer den anspruchsvollsten Aufgaben in Frage.