Forschungbreaking
1,7B-Modell schlägt 744B GLM-5 im Schema Guided Dialogue – 437-facher Größenunterschied
Ein 1,7B-Modell übertrifft GLM-5 (744B) im Schema Guided Dialogue trotz beschädigter Trainingsdaten – 437-facher Parameterunterschied umgekehrt.
23. April 20261 Min. Lesezeit