Anthropics BioMysteryBench: Claude löst 30 % der expertenresistenten Bioinformatik-Rätsel
Anthropic hat BioMysteryBench vorgestellt — eine neue Evaluation, die testet, ob Claude kreative Lösungen für offene biologische Forschungsprobleme entwickeln kann. Von 99 getesteten Problemen, die einem Expertengremium vorgelegt wurden, haben 23 die Forscher selbst in Sackgassen geführt; Claudes jüngste Modelle lösten rund 30 % dieser schwierigsten Fälle — und erbrachten bei den übrigen ebenfalls gute Leistungen.
Einordnung
Dies signalisiert Claudes Fähigkeit zu echtem wissenschaftlichem Denken, nicht nur zum Muster-Retrieval — eine bedeutsame Schwelle für agentische Forschungsworkflows in Biotech und Pharma. Die vollständige Methodik ist im Forschungsbeitrag von Anthropic verfügbar.