ARC-AGI-3: Neues Benchmark für Agentenintelligenz
ARC‑AGI‑3 ist ein interaktives Testsystem, das die Fähigkeit von Agenten zur Erkundung, Zielinferenz, Modellbildung und effektiven Aktionsplanung in abstrakten, rundenbasierten Umgebungen prüft – ohne dabei auf Sprache…