Forschung
ResearchGym: Benchmark für KI-Agenten in echter Forschungsumgebung
ResearchGym ist ein neues Benchmark- und Ausführungsumfeld, das KI-Agenten in einer echten Forschungsumgebung testen soll. Dabei werden fün…
arXiv – cs.AI