Neues Benchmark FeynmanBench testet multimodale KI bei physikalischen Diagrammen
Die Wissenschafts-Community hat heute ein neues Tool vorgestellt: FeynmanBench, ein Benchmark, der multimodale große Sprachmodelle (MLLMs) auf ihre Fähigkeit prüft, komplexe physikalische Diagramme zu verstehen und zu b…