GrAlgoBench enthüllt Schwächen großer Rechenmodelle bei Graphenalgorithmen
Ein neues Benchmark-Set namens GrAlgoBench, veröffentlicht auf arXiv (2602.06319v1), richtet sich gezielt an große Rechenmodelle (LRMs) und prüft deren Fähigkeiten anhand von Graphenalgorithmus-Problemen. Diese Aufgaben sind ideal, um das Langzeit‑Kontext‑Verständnis zu testen, da sie komplexe, sequentielle Schritte erfordern und gleichzeitig eine feingranulare Steuerung der Schwierigkeitsgrade ermöglichen.