ReCUBE: Benchmark prüft, wie LLMs Repository‑Kontext nutzen
In der jüngsten Veröffentlichung auf arXiv (2603.25770v1) wird ein neues Benchmark namens ReCUBE vorgestellt, das speziell darauf abzielt, die Fähigkeit von großen Sprachmodellen (LLMs) zu messen, wie gut sie den Kontex…