Neues Benchmark T3 prüft Vertrauen in KI‑Kausalität
Wissenschaftler haben das neue Benchmark‑Tool T3 (Testing Trustworthy Thinking) vorgestellt, das die Fähigkeit von Sprachmodellen, kausale Zusammenhänge zu erkennen, systematisch testet. T3 nutzt 454 sorgfältig kuratier…