LLMs zeigen Schwächen: Mathematisches Verständnis unter numerischer Störung getestet
In einer neuen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wurde ein innovatives Störungsframework entwickelt, um die mathematische Problemlösefähigkeit von Large Language Models (LLMs) zu prüfen. Durch das Einfügen semantisch irrelevanter Sätze und die schrittweise Erhöhung der Störungsintensität konnten die Autoren die Grenzen der Robustheit der Modelle aufdecken.