Sybil-Modelle: Interventionsbasierte Audits decken Lungenkrebs‑Risiken auf Lungenkrebs bleibt die häufigste Todesursache bei Krebserkrankungen und treibt die Entwicklung automatisierter Screening‑Tools an, um Radiologen zu entlasten. Im Mittelpunkt dieser Bemühungen steht Sybil, ein Deep‑Learning‑Modell, das das zukünftige Risiko ausschließlich aus Computertomographien (CT) mit hoher Genauigkeit vorhersagen kann. Trotz umfangreicher klinischer Validierung beruhen die bisherigen Bewertungen jedoch ausschließlich auf beobachtenden Metriken. arXiv – cs.LG 04.02.2026 05:00
Neues Benchmark T3 prüft Vertrauen in KI‑Kausalität Wissenschaftler haben das neue Benchmark‑Tool T3 (Testing Trustworthy Thinking) vorgestellt, das die Fähigkeit von Sprachmodellen, kausale Zusammenhänge zu erkennen, systematisch testet. T3 nutzt 454 sorgfältig kuratierte Kurzgeschichten, um die Leistung von Modellen entlang der verschiedenen Ebenen der kausalen Analyse nach Pearl zu messen. arXiv – cs.AI 14.01.2026 05:00
Quantisierung von LLMs: 4‑Bit‑Modelle behalten kausale Genauigkeit bei Eine neue Studie aus dem arXiv‑Repository untersucht, wie stark die Reduktion der numerischen Präzision bei großen Sprachmodellen die Fähigkeit zur kausalen Analyse beeinträchtigt. Dabei wurden die Modelle Llama 3 8B in ihrer quantisierten Form – INT8 und NF4 – auf einem 3000‑Stichproben‑Benchmark getestet, der die drei Ebenen des kausalen Treppensteigs von Judea Pearl abdeckt. arXiv – cs.AI 17.12.2025 05:00
StockMem: Neues Ereignis‑Reflexions‑Framework verbessert Aktienprognosen Die Vorhersage von Aktienkursen bleibt wegen der hohen Marktvolatilität und der Sensibilität gegenüber Echtzeit‑Ereignissen eine große Herausforderung. Zwar eröffnen große Sprachmodelle (LLMs) neue Möglichkeiten für textbasierte Prognosen, doch ihre Anwendung im Finanzbereich wird durch rauschende Nachrichten und das Fehlen klarer Antworten erschwert. Traditionelle Speicherarchitekturen können zudem die entscheidenden Treiber von Kursbewegungen nicht zuverlässig identifizieren. arXiv – cs.AI 03.12.2025 05:00
Neue Methode steigert Übertragbarkeit von selbstüberwachtem Lernen Ein neues arXiv‑Veröffentlichung (ID 2511.13787v1) untersucht, wie gut selbstüberwachte Lernmodelle (SSL) ihre erlernten Repräsentationen auf andere Aufgaben übertragen können. Dabei werden zwei zentrale Fragen gestellt: Erstens, wie gut lässt sich die Repräsentation von SSL auf andere Aufgaben übertragen, und zweitens, wie lässt sich diese Übertragbarkeit gezielt modellieren? arXiv – cs.LG 19.11.2025 05:00
Alembic investiert 145 Mio. in causal AI und baut schnellsten Supercomputer Die San‑Francisco‑basierte Firma Alembic Technologies hat in einer Series‑B‑Finanzierung 145 Millionen US-Dollar aufgenommen. Der neue Wertschöpfungsfaktor liegt 13‑mal höher als bei der letzten Runde, was die steigende Bedeutung von proprietären Daten und kausaler Analyse im KI‑Markt unterstreicht. VentureBeat – AI 13.11.2025 10:00
Neue Studie: Multi-Agenten-LLMs revolutionieren kausale Forschung Eine neue Übersicht aus dem arXiv (2509.00987v1) beleuchtet, wie große Sprachmodelle (LLMs) in Kombination mit Multi-Agenten-Architekturen die Grenzen der kausalen Analyse sprengen. Während LLMs bereits beeindruckende Leistungen in Logik und Textgenerierung zeigen, bleiben komplexe kausale Fragestellungen – etwa die Erkennung von Ursache-Wirkungs-Beziehungen oder die Schätzung von Effekten – bislang herausfordernd. Typische Stolpersteine sind Halluzinationen, die Abhängigkeit von trügerischen Korrelationen und die Schwierigkeit, domänenspezifische oder personalisierte Kausalitäten zu erfassen. arXiv – cs.AI 03.09.2025 05:00
Neues Diffusionsmodell kombiniert Expertenwissen für kausale Vorhersagen Wissenschaftler haben ein innovatives Framework namens ODE‑Diff entwickelt, das die Vorhersage von Gegenfaktischen Verteilungen in komplexen dynamischen Systemen revolutioniert. Durch die Kombination von mechanistischen Expertenmodellen mit datengetriebenen Diffusionsprozessen liefert ODE‑Diff strukturierte Priorinformationen, die die Modellleistung besonders bei knappen Daten deutlich verbessern. arXiv – cs.LG 20.08.2025 05:00
LLM-gesteuerter Co-Pilot erleichtert die Anwendung von Kausalitätsanalysen Ein neues Open‑Source-Tool namens CATE‑B nutzt große Sprachmodelle, um Anwender bei der Schätzung von Behandlungseffekten aus Beobachtungsdaten zu unterstützen. Durch einen agentenbasierten Ansatz führt CATE‑B Nutzer Schritt für Schritt durch den gesamten Prozess der kausalen Analyse. arXiv – cs.LG 15.08.2025 05:00