Cuttlefish: Neues LLM für strukturbasierte Molekular-Logik
Mit dem neuen Modell Cuttlefish erreichen Forscher einen Meilenstein in der Analyse von Biomolekülen. Während bisherige Ansätze strukturelle Daten meist in feste Token-Pakete zwängen oder auf sequentielle Tokenisierung beschränkt sind, nutzt Cuttlefish die geometrische Komplexität der Moleküle selbst, um die Sprachverarbeitung zu verbessern.
Der Schlüssel liegt in zwei innovativen Komponenten. Zunächst erzeugt die Scaling‑Aware Patching‑Methode variable Patch‑Größen, die sich an die Komplexität des Strukturgitters anpassen. Durch ein anweisungsbasiertes Gating‑System wird das Token‑Budget dynamisch skaliert, sodass feste Längenbottlenecks vermieden werden. Anschließend verfeinert der Geometry Grounding Adapter diese Tokens mittels Cross‑Attention mit Modality‑Embeddings und injiziert sie in das LLM. So werden explizite geometrische Hinweise direkt in die Sprachlogik eingebettet, was die Gefahr von strukturellen Halluzinationen deutlich reduziert.
In umfangreichen Tests auf heterogenen All‑Atom‑Benchmarks übertrifft Cuttlefish bestehende Modelle in der struktur‑geführten Logik. Das Projekt bietet zudem einen offenen Code‑Bereich, sodass die Community die Technologie sofort nutzen und weiterentwickeln kann.