RTMol: Moleküle und Text im Einklang – 47 % bessere bidirektionale Ausrichtung
Die neueste Veröffentlichung von RTMol stellt einen Paradigmenwechsel in der Verbindung von chemischen Strukturen und ihrer sprachlichen Beschreibung dar. Durch die gleichzeitige Optimierung von Molekül‑zu‑Text‑ und Text‑zu‑Molekül‑Generierung schafft RTMol ein nahtloses, bidirektionales Verständnis, das für die Wirkstoffforschung, Materialwissenschaften und die automatische Analyse chemischer Literatur von entscheidender Bedeutung ist.
Aktuelle Verfahren behandeln Molekül‑Captioning und textbasierte Molekül‑Generierung als getrennte Aufgaben. Sie stützen sich auf überwachte Feinabstimmung oder kontrastives Lernen, was drei wesentliche Schwächen mit sich bringt: Erstens priorisieren gängige Metriken wie BLEU sprachliche Fließfähigkeit auf Kosten chemischer Genauigkeit. Zweitens enthalten die Trainingsdatensätze häufig mehrdeutige, unvollständige Beschreibungen. Drittens führt die unabhängige Optimierung zu Inkonsistenzen in beiden Richtungen.
RTMol löst diese Probleme, indem es ein selbstüberwachtes Round‑Trip‑Learning einführt, das Molekül‑zu‑Text‑ und Text‑zu‑Molekül‑Aufgaben in einem einzigen Rahmen vereint. Das System nutzt neue Round‑Trip‑Bewertungsmetriken und ermöglicht das Training von Molekül‑Captioning ohne gepaarte Molekül‑Text‑Korpora. Dadurch wird die Notwendigkeit für umfangreiche, manuell annotierte Datensätze drastisch reduziert.
Experimentelle Ergebnisse zeigen, dass RTMol die bidirektionale Ausrichtung um bis zu 47 % verbessert – ein signifikanter Fortschritt über verschiedene große Sprachmodelle hinweg. Diese Leistung unterstreicht die Effektivität von RTMol als neues Standardmodell für das gemeinsame Verständnis und die Generierung von Molekülen und Texten und eröffnet damit neue Möglichkeiten in Forschung und Industrie.