SkillGen: LLMs meistern sequenzielle Entscheidungen dank skill-basierter Prompts

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In der Welt der großen Sprachmodelle (LLMs) gewinnt das in‑Context‑Learning (ICL) für sequentielle Entscheidungsprozesse immer mehr an Bedeutung. Dabei ist die Qualität der Prompt‑Struktur entscheidend: Sie muss sich auf entscheidungsrelevante Informationen konzentrieren, stufenweise Detailgenauigkeit bieten und gleichzeitig die Abhängigkeit von Experten‑Annotationsdaten minimieren.

Viele bestehende ICL‑Ansätze erfüllen nicht alle drei Kriterien gleichzeitig. Um dieses Problem zu lösen, präsentiert das neue Forschungsteam SkillGen – ein skill‑basiertes Framework, das strukturierte, sequentielle Entscheidungsfindung unterstützt. SkillGen baut aus Stichproben von Trajektorien ein handlungsorientiertes, domänenbezogenes Graphenmodell auf, identifiziert hochwertige Aktionen mittels temporärer Differenz‑Credit‑Zuweisung und holt schrittweise passende Skills ab, um fein abgestimmte, kontextbewusste Prompts zu generieren.

Eine theoretische Analyse zeigt, dass die Fokussierung auf hochwertige Segmente die Aufgabenidentifizierbarkeit verbessert und die Gestaltung effektiverer ICL‑Prompts erleichtert. Praktische Tests auf den Plattformen ALFWorld, BabyAI und ScienceWorld – sowohl mit Open‑Source‑ als auch mit proprietären LLMs – demonstrieren konsistente Leistungssteigerungen. Im Durchschnitt erhöht SkillGen die Fortschrittsrate um 5,9 % bis 16,5 % über verschiedene Modelle hinweg.

Ähnliche Artikel