PathWise: KI-gestützte Heuristikentwicklung mit selbstlernenden LLMs

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

PathWise ist ein neu entwickeltes Multi-Agenten-Framework, das große Sprachmodelle (LLMs) nutzt, um Heuristiken für kombinatorische Optimierungsprobleme (COPs) automatisch zu entwerfen. Im Gegensatz zu bisherigen Ansätzen, die auf starre Evolutionsregeln und feste Prompt-Vorlagen setzen, ermöglicht PathWise eine dynamische, lernende Gestaltung von Heuristiken.

Das Hauptproblem alter Methoden besteht darin, dass sie nur begrenzte, myopische Heuristiken erzeugen, viele Evaluierungen wiederholen und kaum darüber nachdenken, wie neue Heuristiken sinnvoll abgeleitet werden können. PathWise löst dies, indem es die Heuristikentwicklung als sequentiellen Entscheidungsprozess über ein „Entailment‑Graph“ modelliert, das als kompakte, zustandsbehaftete Erinnerung an die gesamte Suchtrajektorie dient.

Im System agieren drei Agenten: ein Policy‑Agent plant evolutionäre Aktionen, ein World‑Model‑Agent generiert darauf basierende Heuristik‑Rollouts, und Critic‑Agenten liefern reflektierende Rückmeldungen, die aus vergangenen Schritten lernen. Durch diese Kombination wird die Heuristikentwicklung von reinem Trial‑and‑Error zu einem zustandsbewussten, planungsbasierten Prozess überführt.

Experimentelle Tests an einer Vielzahl von COPs zeigen, dass PathWise schneller zu besseren Heuristiken konvergiert, sich über verschiedene LLM‑Backbones hinweg gut generalisiert und auch bei größeren Problemgrößen skalierbar bleibt.

Ähnliche Artikel