RoCo: Rollenbasierte LLM-Kollaboration verbessert Heuristikentwicklung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In der Welt der automatischen Heuristikentwicklung (AHD) setzt die neue Methode RoCo neue Maßstäbe. Das System nutzt vier spezialisierte LLM-gesteuerte Agenten – Explorer, Exploiter, Critic und Integrator – die gemeinsam an der Lösung von kombinatorischen Optimierungsproblemen (COPs) arbeiten. Durch die gezielte Rollenverteilung entsteht eine vielschichtige Zusammenarbeit, die sowohl kreative Ideen als auch effiziente Optimierungen fördert.

Der Explorer sucht nach langfristigen Potenzialen, indem er vielfältige, innovative Ansätze generiert. Der Exploiter dagegen konzentriert sich auf kurzfristige Verbesserungen und verfeinert bestehende Lösungen mit konservativen, effizienzorientierten Anpassungen. Der Critic bewertet jede Iteration kritisch, liefert gezieltes Feedback und reflektiert die Wirksamkeit der Änderungen. Der Integrator fasst die Vorschläge des Explorers und Exploiters zusammen, balanciert Innovation und Ausnutzung und treibt so den Gesamtfortschritt voran.

RoCo arbeitet in einem strukturierten Mehr-Runden-Prozess, der Feedback, Verfeinerung und Elite-Mutationen kombiniert. Dabei werden sowohl kurzfristige als auch langfristige Reflexionen berücksichtigt, um die Qualität der Heuristiken kontinuierlich zu steigern. Dieser iterative Ansatz ermöglicht es, robuste und leistungsfähige Lösungen zu entwickeln, die sich an unterschiedliche Problemstellungen anpassen.

Die Leistung von RoCo wurde an fünf verschiedenen COPs in White-Box- und Black-Box-Umgebungen getestet. Die Ergebnisse zeigen, dass RoCo konsequent bessere Heuristiken liefert als etablierte Methoden wie ReEvo und HSEvo. Diese Erfolge unterstreichen die Wirksamkeit eines rollenbasierten, kollaborativen Ansatzes in der automatischen Heuristikentwicklung.

Ähnliche Artikel