AI-SearchPlanner: Modulare Agenten-Suche mit Pareto-optimiertem RL
Eine neue Veröffentlichung auf arXiv (2508.20368v1) präsentiert AI‑SearchPlanner, ein Reinforcement‑Learning‑Framework, das die Leistungsfähigkeit von festgehaltenen QA‑Modellen durch gezielte Suchplanung verbessert.