<h1>Test‑Time‑Scaling: Mehr oder weniger Nutzen für Vision‑Language‑Modelle?</h1> <p>Test‑Time‑Scaling (TTS) hat sich als wirkungsvolles Verfahren etabliert, um die Rechenleistung von Large Language Models (LLMs) während der Inferenz zu erhöhen und dadurch die Problemlösungsfähigkeit zu verbessern. In der multimodalen Forschung, insbesondere bei Vision‑Language‑Modellen (VLMs), ist die Anwendung von TTS jedoch noch nicht vollständig erforscht.</p> <p>In einer systematischen Untersuchung wurden sowohl Open‑S
Anzeige