VLMs mit Mehrstufiger Wissensprüfung: 31 % mehr Faktengenauigkeit
Visuelle Sprachmodelle (VLMs) sind inzwischen leistungsstarke Werkzeuge, doch ihre Fähigkeit, korrekte Fakten zu liefern, bleibt oft hinter den Erwartungen zurück. Ein neues Forschungsprojekt präsentiert einen Ansatz, d…