MiniAppBench: Benchmark für interaktive HTML‑Apps von LLM‑Assistenten
Die neuesten Fortschritte in Large Language Models (LLMs) führen die Mensch‑KI‑Interaktion von einfachen Textantworten zu dynamischen, interaktiven HTML‑Anwendungen – den sogenannten MiniApps. Diese MiniApps verlangen von den Modellen nicht nur die Darstellung einer visuellen Oberfläche, sondern au…