PromptPort: Zuverlässige strukturierte Extraktion über Modelle hinweg
In der Praxis scheitert die strukturierte Extraktion mit großen Sprachmodellen nicht an fehlendem Verständnis, sondern an unzuverlässiger Ausgabeformatierung. Ein Prompt, der bei GPT‑4 sauberes JSON liefert, kann bei Llama zu gefesseltem, prosaartig verpacktem oder sogar fehlerhaftem Output führen, sodass strenge Parser die ansonsten korrekten Ergebnisse ablehnen. Dieses Phänomen, das die Autoren als „Format Collapse“ bezeichnen, wurde systematisch untersucht.