Context-Picker: Dynamische Kontextauswahl mit mehrstufigem Reinforcement Learning
In der langen Kontextfragebeantwortung (Long‑Context QA) stellt die Wahl des optimalen Kontextumfangs ein zentrales Problem dar. Zu wenige Passagen können wichtige Informationen vernachlässigen, während zu viele Passage…