Chain-of-Thought schlägt zurück: Prompt-Sensitivität bei medizinischen LLMs
In einer aktuellen Studie wurde die Empfindlichkeit von medizinischen Sprachmodellen gegenüber Prompt-Formatierungen eingehend untersucht. Dabei wurden die Modelle MedGemma in den Varianten 4 B und 27 B auf zwei umfangr…