Neues Benchmark FIFE enthüllt Leistungsunterschiede bei Sprachmodellen im Finanzbereich
Ein neues Benchmark namens FIFE (Financial Instruction Following Evaluation) wurde veröffentlicht, um die Fähigkeit von Sprachmodellen (LMs) zu testen, komplexe und voneinander abhängige Anweisungen im Finanzbereich kor…