RTTC: Belohnungsbasierte, kollaborative Testzeit-Optimierung für LLMs
Im Zeitalter der großen Sprachmodelle (LLMs) hat sich die Testzeit-Optimierung (TTC) als wirkungsvolles Mittel etabliert, um die Inferenzleistung zu steigern. Dabei kommen Techniken wie Testzeit-Training (TTT) und Retri…