ODP-Bench: Benchmarking Out-of-Distribution Performance Prediction
Anzeige
Ähnliche Artikel
arXiv – cs.LG
•
KI-Scoring für Protein‑Liganden: Studie testet Generalisierung auf neue Ziele
arXiv – cs.AI
•
Mehr aus Weniger lernen: REPCORE nutzt interne Zustände zur Benchmark-Kompression
arXiv – cs.LG
•
Effiziente Blockentfernung bei großen Sprachmodellen: Optimierung mit Ising-Modell
arXiv – cs.AI
•
AI-Agenten im Versicherungs-Underwriting: Neuer Benchmark UNDERWRITE
arXiv – cs.AI
•
Neuro-symbolische KI: Wege für Predictive Maintenance – Analyse & Empfehlungen
arXiv – cs.AI
•
Neues Benchmark deckt Schwächen großer Sprachmodelle im Mathematik‑Denken auf