Suche nach Bootstrap | meineki.news

Portfolio-Reinforcement Learning: Neue Technik senkt Drawdown um 53 %

Eine aktuelle arXiv‑Studie (2602.24037v1) präsentiert einen bahnbrechenden Ansatz für die automatische Portfoliosteuerung, der die Herausfo…

arXiv – cs.AI 02.03.2026 05:00

Forschung

Neuer Algorithmus VBE nutzt Ensemble-Fehler für optimistische Exploration im RL

In der Welt des Reinforcement Learning (RL) steht die gezielte Erkundung von bislang unbekannten Zuständen im Fokus. Der neu vorgestellte A…

arXiv – cs.AI 16.02.2026 05:00

Forschung

Bootstrapping-Regularisierung erhöht Stabilität klinischer Risiko‑Modelle

In der klinischen Praxis werden Vorhersagemodelle immer häufiger eingesetzt, doch viele Deep‑Learning‑Ansätze zeigen eine erhebliche Instab…

arXiv – cs.LG 13.02.2026 05:00

Forschung

FedSurg 2024: Federated Learning für chirurgische Videoanalyse bei Appendizitis

Der FedSurg‑Challenge 2024 hat erstmals ein umfassendes Benchmarking von Federated‑Learning‑Methoden für die Klassifizierung chirurgischer…

arXiv – cs.AI 11.02.2026 05:00

Forschung

Kommunikation stabilisiert strategisches Denken von LLMs

Eine neue Untersuchung auf arXiv zeigt, dass kurze, kostenfreie Vorabnachrichten das strategische Verhalten von großen Sprachmodellen (LLMs…

arXiv – cs.AI 09.02.2026 05:00

Forschung

SafeBench-Seq: CPU‑basiertes Benchmark für Protein‑Gefahrenanalyse

Die rasante Entwicklung von Foundation‑Modellen im Protein‑Design eröffnet neue Möglichkeiten, birgt jedoch konkrete Bio‑Sicherheitsrisiken…

arXiv – cs.LG 22.12.2025 05:00

Forschung

Gefahren des Bootstrapping mit synthetischen Daten im kontinuierlichen Lernen

In der KI-Forschung wird die Nutzung von synthetisch erzeugten Daten immer üblicher. Sie können Trainingsdatensätze erweitern, doch wiederh…

arXiv – cs.LG 16.12.2025 05:00

Forschung

Reinforcement Learning nach dem Training: Mit gemischten Belohnungen Sudoku besser lösen

Reinforcement‑Learning‑Posttraining optimiert üblicherweise nur einen einzigen Skalarwert und nutzt dabei kaum die Struktur, wie Lösungen t…

arXiv – cs.LG 05.12.2025 05:00

Forschung

Neues Verfahren korrigiert frühzeitige Schätzfehler in Krisensituationen

In Notfall- und Hochrisikobereichen bestimmen erste Schätzungen des Systemzustands entscheidend, welche Maßnahmen später ergriffen werden…

arXiv – cs.AI 04.12.2025 05:00

Forschung

KI-Agenten verbessern sich selbst: Theorie und Praxis der Self‑Play‑Optimierung

Wissenschaftler haben ein neues modulares Konzept entwickelt, das psychometrische Messinstrumente auf dynamische Systeme überträgt. Dabei w…

arXiv – cs.AI 03.12.2025 05:00

Forschung

PIGReward: Personalisierte Bewertung von Text‑zu‑Bild‑Modellen

Neues Forschungspapier aus dem arXiv‑Repository präsentiert PIGReward, ein innovatives Modell zur Bewertung von Text‑zu‑Bild‑Generierung. W…

arXiv – cs.AI 26.11.2025 05:00

Forschung

<h1>BREW: Neue Methode steigert Effizienz von Sprachagenten um bis zu 20 %</h1> <p>Sprachagenten, die auf großen Sprachmodellen (LLM) basieren, werden zunehmend für Aufgaben eingesetzt, die strukturiertes Denken, Tool‑Nutzung und Anpassung an die Umgebung erfordern. Traditionelle Optimierungsansätze wie PPO oder GRPO sind jedoch rechenintensiv und schwer zu interpretieren, was die Weiterentwicklung der Agenten erschwert.</p> <p>Die neue Methode namens BREW (Bootstrapping expeRientially-learned Environmental

arXiv – cs.AI 26.11.2025 05:00

Forschung

Ein +1 % reicht nicht: Paired Bootstrap-Protokoll für kleine Verbesserungen

In der aktuellen Forschung im maschinellen Lernen berichten viele Arbeiten von 1‑2 % besserer Ergebnisse, basierend auf einem einzigen Lauf…

arXiv – cs.LG 26.11.2025 05:00

Forschung

LLMs als Sprungbrett für Verstärkungslernen in digitaler Gesundheitsveränderung

In einer aktuellen Studie aus dem arXiv-Repository wird gezeigt, dass große Sprachmodelle (LLMs) sofort einsatzbereit sind, um Trainingsdat…

arXiv – cs.LG 25.11.2025 05:00

Forschung

Copula-basierte Fusion genomischer Scores verbessert Brustkrebsprognose

In einer wegweisenden Studie haben Forscher die Kopula-basierte Fusion von klinischen und genomischen Machine‑Learning‑Risikoscores eingese…

arXiv – cs.LG 25.11.2025 05:00

Forschung

AISAC: Multi-Agent-System für transparente, datenbasierte Forschung

AISAC, das AI Scientific Assistant Core, ist ein integriertes Multi-Agent-System, das am Argonne National Laboratory entwickelt wurde. Es k…

arXiv – cs.AI 19.11.2025 05:00

Forschung

Bootstrap‑Rate beeinflusst Random‑Forest‑Regression stark

Random Forests werden üblicherweise mit einer Bootstrap‑Rate von 1,0 trainiert, das heißt, jedes Baumsample hat dieselbe Größe wie das komp…

arXiv – cs.LG 19.11.2025 05:00

Forschung

LLMs neu starten: Präferenzbasierte Politikoptimierung als Durchbruch In einer bahnbrechenden Veröffentlichung auf arXiv wird ein neues Verfahren vorgestellt, das große Sprachmodelle (LLMs) ohne umfangreiche manuelle Anmerkungen an menschliche Vorlieben anpasst. Das Konzept, „präferenzbasierte Politikoptimierung“ (PbPO), nutzt ein Min‑Max‑Spiel zwischen einer Hauptpolicy und einem Belohnungsmodell (RM), wobei letzteres innerhalb eines aus Präferenzdaten abgeleiteten Vertrauensraums eingeschränkt wird, um z

arXiv – cs.AI 18.11.2025 05:00

Forschung

Neues Framework bewertet Qualität von Voice‑AI‑Testplattformen

Mit der rasanten Verbreitung von Voice‑AI‑Agenten wächst die Nachfrage nach verlässlichen Testmethoden. Bisher fehlt jedoch ein systematisc…

arXiv – cs.AI 07.11.2025 05:00

Forschung

Neues RL-Verfahren ermöglicht LLMs, sich selbst zu verbessern

In einer kürzlich veröffentlichten Studie auf arXiv wird ein innovatives Reinforcement‑Learning‑Verfahren namens Exploratory Iteration (ExI…

arXiv – cs.LG 08.09.2025 05:00

Forschung

Transformer-Modelle für Zeitreihen: Ensemble‑Methoden steigern Genauigkeit

Die neuesten Transformer‑basierten Basismodelle für Zeitreihen – darunter Lag‑Llama, TimeGPT, Chronos, MOMENT, UniTS und TimesFM – haben be…

arXiv – cs.LG 26.08.2025 05:00

Forschung

Twin-Boot: Optimierung mit Unsicherheitsbewusstsein durch Online‑Bootstrap

Standard‑Gradient‑Descent liefert zwar punktuelle Schätzungen, aber keine Aussage über die Zuverlässigkeit dieser Schätzungen. In Modellen…

arXiv – cs.LG 22.08.2025 05:00

Finde Modelle, Firmen und Themen

Portfolio-Reinforcement Learning: Neue Technik senkt Drawdown um 53 %

Neuer Algorithmus VBE nutzt Ensemble-Fehler für optimistische Exploration im RL

Bootstrapping-Regularisierung erhöht Stabilität klinischer Risiko‑Modelle

FedSurg 2024: Federated Learning für chirurgische Videoanalyse bei Appendizitis

Kommunikation stabilisiert strategisches Denken von LLMs

SafeBench-Seq: CPU‑basiertes Benchmark für Protein‑Gefahrenanalyse

Gefahren des Bootstrapping mit synthetischen Daten im kontinuierlichen Lernen

Reinforcement Learning nach dem Training: Mit gemischten Belohnungen Sudoku besser lösen

Neues Verfahren korrigiert frühzeitige Schätzfehler in Krisensituationen

KI-Agenten verbessern sich selbst: Theorie und Praxis der Self‑Play‑Optimierung

PIGReward: Personalisierte Bewertung von Text‑zu‑Bild‑Modellen

Ein +1 % reicht nicht: Paired Bootstrap-Protokoll für kleine Verbesserungen

LLMs als Sprungbrett für Verstärkungslernen in digitaler Gesundheitsveränderung

Copula-basierte Fusion genomischer Scores verbessert Brustkrebsprognose

AISAC: Multi-Agent-System für transparente, datenbasierte Forschung

Bootstrap‑Rate beeinflusst Random‑Forest‑Regression stark

Neues Framework bewertet Qualität von Voice‑AI‑Testplattformen

Neues RL-Verfahren ermöglicht LLMs, sich selbst zu verbessern

Transformer-Modelle für Zeitreihen: Ensemble‑Methoden steigern Genauigkeit

Twin-Boot: Optimierung mit Unsicherheitsbewusstsein durch Online‑Bootstrap

🍪 Cookie-Einstellungen

Portfolio-Reinforcement Learning: Neue Technik senkt Drawdown um 53 %

Ein +1 % reicht nicht: Paired Bootstrap-Protokoll für kleine Verbesserungen