Quantum‑Boltzmann‑Maschinen: Effizientes Reinforcement Learning mit kontinuierlichen Aktionen
In einer wegweisenden Veröffentlichung auf arXiv wird das neue Modell Continuous Semi‑Quantum Boltzmann Machines (CSQBMs) vorgestellt, das kontinuierliche Aktionsräume in Reinforcement‑Learning‑Algorithmen unterstützt. Durch die Kombination von exponentiellen Familienprioren für sichtbare Einheiten mit quantenmechanischen Boltzmann‑Verteilungen für verborgene Einheiten entsteht ein hybrides Modell, das die Quantenressourcen reduziert, ohne die Ausdruckskraft zu verlieren.
Ein entscheidender Vorteil der CSQBMs ist die analytische Berechnung von Gradienten in Bezug auf kontinuierliche Variablen. Diese Eigenschaft ermöglicht eine nahtlose Integration in Actor‑Critic‑Architekturen und erleichtert die Optimierung von Policy‑Netzwerken erheblich. Gleichzeitig bleibt die Modellkomplexität überschaubar, was die praktische Umsetzung auf aktuellen Quantenhardware‑Plattformen erleichtert.
Aufbauend auf diesem Konzept wird ein kontinuierliches Q‑Learning‑Framework präsentiert, das die herkömmliche globale Maximierung durch effizientes Sampling aus der CSQBM‑Verteilung ersetzt. Dieser Ansatz löst die häufig auftretenden Instabilitätsprobleme bei der Steuerung kontinuierlicher Systeme und eröffnet neue Möglichkeiten für stabile, dateneffiziente Lernalgorithmen in anspruchsvollen Anwendungsfeldern.