GPU-gestützte, exakt skalierbare Inferenz für Hawkes-Prozesse
Hawkes-Prozesse sind selbstverstärkende Punktprozesse, die in Bereichen wie Finanzmarktanalyse, Netzwerkanalyse und seismologischer Vorhersage breite Anwendung finden. Trotz ihrer Nützlichkeit ist die Maximum-Likelihood…
- Hawkes-Prozesse sind selbstverstärkende Punktprozesse, die in Bereichen wie Finanzmarktanalyse, Netzwerkanalyse und seismologischer Vorhersage breite Anwendung finden.
- Trotz ihrer Nützlichkeit ist die Maximum-Likelihood-Schätzung bei großen Datenmengen bislang ein Engpass, da sie im naiven Ansatz quadratisch in der Anzahl der Ereigniss…
- Der klassische lineare exponentielle Hawkes-Prozess bietet zwar eine O(N)-Rekurrenz, wird jedoch bisher sequentiell berechnet und nutzt die Parallelisierung moderner GPU…
Hawkes-Prozesse sind selbstverstärkende Punktprozesse, die in Bereichen wie Finanzmarktanalyse, Netzwerkanalyse und seismologischer Vorhersage breite Anwendung finden. Trotz ihrer Nützlichkeit ist die Maximum-Likelihood-Schätzung bei großen Datenmengen bislang ein Engpass, da sie im naiven Ansatz quadratisch in der Anzahl der Ereignisse wächst.
Der klassische lineare exponentielle Hawkes-Prozess bietet zwar eine O(N)-Rekurrenz, wird jedoch bisher sequentiell berechnet und nutzt die Parallelisierung moderner GPUs nicht aus. In der neuen Arbeit wird die Intensität des Prozesses als Produkt sparsamer Übergangsmatrizen dargestellt, die eine lineare, assoziative Multiplikation ermöglichen. Durch die Anwendung eines parallelen Präfix-Scans entsteht ein einfaches, aber hochgradig parallelisierbares Verfahren zur Maximum-Likelihood-Schätzung.
Das Ergebnis ist eine Komplexität von etwa O(N/P) mit P Parallelprozessoren, ergänzt durch ein Batching-Schema, das einen konstanten Speicherverbrauch gewährleistet und GPU-Speicherbeschränkungen vermeidet. Dabei bleibt die Berechnung der exakten Likelihood unverändert, ohne zusätzliche Annahmen oder Approximationen, was die Einfachheit und Interpretierbarkeit des Modells bewahrt.
In Tests mit simulierten und realen Datensätzen erzielt die Methode Geschwindigkeitssteigerungen um mehrere Größenordnungen. Sie skaliert problemlos auf tausende Knoten und Zehntausende Millionen von Ereignissen – weit über die von früheren Ansätzen erreichten Grenzen hinaus.
Zur Förderung der Forschung und Anwendung steht eine Open-Source-Bibliothek in PyTorch zur Verfügung, die die beschriebenen Optimierungen implementiert und sofort einsatzbereit ist.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.