Forschung
WebGPU-Dispatch-Overhead bei LLM-Inferezen:4 GPU-Hersteller, 3 Backends, 3 Browser
Die Sicherheitsarchitektur von WebGPU verlangt bei jeder Operation eine Validierung, die bei den vielen kleinen Dispatches, die bei der Inf…
arXiv – cs.LG