Forschung
GazeQwen: Leichtgewichtiges Gaze-Conditioned LLM für Streaming-Video-Analyse
Ein neues Verfahren namens GazeQwen ermöglicht es multimodalen Sprachmodellen, Blickdaten effektiv zu nutzen, um Videoinhalte besser zu ver…
arXiv – cs.AI