GazeQwen: Leichtgewichtiges Gaze-Conditioned LLM für Streaming-Video-Analyse
Ein neues Verfahren namens GazeQwen ermöglicht es multimodalen Sprachmodellen, Blickdaten effektiv zu nutzen, um Videoinhalte besser zu verstehen. Durch die Integration von Augenbewegungen in die Modellarchitektur kann…