Forschung
See-Control: Multimodaler Agent für Smartphone-Steuerung mit Roboterarm
Mit den neuesten Fortschritten in multimodalen großen Sprachmodellen (MLLMs) wird die Idee, intelligente Agenten zur Steuerung von Smartpho…
arXiv – cs.AI