D2E: Scaling Vision-Action Pretraining on Desktop Data for Transfer to Embodied AI
Anzeige
Ähnliche Artikel
arXiv – cs.AI
•
Neue Studie zeigt, wie LLMs VirtualHome meistern – SSC steigert Leistung
MarkTechPost
•
Robbyant stellt LingBot-World als Open-Source-World-Modell vor
Hugging Face – Blog
•
Introducing NVIDIA Cosmos Policy for Advanced Robot Control
arXiv – cs.AI
•
QMAVIS: Revolutionäres Long-Video‑Audio‑Verständnis durch multimodale Fusion
arXiv – cs.AI
•
Verteilungsabgleich verbessert semi‑supervised kontrastives Lernen
arXiv – cs.LG
•
Semi-supervised GCNs optimiert durch kontrastives Lernen und Selbsttraining