分类目录归档:多模态

复杂场景下多人3D人体运动重建取得新进展(CVPR 2026)

视频是人类理解现实世界的重要载体。相较于静态图像,视频不仅包含丰富的空间结构信息 … 继续阅读

发表在 Paper论文, Update动态, 多模态 | 留下评论

讲座:面向视频世界模型的记忆、结构与几何

发表在 Seminar研讨班, Update动态, 多模态 | 留下评论