为提升自身学术水平,加强学术交流,本人于2025年1月份向ICCV 2025(International Conference on Computer Vision)提交论文,并被接收为海报展示。该会议在美国夏威夷举行,本人从10月18号出发,至10月26号到达国内,为期9天。本人按原计划完成出访参会交流、海报展示的任务并回国。
ICCV 2025是计算机视觉领域最顶级的国际学术会议之一,每两年举办一次,与CVPR、ECCV并称为计算机视觉三大顶会。本次会议聚焦于计算机视觉、机器学习、机器人视觉、人机交互等前沿领域,吸引了来自全球各地的顶尖学者、研究人员和工业界专家。会议涵盖了从基础理论到实际应用的广泛议题,为不同背景的研究者提供了一个交流最新研究成果、探讨未来发展方向的国际平台。会议期间,每天上午都会安排不同方向的主题演讲(Keynote Speech),涵盖了从大规模视觉-语言模型、具身智能、到机器人操作等多个热门领域。其中,关于具身智能和机器人视觉的主题演讲给我留下了深刻印象。演讲者详细介绍了如何将视觉感知与机器人控制相结合,实现更加智能和自然的人机协作,这与我们的研究方向高度相关。
我的海报展示被安排在会议正会的第二天上午。我们的工作题目是'DexH2R: A Benchmark for Dynamic Dexterous Grasping in Human-to-Robot Handover'(DexH2R:人-机器人交接中动态灵巧抓取的基准测试)。我们的工作解决了人-机器人物体交接这一基础但具有挑战性的任务。现有的数据集主要关注静态物体抓取或依赖合成的交接动作,无法真实反映实际场景中的运动模式。因此,我们构建了第一个真实的人-机器人交接数据集DexH2R,使用ShadowHand灵巧手进行数据采集。该数据集包含4282次交接试验,涉及39名参与者和56个日常物体,提供了丰富的多模态感知数据和精确的3D标注。更重要的是,我们通过遥操作系统采集数据,使机器人的动作能够与人类的行为习惯保持一致,这对于机器人来说是至关重要的特性。在方法方面,我们提出了DynamicGrasp解决方案,包括三个关键阶段:抓取姿态准备、接近运动生成和目标姿态对齐。我们还对自回归模型和扩散策略方法进行了全面的评估和比较。
海报展示期间,吸引了众多研究者的关注,前后有十几位学者驻足询问。学者们指出我们的数据集填补了该领域的重要空白,特别是真实的人类交接动作数据对于训练更加自然的机器人行为至关重要。他们询问了许多技术细节,包括我们如何处理遥操作的延迟问题、如何标注动态场景中的3D姿态,以及我们的物理约束过滤器的具体实现。这些问题都触及了我们工作的核心技术点,说明我们的研究确实引起了学术界的共鸣。还有几位来自工业界的研究人员对我们的工作表示出浓厚兴趣,他们认为人-机器人交接在家庭服务机器人、医疗护理、工业协作等场景中都有广泛的应用前景。
ICCV的午餐和晚宴安排得非常周到。午餐提供了多种选择,包括热菜、沙拉和不同的主菜,能够满足不同饮食习惯的需求。晚宴则在海边的餐厅举行,气氛轻松愉快,大家一边享用美食一边交流研究心得。整个会议期间都提供咖啡、茶和饮料,这对于需要长时间参会的人来说非常贴心。
这是我第一次参加ICCV这样的顶级国际会议,对我来说意义重大。通过参加这次会议,我不仅展示了自己的研究工作,更重要的是了解了计算机视觉和机器人领域的最新研究动态和发展趋势。看到来自世界各地的优秀学者在各自领域的深入研究和创新成果,让我深受鼓舞,也让我意识到自己还有很大的提升空间。通过与其他研究者的交流,我认识到我们的工作在灵巧手操作和人机交互领域确实具有重要价值。真实的人-机器人交接数据集是该领域迫切需要的资源,而我们提出的类人动态抓取行为也为开发更加自然和智能的机器人系统提供了新的思路。同时,通过与工业界人士的交流,我也更加清楚地看到了我们的研究从理论到实际应用还需要解决哪些问题。
此外,我也认识到了我们课题组在多模态感知和数据采集方面的优势。我们构建的完整视觉系统,包括多视角RGB-D相机和自我中心视角相机,能够捕捉到高质量的人-物-机器人交互数据,这在相关研究中是比较领先的。我们采用遥操作系统采集类人动作数据的方法也得到了认可,这为后续研究智能人形机器人打下了良好基础。通过这次会议,我还建立了一些有价值的学术联系,为今后可能的合作研究创造了机会。同时,也了解到一些潜在的应用场景和合作伙伴,这对于推动我们的研究成果走向实际应用很有帮助。
参加ICCV这样的国际顶会,让我开阔了视野,提升了学术品味,也增强了继续深入研究的信心和动力。我深刻体会到,做好的研究不仅需要扎实的技术功底,还需要对领域发展趋势的准确把握,以及与国际同行的充分交流。这次参会经历必将对我今后的研究工作产生积极而深远的影响。
