马月昕课题组薛傲如(硕)2025年3月参加AAAI会议并做海报展示

2025226日至35日,我作为论文第一作者与课题组共两名成员赴美国费城参加人工智能领域旗舰会议AAAI 2025。本次会议在费城会议中心举行,会议包括5场全体演讲、11场桥梁会议、41场教程、49场研讨会和42场技术演示。我的论文《FreeCap: Hybrid Calibration-Free Motion Capture in Open Environments》入选Poster环节。


论文针大场景下的运动捕捉难题,提出一种无需预先标定的多模态数据融合框架。核心创新点在于设计动态自适应匹配机制,通过提取LiDAR点云的骨骼拓扑特征与移动相机RGB序列的语义关键点,构建跨传感器姿态关联矩阵,成功解决设备位姿随机变动导致的匹配失效问题。在优化器部分,我们引入增量式相机扩展策略,当新增相机视角时,系统可基于历史融合结果快速迭代姿态置信度权重,避免全局重计算。实验环节联合使用课题组自建的FreeMotion数据集与公开的Human-M3数据集验证,在3相机+LiDAR配置下,人体关节点平均误差较单模态方案明显降低,且可以适用在在遮挡场景下。


我于227日在会展中心进行了Poster汇报,除汇报自身工作外,我系统学习了会议前沿成果。在'AI Agents与应用'主会场报告中,吴恩达教授提出的生成式AI协同工作流为虚实融合训练平台提供了新思路。他以论文写作场景为例,展示AI如何通过提纲生成、数据检索、迭代优化等模块化流程实现任务分解,这与我们运动捕捉系统的实时数据流处理具有高度适配性。若将这一框架应用于虚实交融训练评估,可设计多级智能体架构:第一级智能体实时解析运动员捕捉数据,第二级基于吴恩达团队提出的'动态先验知识库'生成虚拟对抗场景,第三级通过强化学习反馈调整训练参数,形成闭环优化系统。

参与'双边市场中的决策智能'Workshop时,滴滴前首席科学家秦志伟展示的强化学习动态定价模型令我深受启发。其通过环境感知、策略优化、在线实验三大模块构建的网约车调度系统,与我们多传感器优化器的增量式扩展逻辑高度契合。特别是在'传感器突发故障模拟'环节,他们提出的对抗性数据增强策略(模拟极端天气下的传感器噪声)可直接迁移至我们的系统,通过在训练数据中注入雾霾散射模型、强光过曝等合成噪声,提升模型在恶劣环境下的泛化能力。


费城浓厚的学术氛围与历史底蕴相得益彰。会议间歇期,我也抽空去了宾夕法尼亚大学去感受名校的人文和学习氛围。在Fisher Fine Arts图书馆内,发现学生正使用增强现实技术还原古籍中的生物学手稿插图,这种虚实交互的场景让我联想到运动捕捉数据在数字孪生系统中的可视化应用可能。这使我在紧张之余放松了心情,也启发了我在后续科研方向的思考。


此次参会经历使我全面提升学术视野与国际合作能力。衷心感谢导师马月昕教授从论文选题到实验设计的全程指导,我非常感谢学校和马月昕老师的支持,让我有机会参与这样的国际盛会。未来我将继续深化多模态融合研究,我会将此次出访的经验运用到后续的研究中,并不断精进。

海报展示现场照片