2019年1月26日至2月3日期间,我(张子恒)和导师组内的廉东泽同学一起赴美国夏威夷参加了AAAI2019。AAAI是是国际人工智能领域的顶级会议之一,参与者包括来自世界各地学术界的学者以及工业界的人员。在本届AAAI我和廉东泽同学被录用的论文是GazeTrackingviaMulti-taskCNN,是一篇解决人的凝视点估计问题的论文。作为这篇论文的共同第一作者,我得到学校的资助,参加了本次会议并且在PosterSession向世界范围内的同行介绍了我们的工作。
会议的前两天主要开展了若干计算机视觉相关的专题研讨会(Workshop)。在1月27日,我参加了UltraFast 3D Sensing, Reconstruction and Understanding of People, Objects and Environments主题研讨会。这场研讨会的主题是超快速三维传感,三维重建以及三维场景的理解。虽然这是本次会议的第一场研讨会,却给我留下了深刻的印象。在研讨会的开头,来自Google的Sean Fanello对研讨会做了开场介绍。Fanello 首先回顾了现有的各种深度传感器及其优缺点。接着,他从应用的角度出发,通过一些应用实例,说明了超快速深度传感可以显著提高目前许多涉及三维视觉包括SLAM以及重建等相关算法的性能。随后,Fanello对目前深度图质量的评价提出了自己的观点,他指出平滑的深度图并不等于高质量,缺失的深度优于平滑但错误的深度。这一观点虽然看似违反直觉,但通过三维可视化的例子,我们直观看到了两者的差别,并且对深度图的质量评价有了更深层次的认识。在Fanello精彩的开场之后,其他报告者分别从并行优化、深度信息补全、基于深度学习的深度估计、多视角匹配以及提供给开发者使用的ARCore工具包几个方面,描绘了整套三维视觉解决的方案。研讨会下午的内容主要涵盖了一些三维重建、理解以及优化相关的具体应用。1月28日,我参加了Reproducible AI主题研讨会,这场研讨会的内容有关人工智能项目的可复现性。可复现性是一个AI项目能否为社区做出真正有意义的贡献的一个重要衡量指标,研讨会组织者讨论了一系列提高工作可复现性的技巧,让人受益良多。
1月29日-2月2日是会议的主进程,包含了许多口头演讲以及多场PosterSession。我与其他同学一起聆听了所有的口头演讲。这些工作的内容主要包括深度网络剪裁、适应;深度模型的优化;三维传感、重建及理解;图片风格迁移;多模态;物体检测及分割;以及一些新的数据集与任务等等。其中印象比较深刻的两篇工作都来自同一个作者-Zhipeng Cai。他的两篇工作主要讨论了计算机视觉领域非常常见的一类consensus maximization优化问题的内容。这一优化问题在实际应用中通常使用RANSEC一类的随机算法求解。在第一篇工作中,Cai提出了biconvex programming算法作为一种确定性算法以解决consensus maximization优化问题,并且从理论上保证了算法在给定任意精度的情况下仅需多项式复杂度即可得到满足要求的可行解。在第二篇工作中,Cai进一步证明了consensus maximization优化问题求解全局最优解本质为NP完全问题,因此前一篇文章中的方法为最优方法。这两篇文章思路清晰,逻辑严谨,演讲者的讲解也非常精彩直观,给我们留下了十分深刻的印象。
2月2日同样举行了多场研讨会,我主要参与了The 3rd Geometry Meets Deep Learning Workshop。这场研讨会的内容正如其名,主要讨论了深度学习在三维几何推断及理解方面的研究工作。我在这次研讨会中首次看到了图卷积网络在三维数据处理的应用实例。图卷积网络可以看作是传统卷积神经网络的推广,可处理非欧式空间上的数据。许多三维数据,如点云都具有这种性质,图卷积网络对于三维数据具有潜在的应用价值。
本次出国参会是我继去年ECCV以来第二次与如此众多的同行交流并展示自己工作的经历。在这次会议中,通过各类研讨会、口头报告以及论文作者的讲解,我对于计算机领域的前沿研究有了更广泛及深入的认识。同时,通过对自己工作的讲解,我的演讲能力得到了锻炼,也认识到了自己工作中还存在的不足。感谢学校和导师对于我此次出国参会的资助!