在2019年6月15日至22日期间,我(张子恒)和导师组内的其他5名同学(徐衍钰、廉东泽、郑佳、余泽浩、李晶)以及厉征鑫老师一起赴美国参加了计算机视觉与模式识别会议(CVPR19)。计算机视觉与模式识别会议是国际计算机视觉领域的顶级会议之一,参与者包括来自世界各地学术界的学者以及工业界的人员。在本届CVPR我们组内共有4篇论文被录用,我与厉征鑫老师合作完成的工作PPGNet: Learning Point-Pair Graph for Line Segment Detection也是其中之一。作为这篇论文的共同第一作者,我得到导师组的资助,参加了本次会议并且在Poster Session向世界范围内的同行介绍了我们的工作。
会议的前两天主要开展了若干计算机视觉相关的专题研讨会(Workshop)。在6月16日,我参加了UltraFast 3D Sensing, Reconstruction and Understanding of People, Objects and Environments主题研讨会。这场研讨会的主题是超快速三维传感,三维重建以及三维场景的理解。虽然这是本次会议的第一场研讨会,却给我留下了深刻的印象。在研讨会的开头,来自Google的Sean Fanello对研讨会做了开场介绍。Fanello 首先回顾了现有的各种深度传感器及其优缺点。接着,他从应用的角度出发,通过一些应用实例,说明了超快速深度传感可以显著提高目前许多涉及三维视觉包括SLAM以及重建等相关算法的性能。随后,Fanello对目前深度图质量的评价提出了自己的观点,他指出平滑的深度图并不等于高质量,缺失的深度优于平滑但错误的深度。这一观点虽然看似违反直觉,但通过三维可视化的例子,我们直观看到了两者的差别,并且对深度图的质量评价有了更深层次的认识。在Fanello精彩的开场之后,其他报告者分别从并行优化、深度信息补全、基于深度学习的深度估计、多视角匹配以及提供给开发者使用的ARCore工具包几个方面,描绘了整套三维视觉解决的方案。研讨会下午的内容主要涵盖了一些三维重建、理解以及优化相关的具体应用。6月17日,我参加了360° Perception and Interaction主题研讨会,这场研讨会的内容与我们本次被会议录用的论文主题高度相关,因此我们也将我们的工作提交到了这场研讨会,参与了Poster环节的分享,同时我们也与许多其他文章的作者进行了沟通。
6月18日-20日是会议的主进程,包含了许多口头演讲以及多场Poster Session。我与其他同学一起聆听了所有的口头演讲。这些工作的内容主要包括深度网络剪裁、适应;深度模型的优化;三维传感、重建及理解;图片风格迁移;多模态;物体检测及分割;以及一些新的数据集与任务等等。其中印象比较深刻的两篇工作都来自同一个作者-Zhipeng Cai。他的两篇工作主要讨论了计算机视觉领域非常常见的一类consensus maximization优化问题的内容。这一优化问题在实际应用中通常使用RANSEC一类的随机算法求解。在第一篇工作中,Cai提出了biconvex programming算法作为一种确定性算法以解决consensus maximization优化问题,并且从理论上保证了算法在给定任意精度的情况下仅需多项式复杂度即可得到满足要求的可行解。在第二篇工作中,Cai进一步证明了consensus maximization优化问题求解全局最优解本质为NP完全问题,因此前一篇文章中的方法为最优方法。这两篇文章思路清晰,逻辑严谨,演讲者的讲解也非常精彩直观,给我们留下了十分深刻的印象。
6月21日同样举行了多场研讨会,我主要参与了The 3rd Geometry Meets Deep Learning Workshop。这场研讨会的内容正如其名,主要讨论了深度学习在三维几何推断及理解方面的研究工作。我在这次研讨会中首次看到了图卷积网络在三维数据处理的应用实例。图卷积网络可以看作是传统卷积神经网络的推广,可处理非欧式空间上的数据。许多三维数据,如点云都具有这种性质,图卷积网络对于三维数据具有潜在的应用价值。
本次出国参会是我第三次与如此众多的同行交流并展示自己工作的经历。在这次会议中,通过各类研讨会、口头报告以及论文作者的讲解,我对于计算机领域的前沿研究有了更广泛及深入的认识。同时,通过对自己工作的讲解,我的演讲能力得到了锻炼,也认识到了自己工作中还存在的不足。感谢导师对于我此次出国参会的资助!