2023年10月1日到10月8日,我有幸作为上海科技大学何旭明课题组前往ICCV2023会议的成员之一,与何旭明教授、张楚瑜师兄、吴隅师兄、魏雅娜师姐一起到法国巴黎进行了为期七天的短期交流。我们的目的地是美丽的巴黎,这座城市的居民热情友好,总是愿意提供帮助。在法期间,我和上海科技大学的老师和学生共同探索学习。作为ICCV收录的论文的共同第一作者,张楚瑜师兄和我有幸在10月6日上午进行了会议上的海报展示,与来自世界各地的学术界同行分享了我们的研究成果。在为期七天的的学习交流中,每一天每一刻的生活都充实而富有新鲜感。我不仅提高了自己的英语听力和口语表达能力,还更深刻地理解了科研的本质,以及如何进行科研工作的方方面面。这段经历对我的个人成长和职业发展都产生了积极影响。回想起来真是收获不少,希望回国后能把学到的东西应用于自己的科研工作中。
图表 1会议实拍
ICCV作为两年一届的计算机视觉顶级会议之一,于2023年10月2日-2023年10月6日在法国巴黎隆重举行。在会议前两天,会议主要内容为workshops和tutorials。而在会议之后的三天,会议主要内容为oral papers汇报和posters展示。在此我想按时间顺序介绍一些让我印象深刻的事情。
图表 2会议时间安排
10月2日,我主要参加了“BigMAC: Big Model Adaptation for Computer Vision”和“What is Next in Multimodal Foundation Models?”。10月3日,我主要参加了“The 2nd Workshop and Challenges for Out-of-Distribution Generalization in Computer Vision”和“Towards the Next Generation of Computer Vision Datasets”。其中第一个“BigMAC: Big Model Adaptation for Computer Vision”的“Robust Fine-tuning of Zero-shot Models” topic汇报给我留下了深刻的印象。这项工作由华盛顿大学的助理教授Ludwig Schmidt进行,由哥伦比亚大学的博士生Samir Yitzhak Gadre进行汇报。这篇工作于我近期想进行的科研方向高度相关。他们发现了一些非常有趣的事情。如果你把一个很强的大模型在一个具体的数据集上进行fine-tuning,模型的在此数据集上的性能会变好,但是模型的鲁棒性会变差。在这个topic中鲁棒性的变差主要体现在domain shift的数据集上性能变差。他们发现只要通过最简单的线性组合原模型的参数和fine-tune之后模型的参数就能同时提高模型在fine-tune数据集上和在新domain上的性能。除此之外,他们还根据不同的线性组合方式画出了一条非常有趣的曲线,在一定程度上能帮助我们更加深刻地理解大模型的性能。我本人是从事新类发现问题(novel class discovery)研究。在这个方向,现在人们一些做法也是将一个比较强的大模型(dino)在known-class data上先进行fine-tuning,然后同时学习所有数据。这样的做法人们发现由于在known-class data上先进行fine-tuning会导致模型在一定程度上局限在known-class data上,从而失去本身在novel class data上的性能。这个现象与这个汇报工作现象非常类似。听完这个汇报后,我思考是否可以应用线性插值方式来改善我们的模型在已知类别数据和新类别数据上的性能,这是一个非常有前景的研究方向。这个研讨会让我深刻认识到研究的跨领域性质和各个研究方向之间的联系,激发了我在未来的研究中探索这些有趣问题的兴趣。
图表 3 Robust Fine-tuning of Zero-shot Models
在10月2号到10月6号的会议期间,除了各种各样有意思的科研方向让我印象深刻以外,我对如何讲好一个topic以及会议具体形式有了更加深刻的认识。在参加了两天各种各样的workshop之后以及oral paper的汇报后,我明白了如何在短时间内清晰地呈现一个topic,并且了解了如何在研讨会中安排PPT内容和页数,以确保有效传达自己的研究。此外,我也掌握了如何与大量观众互动,以使演讲充满趣味并且具有深度。此外,在展示海报后,通过观察其他人的海报和倾听各种问题和讨论,我更清晰地了解了如何安排和设计海报的各个模块,以更好地展示自己的研究方向和论文内容。除了这些感悟以外, workshop和oral paper的台上汇报以及观众的积极反应,都激发了我的科研动力,希望自有一天也能有机会上台分享我的研究成果。
图表 4海报展示
在10月6日上午10:30-12:30,我与张楚瑜师兄一同进行了海报展示。在这个上午,我们向来自世界各地的与会者展示了我们的研究方向和成果。许多人对我们的研究方向——新类别发现问题,表现出浓厚的兴趣。他们认为这是一个非常有趣和有前景的问题。此外,一些参会者还为我们提供了他们对这个问题的深刻看法和有建设性的指导意见。这些观点和建议对我们的工作具有重要的指导作用,帮助我们更好地理解和改进我们的研究。这种学术交流和互动是会议的重要亮点之一,为我们提供了宝贵的反馈和启发。
除了众多的科研收获以外,我在10月6日的海报展示和在巴黎的日常生活中也认识到了自己英语口语和听力的不足之处。就英语听力而言,我发现虽然我能理解别人在说什么,但常常需要花一些额外的思考时间来理解,这与中文的迅速理解方式不同。特别是在面对带有口音的英语时,我经常需要花费5秒以上的时间来猜测他们说的是什么单词。与英语听力相比,我更严重的问题在于口语。可能是因为口语练习的机会有限,我很难明确、迅速地表达清楚自己的意思。我常常只能用非常简单的单词和句子来表达自己的意思,甚至会出现语法错误。参加这次会议之后,我认识到了加强自己的英语口语能力的迫切性。我计划在未来首先努力提升我的英语口语能力。
这只是我部分的体验心得,如果要细细道来恐怕要很久时间。除了这些以外,我还想表达我的感激之情。感谢我的导师何旭明教授和我的学校上海科技大学能给我这样难能可贵的机会,让我对科研有了更加深刻的认知并坚定了对自己的未来人生定位。