融合遥感及街景多视角数据的城市场景视觉感知与多模态理解

Release Time:2025-07-08Number of visits:503

演讲者: 李唯嘉,中山大学 

时间: 2025年7月10日,上午11:00

邀请人: 师玉娇

地点: 信息学院 1C-201

讲座摘要:

城市作为人类最主要的居住地和经济中心,长期以来被高分辨率遥感影像、街景图像、LiDAR数据、公共地图等多视角、多模态数据所记录, 有效利用这些多源数据对于实现细粒度城市感知及多模态推理等任务具有重要意义。然而,由于这些数据在拍摄视角、空间分布等方面存在显著差异,现有研究在多视角数据融合、统一的特征表示构建、多模态标注数据构建等方面依然存在局限。针对上述问题,本报告围绕“融合遥感及街景多视角数据的城市场景视觉感知与多模态理解”这一主题,介绍我们在基于“遥感-街景”跨视角数据的城市建筑物细粒度属性分割、基于扩散模型的跨视角图像生成、多视角城市场景下的多模态大模型评测基准以及视觉语言模型构建等工作,并对未来研究方向进行展望。


报告人简介:

李唯嘉,中山大学百人计划副教授、上海人工智能实验室研究顾问,长期从事人工智能及计算机视觉领域研究,本科毕业于中山大学,博士毕业于清华大学,曾在香港中文大学MMLab从事博士后研究,在CVPR、ICCV、ECCV、ICLR、AAAI、IEEE TGRS、GRSM等国际顶会顶刊发表学术论文50余篇,谷歌学术引用3900 余次,主持国自然青年基金项目、广东省面上项目、多模态大模型校企合作项目等,研究成果除了在学术上的重要影响外,也在商汤科技、深信服科技等企业得到实际落地应用。