【师者】顾家远:量力而行,尽力而为

发布者:闻天明发布时间:2024-12-04浏览次数:10

新入职教授介绍 PROFILE



顾家远

信息科学与技术学院

助理教授、研究员、博士生导师

SIST



SIST

╱ 个人简介 


顾家远,博士,现任上海科技大学信息科学与技术学院助理教授,研究员、博士生导师。2024年博士毕业于加州大学圣地亚哥分校,师从苏昊教授。2018年本科毕业于北京大学信息科学技术学院智能科学系,指导老师为王立威教授。


研究方向为具身智能,聚焦于服务于具身智能的三维视觉和可泛化的机器人决策模型,在计算机视觉、机器学习、机器人等国际重要学会会议(CVPR,NeurIPS,ICLR,ICRA等)上均有发表。参与的项目Open X-Embodiment获得了ICRA 2024的Best Paper Award。同时,顾老师也担任相关领域会议的审稿人,并在RSS,ECCV,CVPR等学术会议上组织过相关的研讨会和教程。



╱ 写给学生的话 

“量力而行,尽力而为”


“卷”和“躺”是我们经常面临的选择题。在有机会的时候不去尝试和努力,事后会后悔;在能力不足的时机去勉强自己,可能丢失初心和持久努力的动力。以科研为例,如果过久地待在舒适区,跟不上新方法和新理念,有可能被时代所淘汰;如果超过自身能力范围去死磕难题,则也许会铩羽而归、闷闷不乐,失去研究的兴趣。我相信,大多数人是需要正反馈的,即便科研有时需要坐冷板凳。因此,不妨花点时间深入了解自己,制定一些自己能力边界附近的目标,形成属于自己的正反馈循环。虽然做有挑战性的事情难免有时痛苦,但希望同学们能积极乐观地迎接挑战。因为完成一个挑战所获得的成就感是令人愉悦的,所获的成长也往往会产生长久和深远的影响。希望同学们在生活、学习和工作中,更多地了解自己,不断地探索自己,最终能够实现自己的目标。


╱ 研究方向和研究内容简介 


顾老师的研究方向主要是 具身智能(Embodied AI) 和 三维视觉(3D Vision) 。 ChatGPT虽然体现出令人惊叹的智能,但它仍然生活在虚拟世界中。具身智能的研究目标正是创建具有“身体”的智能体,通过感知自身和外界并执行技能来与物理世界进行交互。它涉及到计算机科学的许多方面,包括计算机视觉、机器学习、机器人等,因此是一个需要各个领域知识融合的方向。其中,三维视觉着力于研究如何对于我们所处的三维世界进行感知和建模。

顾老师目前的一个 研究目标 是创造具身智能的基础模型。这个模型接受不同模态的输入(比如图像、语言、机器人的关节角等),可以输出中间的推理过程(比如检测出感兴趣的物体,可能的机械手运动轨迹),或者直接输出控制机器人的动作指令。相较于传统的机器人学,数据驱动(data-driven)的范式正在改变这个领域,也是具身智能的一大特点。顾老师从 数据和模型 两个方面来举例一些他感兴趣的问题:

01 创造更多的数据

 Real-to-sim:快速构建物理世界的数字孪生(digital twin)可以帮助我们更公平有效地去评测模型(比如simpler-env),或是获得更多用于物理仿真的素材(One-2-3-45++)。

图:Simpler-Env


 Sim-to-real:利用物理仿真来获得更多的交互数据(ManiSkill2)。

图:ManiSkill2专家示例


 Better teleoperation:我们人类仍是目前最强大的智能体,如何高效地获得人类的示例数据是一个重要的问题。

02 探索更泛化的模型

如何充分地利用数据去泛化到更多任务和场景?比如探索一些中间表示(RT-Trajectory)。

图:RT-Trajectory(trajectory-conditioned)比RT-1(language-conditioned) 更容易泛化到新的任务(比如擦桌子)


除了上述的例子,他也关注三维视觉在具身智能的应用,比如通用的三维感知模型,三维物体和场景的重建,具有三维推理能力的大语言模型。


╱ 对课题组学生的

寄语和期待 

“学术上,我希望学生们通过科研训练养成思辨的能力(critical thinking), 通过学术交流锻炼沟通表达的技巧 。科研和考试不同,没有标准答案,而且往往题目都需要你自己给自己出。因此,善于提问题是我心目中科研工作者很重要的能力。生活上,我希望学生们能够做好工作和生活的平衡(work-life balance),养成一些兴趣爱好,花时间陪伴亲人朋友。最后,希望同学们要相信功不唐捐,虽然选择可能大于努力,但是往往努力过后才能看清选择。”




兴趣、爱好






“平时生活中,我热爱运动,喜欢游泳这样强身健体的个人运动,也喜爱篮球、足球这样的团队竞技运动。除了运动,我还喜爱音乐,会拉小提琴,也偶尔自己作曲。”