大语言模型的关键研究问题

发布时间:2023-10-07浏览次数:443

演讲者:   黄民烈教授清华大学

时间:      2023年10月10日上午 9:30-10:30

邀请人:   郑杰

地点:      信息学院 1C 101

 

摘要:

ChatGPTGPT-4为代表的大语言模型在智能水平上取得了前所未有的突破,这些模型在问答、写作、推理、数学等各种任务上都实现了令人惊讶的能力。通用人工智能似乎离我们越来越近。但这些统计概率模型也依然面临一定的局限性,包括信息的可信度不足,精确计算与符号推理能力弱,安全性面临一定的风险,对模型能力的评估缺少统一标准等。讲者将围绕他在大模型研究中的思考,分享大模型在可信度、符号计算、安全性等方面的关键研究问题。

报告人简介:

黄民烈,清华大学长聘教授,博士生导师,国家杰青获得者,计算机系智能技术与系统实验室副主任,清华大学基础模型中心副主任,自然语言生成与智能写作专委会副主任、CCF学术工委秘书长。他的研究领域为大规模语言模型、对话系统、语言生成,著有《现代自然语言生成》一书。承担国家自然科学基金重点项目、面上项目、青年基金多项,多次参与国家重大研发计划项目。曾获得中国人工智能学会吴文俊人工智能科技进步奖一等奖(第一完成人),中文信息学会汉王青年创新奖,微软合作研究奖等。在国际顶级会议和期刊发表论文150多篇,谷歌学术引用16000多次,h-index 62,入选2022Elsevier中国高被引学者,连续三年入选AI 2000全球最有影响力AI学者榜单;多次获得国际主流会议的最佳论文或提名(IJCAIACLSIGDIAL等)。研发任务型对话系统平台ConvLabConvLab2,中文对话大模型EVAOPDCharacterGLM,智源中文大模型CPM的核心研发成员,国内大模型研究的主要力量之一,研发AI乌托邦拟人对话交互平台。担任顶级期刊TNNLSTACLCLTBD编委,多次担任自然语言处理领域顶级会议ACL/EMNLP资深领域主席。