大语言模型的关键研究问题

发布时间：2023-10-07浏览次数：443

演讲者: 黄民烈教授，清华大学

时间: 2023年10月10日上午 9:30-10:30

邀请人: 郑杰

地点: 信息学院 1C 101

摘要:

以ChatGPT、GPT-4为代表的大语言模型在智能水平上取得了前所未有的突破，这些模型在问答、写作、推理、数学等各种任务上都实现了令人惊讶的能力。通用人工智能似乎离我们越来越近。但这些统计概率模型也依然面临一定的局限性，包括信息的可信度不足，精确计算与符号推理能力弱，安全性面临一定的风险，对模型能力的评估缺少统一标准等。讲者将围绕他在大模型研究中的思考，分享大模型在可信度、符号计算、安全性等方面的关键研究问题。

报告人简介:

黄民烈，清华大学长聘教授，博士生导师，国家杰青获得者，计算机系智能技术与系统实验室副主任，清华大学基础模型中心副主任，自然语言生成与智能写作专委会副主任、CCF学术工委秘书长。他的研究领域为大规模语言模型、对话系统、语言生成，著有《现代自然语言生成》一书。承担国家自然科学基金重点项目、面上项目、青年基金多项，多次参与国家重大研发计划项目。曾获得中国人工智能学会吴文俊人工智能科技进步奖一等奖（第一完成人），中文信息学会汉王青年创新奖，微软合作研究奖等。在国际顶级会议和期刊发表论文150多篇，谷歌学术引用16000多次，h-index 62，入选2022年Elsevier中国高被引学者，连续三年入选AI 2000全球最有影响力AI学者榜单；多次获得国际主流会议的最佳论文或提名（IJCAI、ACL、SIGDIAL等）。研发任务型对话系统平台ConvLab、ConvLab2，中文对话大模型EVA、OPD、CharacterGLM，智源中文大模型CPM的核心研发成员，国内大模型研究的主要力量之一，研发AI乌托邦拟人对话交互平台。担任顶级期刊TNNLS、TACL、CL、TBD编委，多次担任自然语言处理领域顶级会议ACL/EMNLP资深领域主席。

导航

大语言模型的关键研究问题