大模型与通用计算GPU

发布时间:2024-03-25浏览次数:10

报告题目:大模型与通用计算GPU

演讲者付轩,沐曦集成电路(上海)有限公司,架构师

时间:  2024年3月29日下午 15:00-16:30

邀请人:   信息学院

地点:      信息学院1A-106

   

摘要:  


在本次活动中,首先介绍GPT大模型的背景知识。探讨GPT的诞生过程,以及其基础结构,包括Transformer架构等关键组件。大家对GPT大模型有一个初步的了解。其次,分几部分分别介绍大模型训练、微调、推理的相关原理,以及各种相关技术,例如:训练集群算力和互联技术,以及相应的硬件需求。这些因素如何影响模型的训练效率和性能。微调过程中如何确保数据的安全和隐私。如何提高模型的推理速度和效率。最后,从软件生态角度,探讨通用计算GPU的重要性。





报告人简介:

付轩,沐曦首席解决方案架构师、标准化负责人,中国计算机协会会员。深耕图像图形、人工智能领域20余年,现负责数据中心通用计算GPU产品建设与推广。沐曦致力于为异构计算提供全栈GPU芯片及解决方案,可广泛应用于智算、智慧城市、云计算、自动驾驶、数字孪生、元宇宙等前沿领域,为数字经济发展提供强大的算力支撑。