大模型与通用计算GPU

发布时间：2024-03-25浏览次数：10

报告题目：大模型与通用计算GPU

演讲者: 付轩，沐曦集成电路（上海）有限公司，架构师

时间: 2024年3月29日下午 15:00-16:30

邀请人: 信息学院

地点: 信息学院1A-106

摘要:

在本次活动中，首先介绍GPT大模型的背景知识。探讨GPT的诞生过程，以及其基础结构，包括Transformer架构等关键组件。大家对GPT大模型有一个初步的了解。其次，分几部分分别介绍大模型训练、微调、推理的相关原理，以及各种相关技术，例如：训练集群算力和互联技术，以及相应的硬件需求。这些因素如何影响模型的训练效率和性能。微调过程中如何确保数据的安全和隐私。如何提高模型的推理速度和效率。最后，从软件生态角度，探讨通用计算GPU的重要性。

报告人简介:

付轩，沐曦首席解决方案架构师、标准化负责人，中国计算机协会会员。深耕图像图形、人工智能领域20余年，现负责数据中心通用计算GPU产品建设与推广。沐曦致力于为异构计算提供全栈GPU芯片及解决方案，可广泛应用于智算、智慧城市、云计算、自动驾驶、数字孪生、元宇宙等前沿领域，为数字经济发展提供强大的算力支撑。

导航

大模型与通用计算GPU