大模型与芯片的结合与优化

发布时间：2024-11-20浏览次数：10

演讲者: Edward，思朗科技，创新业务部负责人

时间: 2024年11月22日下午 15:00-16:30

邀请人: 信息学院

地点: 信息学院 1A-106

摘要:

自2022年末OpenAI发布ChatGPT以来，大模型技术浪潮席卷全球，随后其影响力在国内显著增强，底层架构的革新与微调、推理应用的多样化均展现出蓬勃发展的强劲势头。然而同时，美国商务部对英伟达H100/A100芯片的禁售决策，为国内技术生态的稳健前行设置了障碍，迫使国内加快高性能芯片的自主化进程。在此背景下，如何巧妙融合大模型与芯片能力，成为业界关注的焦点，这需要精心规划算力配置、深度优化带宽利用，并全面审视端到端问题，制定详尽的应对策略与优化方案，以在挑战中开辟前行之路，推动技术创新的持续深化。

报告人简介:

Edward曾担任国内某头部初创GPU公司：
1. 深度学习框架PyTorch/TensorFlow负责人,曾负责带领跨团队开发与优化上百个深度学习模型
2. 大模型项目负责人,带领跨百人团队达成公司第一个端到端大模型极致性能优化且落地

导航

大模型与芯片的结合与优化