从工程化的角度，对鹏城.脑海大模型训练语料处理、模型训练优化、模型应用等方面做出了全面详细的经验分享。

我们有幸邀请到了鹏城实验室高效能云计算所算法工程师陶恒韬老师来进行鹏城.脑海大模型训练过程的讲解。在课程中，陶老师从工程化的角度，对鹏城.脑海大模型训练语料处理、模型训练优化、模型应用等方面做出了全面详细的经验分享。

鹏城.脑海大模型介绍

鹏城脑海（PengCheng Mind）大模型计划：旨在打造自然语言预训练大模型底座，将实现2000亿参数稠密型AI大模型

鹏城脑海大模型：

训练语料处理和使用

语料清洗工程化：收集数据——格式预处理——数据清洗——脱敏过滤——样本间和样本内去重——数据集质量评估

模型结构：Transformer Decoder only，延续GPT-175B模型结构，并在其基础上进行了相应拓展

训练策略：对比PanGu-，重构训练策略，采用数据+模型+流水线+优化器并行

分布式并行配置：机柜之间的带宽

大集群+大模型训练的稳定性保障

鹏城脑海模型全流程开发：数据预处理—模型预训练—微调（SFT）–对齐（RLHF）–模型部署—模型应用

下周六（2024年1月20日）我们即将迎来国产开源大语言模型另一位重磅玩家——CPM-Bee中英文双语基座大模型。在下节课程中，我们非常荣幸地邀请到了OpenBMB开源社区技术负责人、清华大学硕士，同时也是CPM-Bee开源搭模型项目主要维护者龚柏涛老师来进行CPM-Bee模型的讲解。

这里我们稍稍剧透下课程内容，各位小伙伴1月20日 14：00-15：30不见不散！

昇思MindSpore技术公开课大模型专题第二期课程火爆来袭！未报名的小伙伴抓紧时间参与课程，并同步加入课程群，有免费丰富的课程资源在等着你。课程同步赋能华为ICT大赛2023-2024，助力各位选手取得理想成绩！

戳我立即了解课程

点击关注，第一时间了解华为云新鲜技术~

服务器托管，北京服务器托管，服务器租用 http://www.fwqtg.net