百度CTO王海峰首次提出大模型“类台积电”产业模式

9月1日，2022世界人工智能大会（WAIC 2022）正式开幕。1日下午，由深度学习技术及应用国家工程研究中心主办的“AI开源开放与产业智能化高峰论坛”成功举办。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰致开场辞，中国科学院何积丰院士、王怀民院士等多位专家共同探讨AI开源开放的价值，分享AI与不同领域融合创新的实践，为产业智能化建言献策。

王海峰在致辞中提出，大模型的产业模式将是“类台积电”模式。大模型加深度学习平台，贯通AI全产业链，是产业智能化的基座。

当前，作为新一轮科技革命和产业变革的重要驱动力量，人工智能技术呈现出很强的通用性，广泛渗透进经济生产活动的主要环节。大模型是近几年人工智能发展的重要方向，具有效果好、泛化性强、研发流程标准化的特点，进一步增强了人工智能的通用性，为人工智能进一步发展带来了新机遇。

与此同时，大模型研发也面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。

在这样的背景下，如何加速大模型的产业落地，让大模型发挥更大价值？在王海峰看来，具有算法、算力和数据综合优势的企业可以将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务。如此一来，大数据、大算力、大模型能力仅需少数企业操心，千行百业直接应用AI模型即可。

王海峰以台积电、三星等企业为例，进一步阐释大模型的产业模式，可类比芯片行业的代工厂模式。他表示，“芯片制造工艺有很高的技术壁垒，有价格高昂的产线，能够根据客户需求，标准化、自动化地大批量生产芯片，形成规模经济。同理，大模型生产企业在大模型能力、海量数据、大规模算力等方面具有优势，能够根据AI应用方的需求，自动化、标准化地进行多场景多领域的模型生产，当达到一定规模时，即可形成健康、可持续发展的大模型产业模式。”

大模型的开发、训练、推理部署以及产业落地，离不开深度学习平台的支撑。深度学习平台下接芯片，上承应用，相当于智能时代的“操作系统”。大模型加上深度学习平台，可以贯通从硬件适配、模型训练、推理部署，到场景应用的AI全产业链。

大模型的“类台积电”产业模式，已经在百度的大模型实践中得到验证。

百度研制了文心产业级知识增强大模型系列，包括以鹏城-百度·文心为代表的基础通用大模型、生物计算领域大模型，以及能源、金融和航天行业大模型等，还包括辅助大模型适配场景应用的工具和平台，探索生态共建的创意社区旸谷等。百度文心大模型也作为今年WAIC “八大镇馆之宝”之一，在展区硬核亮相。

文心全景图

文心系列大模型的成功研制和应用，背后是基于飞桨的有力支撑。飞桨作为我国首个自主研发、开源开放的产业级深度学习平台，集核心框架、产业级模型库、开发套件和工具组件，以及学习和实训社区于一体，标准化、自动化地支撑大模型生产和应用。

在大模型训练方面，飞桨研发了端到端自适应分布式训练技术，根据模型特性和算力平台特性，自动选择并行策略，实现端到端极致的性能优化。

在大模型推理方面，飞桨打造了针对大模型的压缩、推理、服务化全流程部署方案，能广泛支持不同种类的模型结构，实现高速推理。同时，飞桨还提供自动模型压缩工具，帮助节约算力资源。

文心大模型基于飞桨平台开源开放，共建生态，累计已有超过1万开发者，基于文心大模型，创建了3万多个任务。目前，文心大模型已广泛应用于百度产品，显著提升产品效果和研发效率，并应用于金融、能源、医疗、制造、企业服务等领域，大模型的生态初现峥嵘。

“大模型的产业模式将是‘类台积电’模式。大模型加上深度学习平台，贯通AI全产业链，是产业智能化的基座。”王海峰最后总结。