9月1日,2022世界人工智能大会(WAIC 2022)正式开幕。1日下午,由深度学习技术及应用国家工程研究中心主办的“AI开源开放与产业智能化高峰论坛”成功举办。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰致开场辞,中国科学院何积丰院士、王怀民院士等多位专家共同探讨AI开源开放的价值,分享AI与不同领域融合创新的实践,为产业智能化建言献策。
王海峰在致辞中提出,大模型的产业模式将是“类台积电”模式。大模型加深度学习平台,贯通AI全产业链,是产业智能化的基座。
当前,作为新一轮科技革命和产业变革的重要驱动力量,人工智能技术呈现出很强的通用性,广泛渗透进经济生产活动的主要环节。大模型是近几年人工智能发展的重要方向,具有效果好、泛化性强、研发流程标准化的特点,进一步增强了人工智能的通用性,为人工智能进一步发展带来了新机遇。
与此同时,大模型研发也面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。
在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?在王海峰看来,具有算法、算力和数据综合优势的企业可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。如此一来,大数据、大算力、大模型能力仅需少数企业操心,千行百业直接应用AI模型即可。
王海峰以台积电、三星等企业为例,进一步阐释大模型的产业模式,可类比芯片行业的代工厂模式。他表示,“芯片制造工艺有很高的技术壁垒,有价格高昂的产线,能够根据客户需求,标准化、自动化地大批量生产芯片,形成规模经济。同理,大模型生产企业在大模型能力、海量数据、大规模算力等方面具有优势,能够根据AI应用方的需求,自动化、标准化地进行多场景多领域的模型生产,当达到一定规模时,即可形成健康、可持续发展的大模型产业模式。”
大模型的开发、训练、推理部署以及产业落地,离不开深度学习平台的支撑。深度学习平台下接芯片,上承应用,相当于智能时代的“操作系统”。大模型加上深度学习平台,可以贯通从硬件适配、模型训练、推理部署,到场景应用的AI全产业链。
大模型的“类台积电”产业模式,已经在百度的大模型实践中得到验证。
百度研制了文心产业级知识增强大模型系列,包括以鹏城-百度·文心为代表的基础通用大模型、生物计算领域大模型,以及能源、金融和航天行业大模型等,还包括辅助大模型适配场景应用的工具和平台,探索生态共建的创意社区旸谷等。百度文心大模型也作为今年WAIC “八大镇馆之宝”之一,在展区硬核亮相。
文心系列大模型的成功研制和应用,背后是基于飞桨的有力支撑。飞桨作为我国首个自主研发、开源开放的产业级深度学习平台,集核心框架、产业级模型库、开发套件和工具组件,以及学习和实训社区于一体,标准化、自动化地支撑大模型生产和应用。
在大模型训练方面,飞桨研发了端到端自适应分布式训练技术,根据模型特性和算力平台特性,自动选择并行策略,实现端到端极致的性能优化。
在大模型推理方面,飞桨打造了针对大模型的压缩、推理、服务化全流程部署方案,能广泛支持不同种类的模型结构,实现高速推理。同时,飞桨还提供自动模型压缩工具,帮助节约算力资源。
文心大模型基于飞桨平台开源开放,共建生态,累计已有超过1万开发者,基于文心大模型,创建了3万多个任务。目前,文心大模型已广泛应用于百度产品,显著提升产品效果和研发效率,并应用于金融、能源、医疗、制造、企业服务等领域,大模型的生态初现峥嵘。
“大模型的产业模式将是‘类台积电’模式。大模型加上深度学习平台,贯通AI全产业链,是产业智能化的基座。”王海峰最后总结。