大模型的火正以燎原之势从学术界到产业界,再到工业界,引发了广泛的关注和讨论。然而,大模型在工业领域的应用面临着各种挑战,因为工业界并不期待模型突然产生出乎意料的能力,而是希望模型能够稳定运行、整合分散的数据并提高效率。
对于工业生产,探索最佳工艺需要大量的专业知识和经验,对于算法而言,这相当于将工业机理模型这类“黑箱”转化为可量化的数据和指标,从而将主观经验升华为科学且易于使用的工业智能。
目前,国内规模以上工业企业数量超过40万家,覆盖41个工业大类、207个工业中类、666个工业小类,存在大量的场景和业务痛点。工业制造领域应用潜力巨大,数字孪生、工业大脑等规模化生产等工业场景开始逐步成熟落地,将大模型融入进来形成技术底座,也是大家都在探索的方向。
我们曾在文章《在工业领域谈GPT和大模型究竟是不是“扯淡”?当中介绍了业界人士对于将GPT类产品引入工业实现垂直应用的看法。
反对者表示,在大模型应用中经常会遇到一些ChatGPT胡编乱造的“惊喜”,但是工业界不需要“惊喜”,因为很小的故障就可能带来巨大的损失,此外,工业制造细分领域众多,各领域在生产流程、工艺、生产线配置、原材料及产品类型上均具有较大差异,强调的是细分行业的机理融合和行业知识,如果没有海量数据标签,基本上不可能形成类似GPT的大模型。
支持者则表示:生成式AI类产品能够压缩设计和迭代的流程,带来效率的提升,在数据追踪与分析、人机交互方面也具有很好的优势。
北京信息化和工业化融合服务联盟理事长闫同柱接受媒体采访时表示:工业互联网平台下方有终端软件,中间有操作系统,但还缺少一个大脑,大模型可以充当这个大脑。而工业互联网平台沉淀了大量人机料法环测(人员、机器、原料、方法、环境、测量)的数据,也能反过来满足大模型的大数据需求。
卡奥斯COSMOPlat就是这样一个工业互联网平台,拥有几十年工业制造的数据知识图谱和产业know-how,也在工业大脑领域深耕多年,致力于将行业AI落地应用进行广泛落地,是科技部批复建设工业大脑国家新一代人工智能开放创新平台。让我们一起来了解一下卡奥斯COSMOPlat的工业大模型。
卡奥斯工业大模型(COSMO-GPT)由卡奥斯COSMOPlat基于开源LLM自主研发,拥有百亿以上参数并内置了3900多个机理模型、200多个专家算法库,功能范围覆盖智能问答、文本生成、图文识别、控制代码生成、数据库查询、辅助决策、运筹规划等。
COSMO-GPT被赋予了更广博的工业知识和更深度的工业行业Know-how,它能够读懂工业语言、理解工业工艺及机理、生成工业执行指令及执行工业机械控制,目前主要应用于智能柔性装配、生产工艺优化、工业企业智能中台三大领域。将工业互联网当中的需求转化成大模型可生成的能力,从工艺、流程、能源、效率和体验等方面进行优化。
一方面,对于追求精确性的工业而言,工业大脑往往更依赖知识图谱,知识图谱能够准确反映已有的常识、特定领域知识、百科知识以及精确把握多模态的数据,并且在果断性、可解释性、一致性等方面则具有非常明显的优势。另一方面,尽管知识图谱在捕捉结构化数据方面表现出色,对于自然语言理解和非结构化文本则捉襟见肘,对于一些不完整的知识和未见事实也存在缺陷。而大模型却能凭借其常识和泛化性以及超强的自然语言处理与理解能力提升整个系统的可操控性。
通过将大模型的自然语言交互能力、丰富的信息表示能力、图构建能力与知识图谱的可解释性、一致性、信息准确性结合,工业大模型就能比知识图谱更灵活,比大模型更精确。
图源:wisecube
为响应工信部号召,着力推动大模型算法、框架等基础性原创性技术突破,不断推进算力基础设施建设,加快产业自主创新。卡奥斯COSMOPlat将大模型与知识图谱相结合,打造了“卡奥斯BaaS工业大脑”,用于实现工业领域的群体智能决策。通过知识图谱和机理模型等形式的信息,构建了工业大脑平台的“大脑”,为工业企业提供智能化转型的平台底座,解决了千行百业智能化升级的问题。作为卡奥斯COSMOPlat的BaaS引擎的延伸,COSMO-GPT继承了海尔近40年在数字化、信息化、智能化领域的实践经验,为工业设计与研发、机理仿真与数字孪生等领域的应用提供了解决方案。
除了COSMO-GPT外,市面上已经有不少工业大模型:例如,以科大讯飞的星火大模型为模型底座、结合工业场景打造的羚羊工业大模型,具有工业文本生成、工业知识问答、工业理解计算、工业代码生成、工业多模态五大核心能力,可以从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环;也有华为这样的ICT企业完全面向行业提供服务,以行业需求为基准进行设计的盘古大模型,它能够根据不同行业和场景需求,选择合适的基础大模型,利用数据工程套件构建自动化数据清洗模型,持续提升数据质量;还有来自思谋科技这样以视觉能力和智能制造起家,涌入大模型潮流当中的工业多模态大模型IndustryGPT V1.0。在软硬件层面都能够充分利用大模型的交互与智能决策优势。还有相当多企业也投入到大模型的研发和实践当中。
那么,这么多大模型,哪一个才能算是“最懂工业”呢?
这就要看业界的需求和难点是什么,工业生产当中往往存在以下特点:
生产当中的数据保密、呈现碎片化特点,know-how(技术诀窍)不公开;
要素多、流程长,对于人机物协同的要求较高;
高精度、高效率的要求为大模型的建设提高了门槛;
工业界的主要需求在于节能、降碳、增效
制造业致力于数智化转型、努力发展成新一代智造工业也已成为大势所趋,而转型的难点和突破口就是数据和知识。在2023年11月举办的CNCC工业大模型论坛上,中科大李向阳教授在《“数据+知识”驱动的工业智能》报告中指出,“数据+知识”协同驱动是实现数智化转型的突破口,而这也正是COSMO-GPT的典型差异化优势——拥有大量制造业数据以及专家算法、know-how等产业知识。
综合来看,COSMO-GPT具有以下显著优势,使其能够着眼于“最懂工业”的大模型:
制造基因沉淀:
COSMO-GPT基于海尔几十年智能制造经验沉淀,使其融合深度的工业知识与行业know-how,企业只需将工业软件部署在BaaS数字工业操作系统就可完成企业AI转型升级,充分利用大模型这一大脑;
追求工业精度:
通过调用机理模型工具,通过大模型的推理和决策能力,自动生成可精确执行的机器运动控制指令;
模型规模落地:
据悉,该工业大模型已经在注塑、化工等11个行业的产线进行落地实践,助力工厂注塑领域能耗降低30%、良品率提升10%、停机时长降低15%,在产业链剖析部分,COSMO-GPT面对复杂NLP任务处理,能够通过任务分解、行业知识注入、数据特征分析等方案,提升任务准确率达90%以上。
工艺优化提效:
大模型上线后,解决了以洗衣机生产为代表的离散制造业效率低的痛点,实现了工艺设计环节效率提高不小于30%,换产调试环节效率提高不小于50%。
总的来说:工业大模型已经受到产业的广泛关注,不同厂商围绕自身优势均投入此领域。但工业领域自身的复杂性和精度要求,决定了未来“最懂工业”的大模型需要满足什么条件。COSMO-GPT秉承卡奥斯COSMOPlat多年助力制造业数智转型经验,深度融合行业数据和知识,实现精细化生产优化,其融合行业知识和生产数据,以及生成高精度执行指令的能力,正是工业界所追求的。
当前,工业大模型处于起步阶段,各厂商积极探索如何最大限度将大模型技术用于工业。中国工业互联网研究院在近日发布的《AI大模型工业应用现状、模式与展望》指出,工业大模型还存在一定的挑战:应用市场仍以基础大模型为主,下沉到垂类领域的不够多;尚未形成标准化、体系化的大模型工业应用范式;从底层开始训练的大模型具有一定的技术门槛。
随着大模型向B端尤其是工业领域应用已成为行业共识。大模型已呈现出以基础大模型为技术底座,工业应用为切入点的发展趋势,工业大模型概念和落地案例也不断涌现。未来的大模型也将在数据、安全和商业模式方面开启更多落地探索。随着各方共同努力,未来五到十年,相信将见证工业大模型成为智能制造新领域的重要范式,造福更多产业应用。