央企布局大模型:向新而生,落地而行
作者 | 国资报告2023-09-14

ChatGPT的起步枪打响之后,2023年,大型语言模型(LargeLanguage Models,LLMs)开始了“百模大战”。接着,《生成式人工智能服务管理暂行办法》(以下简称《办法》)出台,旨在维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。自此,大模型发展迈入了崭新阶段。

这半年多来,百度的“文心一言”、阿里的“通义千问”、华为的“盘古”、商汤的“书生”、 科大讯飞的“星火”、360的“SEEChat”集体进入大模型竞技场,中国联通的“鸿湖”、中国移动的“九天”、中国电信的“TeleChat”、中国电科的“小可”等央企系大模型也纷纷入局。

面向人工智能和产业发展的新融合,中国工程院院士邬贺铨指出,要将大模型切实投入到城市发展、工业制造等领域,需要专业的企业和组织加速其在实体产业落地,为产业刚需带来实实在在的价值。

怎样落地、落于何地、价值几何?多位受访者认为,大模型落地是央企的优势,也是责任,更是机遇。

我们了解到,国资央企发挥各自所长,挖掘场景所需,探索形成“大模型研发—应用—合作”的方法路径,构建良性生态。同时,冷静研判并应对人工智能发展带来的风险及挑战,创造出中国特色的“大模型—人工智能技术体系”,成为大模型落地的“新势力”,为中国智能社会的变迁带来央企“加速度”。

01

大模型迎来落地挑战

在热情和争议声中,大型语言模型成为了人工智能产业发展的一幕生动侧写。

从20世纪80年代末发展至今日,大模型成功破解了语言的复杂密码,不仅在学习上下文和逻辑时完成推演创造,还能微调以适应不同任务,或成为经济发展的新支点。麦肯锡《生成式人工智能的经济潜力》报告中显示,大模型驱动下的生成式人工智能,将为全球经济带来11万亿—17.7万亿美元经济价值,使全球GDP增加15%—40%。

在2023世界人工智能大会现场,我们看到大模型展区人声鼎沸,30余款基础大模型、垂直大模型争相亮相,从不同赛道切入市场。

“在中国,广告营销、直播短视频、客服、基础性专业咨询、智能车出行服务存在快速切入空间。能源、金融、地产、政务、医疗等产业大模型的商业空间潜力巨大。服务机器人、工业机器人、AR眼镜等具有快速增长的蓝海市场趋势。”商汤智能产业研究院院长田丰在采访中表示。

从有量到有用,大模型产品的落地拐点已至。按照2022年度Gartner魔力象限技术成熟度曲线,基础大模型已经从实验室中走入产业,被数亿人使用、全民所认知,正处于炒作周期的顶点。顶峰显现,投资涌入,产业价值迎来了返璞归真、接受实际产业难题的挑战时期。适应产业者生存,无法商业变现者将被淘汰或边缘化。

图片

大模型如何适应产业?当我们询问“大模型如何助力战略性新兴产业发展?”商汤商量大模型给出了如下答案(节选):

“首先,大模型能够通过对海量数据的分析和挖掘,提供更加精准的市场预测和分析,提高战略规划和决策的科学性和准确性。其次,大模型可以应用于新产品研发、生产制造、供应链管理等领域,提高生产效率和质量,降低成本。此外,大模型还可以应用于智慧城市、智能交通等领域,推动新兴产业和传统产业的深度融合。”

但无法回避的是,对于大模型的研发和落地,业内存在多重争议:能耗浪费、伦理道德、评估验证。央企作为大模型“国家队”,能够成为行业争议的解决者,以及大模型体系的建设者。

首先,“百模大战”热潮的背后,存在算力浪费现象。有的地方开始自建超大规模数据中心,当智算的需求上来了,国家算力网络建设也将随之调整。

对此,许多业内人士呼吁,从基础设施建设到研发、应用,需要国家和重点企业来统筹引导,避免资源空耗。同时,央企发挥各自或算力,或应用的优势,分类合作推进。

其次,如何持续完善央企人工智能伦理风险治理体系?田丰提出,要重点针对AI模型风险、数据风险、技术设施风险、业务流程风险、法律合规风险等,建立社会主义核心价值观/国家市场秩序核心原则、科技伦理委员会、风险识别体系、风险改进流程、AI安全自动化审核平台。

针对央企大模型的统筹建设和评估验证,国网数科控股公司数字技术研究院(双创中心)运营总监张宾强调,在“一”字上下功夫,打造“一个引擎、一套标准、一支队伍”。

“央企是各行各业的领军者,央企有责任、有能力牵头组织好行业大模型应用的标准和规范。”国投集团特级专家、美亚柏科AI研发中心总经理赵建强说。

为了对国内外大模型有效评测分析,7月17日,中国移动研究院联合知名高校、科研机构和头部企业联合发布了《“弈衡”通用大模型评测体系白皮书》,这是行业中首个大模型评测领域白皮书,创新提出“2—4—6”的“弈衡”通用大模型评测体系。该体系将评估场景划分为基础任务和应用任务,明确四项主要评测要素,并制定涵盖六大维度的50余个评测指标。揭示大模型在应用中的固有问题,客观反映各模型在准确性、可靠性以及安全性等方面的差异,为大模型的评测实践和产业应用提供指导。

02

央企的大模型工具箱

从目前发展情况来看,央企大模型的类型有两种,第一种是通信类央企从算力和数据出发,以通用大模型赋能千行百业。第二种是其他行业的央企从场景数据出发,以行业大模型反哺自身业务。

“央企的责任在于,用技术上自主可控、内容生成上符合中国特色社会主义核心价值观、赋能内外部应用、提前规避各类风险来填平落地的鸿沟。”中国电信大数据和AI中心/数字智能科技分公司产品和解决方案中心总经理刘翼对记者说。

央企具有丰厚的行业数据积累、行业知识与专家资源、AIDC算力技术设施投资建设潜力、相对成熟的AI安全治理体系和投融资渠道,能够承担自研之责和桥梁之责,促进大模型的价值实现。

“央企正在积极探索大模型的商业模式。”刘翼继续说,产品形态一是众所周知的行业大模型;二是搭建大模型的开发和训练平台,让其他大模型来训练研发;三是大模型的软硬一体化产品,即提供“算力+大模型+大模型开发服务+场景”工具箱。

如果大模型是汽车,算力就是发动机。多年来,通信类央企已经储备了强大的算力能力,一系列大模型产品于今年夏天接连发布。记者采访发现,4家通信类央企的大模型技术扎实、基座稳定。

6月28日,中国联通发布图文大模型“鸿湖图文大模型1.0”,可实现以文生图、视频剪辑、以图生图等功能。据了解,“鸿湖图文大模型1.0”立足文旅产业的真实需求和年轻用户群的增值业务场景,主打国风水墨画生成。该大模型已成功赋能文旅数字人的建设,实现了降本增效。

立足社会主义核心价值观的大模型“TeleChat”于7月2日发布。中国电信数字智能科技分公司依托电信云网融合优势,利用自研技术增强大模型的预训练和推理能力,赋能数据中台、智能客服和智慧政务。“超过20家官媒内容、10G+的文本的训练,加上针对敏感关键词打标签,共同保证TeleChat回答的价值观正确。”刘翼说。

实践中,还有政务客服双覆盖的“九天”。早在2013年,中国移动就成立了“九天”团队,攻关智能客服和智能大数据分析等应用。近半年,“九天”团队在基础大模型的结构设计、数据构建、并行策略、推理加速等方面开展技术攻关,并于7月9日发布“九天·海算政务大模型”,首创政务大模型—信息场—应用端到端政务服务体系,满足动态管理、公文写作等需求,并可以为人工客服提供回复建议。

中国移动集团高级首席科学家、人工智能与智慧运营中心总经理冯俊兰介绍说,政务大模型基于中国移动积累的丰富数字政府建设经验,目标是助力政府为百姓提供更加便捷和智能的政务服务,提升政府社会治理的智能化水平。客服大模型则是基于9.83亿移动客户、2.53亿家庭宽带客户、将近2500万的政企客户以及云客服等产品服务的企业,所积累的大量客服经验而构建。

有解决工作效率难题的“小可”。为解决重复性工作繁多、基于个人经验决策不够科学、工作效率不高等痛点,6月9日,中国电科旗下电科太极发布大模型“小可”,旨在帮助党政企用户智能化开展业务。目前已推出拟文助手、编码助手、智能标绘等一系列智能应用,可满足降本增效、流程优化和工作创新等需求。

“用来训练大模型的除开放数据外,还有行业专用数据、政府政策数据、代码库数据和开发知识数据。”杨军表示,电科太极将持续在内容安全、数据安全、系统安全、算法安全等方面提升大模型安全性。

通过收集数据或用公开数据为大模型构建“训练场”相对简单,但想要为之注入产业能力,高质量数据和高质量的行业专业知识是一大关键。这正是央企另一大优势:基于数据和场景深耕行业大模型,并形成方法论。

“研发大模型是顺理成章,水到渠成的过程,”赵建强说,“在既有的数据、算法和人才积累上,当前大模型是在为之前的产品积累做技术迭代。”

国投下属美亚柏科的人工智能探索始于2017年。美亚柏科依靠20年积累形成的丰富行业知识和合规数据,于6月28日发布国内首个公共安全大模型“天擎”,其已具备警务意图识别、警务情报分析、案情推理等业务理解能力。如此,便可告别取证环节的繁复业务系统和操作,办案人员只需输入一条指令,就能将相关人员的涉案线索一站式呈现,并自主得出研判结论,大幅提高办案效率和研判的准确率。

再如,国网数科对大模型的应用与探索,更关注于模型服务化、工程化能力以及生态的打造,构建了基于“大模型+小模型”的电力大模型引擎,提供平台化的模型服务,减少重复训练和重复创新,串联了不同场景的业务知识和需求。

“聚焦源网荷储和供应链两类模型的训练和服务化应用,有所为有所不为。”国网数科控股公司数字技术研究院(双创中心)运营总监张宾向记者介绍道,依托电力大模型引擎,国网数科还为公司内兄弟单位提供模型微调、训练、发布等技术服务,提高公司大模型生产、引用效率。

7月5日,南方电网人工智能科技有限公司上线全国产电力行业百亿参数规模大模型,为南方电网输配电、电力调度、市场营销、安监、综合管理等业务提供了解决方案。据了解,整体流程除训练微调之外,还使用强化学习评价模型迭代微调,推动智能客服、生产和安监等业务域落地,已形成从研发到应用场地落地的方法论。

“南方电网以高智慧产品和解决方案为导向,在垂直领域发力。”在采访中,南方电网人工智能科技有限公司副总经理、南方电网公司高级技术专家梁寿愚表示,将针对智能客服场景完成二次训练,实现智能机器人、智能客服助手、智能质检、智能外呼、智能知识库等功能。预计2023年底,高频业务实现“机器代人”的比例将由60%提高到80%。

03

共建生态服务产业刚需

不同于其他行业的正面竞争,央企和民企自进入大模型之始,就带着彼此互补的基因。

学界认为,大模型耗尽高质量的自然语言数据的时间,可能在2026年。加之由人类原生的数据会更加稀缺,以后只能依靠在新的场景里带出增量的数据飞轮,持续投喂模型。

此时,生态合作成为了一道必答题,产业刚需是出题人,行业大模型是答题者。实践中,央企发挥产业链“扁担作用”,升级人工智能产业合作生态,形成面向经济社会各领域的赋能辐射圈,已经取得了一系列深度融合成果。

山东能源创新矿山AI开发模式,将盘古人工智能矿山大模型应用在矿山一线,充分展现出了商用价值。比如,钻孔卸压是防治冲击地压的主要手段,引入AI大模型视觉识别技术来分析卸压钻孔施工质量、辅助验证工程规范性,可以减少82%的人工审核工作量,将3天的防冲卸压施工监管流程缩短至10分钟内,并且做到验收率100%。

6月14日,中国石化与百度签署战略合作框架协议,在行业人工智能基础设施建设、互联网新业态、数字化转型升级与大模型等新技术创新、智慧营销等方面合作建设,探索利用AIGC、数字人等技术,助力打造中国石化智慧传媒平台。

目前,南方电网正在研发模型即服务(MaaS)的电力场景化人工智能平台,提供电力系统模型训练、数据集发布和举办大赛等服务。通过开放平台、发放一定数量代金券给生态方、进一步完成几十个场景落地三个步骤,完成生态构建路径规划,实现从平台开放到规模化活跃用户的转变。

类似的案例还有很多。6月9日,中核集团中核装备院和滴普科技联合成立“大模型数据智能实验室”,以AIGC大模型数据智能化关键技术为牵引,打造数据引擎、训练微调引擎、评测引擎,推进以核工业领域大模型技术为核心的解决方案。

7月13日,华润燃气与腾讯云签署合作协议,探索AI大模型在燃气行业的深度应用,深耕分布式计算、连接和客户运营等领域。

中兴通讯以DPU为中心,构建了软硬协同新型算网基础设施,实现了GPU算力的聚合,最大程度地提升了GPU集群的算力。据了解,中兴通讯计划于今年底推出支持大带宽的ChatGPT的GPU服务器。

为了提高企业运营效率和管理能力,7月27日,用友发布企业服务大模型,结合了财税、人力、供应链领域的专业知识和数据优势,预期将用在十大领域。“企业服务大模型是理解工具,可以提高国企数智化服务工具的使用率和适用面。”用友网络CTO樊冠军认为,由于缺少人机协同,企业对ERP(企业资源规划)功能的使用效果只发挥到了30%,大模型会使ERP的使用率提高到70%。

关于大模型合作生态的未来情景,中国国际经济交流中心副理事长、世界经济论坛基金董事会成员朱民有两种预测:一是由多个大模型基础设施公司,为上游应用提供API(应用程序接口)和模型服务,上游应用公司只需要专注于开发产品逻辑。二是AI公司多为垂直公司,每个公司都根据自身需要研发底层大模型,为自身应用提供技术支持。

中国大模型产品化经验不足、研发同质化等问题,将使市场竞争变得趋于内卷。

许多从业者提出,重复开发并非上策,央企要厘清自身的优势和特色,以及大模型的差异化建设重点,进行长板合作。

“未来将会看到‘央企+AI基础科研’的组合落地模式。”田丰认为,应对之道是准确选择基础科研实力雄厚、产业化解题能力强、创新迭代速度快的AI战略伙伴,共研行业基础大模型、共建AI伦理治理体系、共创行业AI新应用与商业新模式。应对瓶颈迎接人工智能新未来 有专家指出,不要高估大模型的现在,也不能低估大模型的未来。大模型未来的成功,取决于技术、产品、产业能否齐头并进。

技术层面,需要解决的瓶颈来自安全、数据、算法和算力等方面。

首先,隐私和安全是从业者担忧的焦点。“在进行海量行业数据学习时,隐私数据要非常妥善地处理。”赵建强说,“对于人工智能本身的安全。要遵循《办法》的条款,确保模型本身的可信、可靠。”

自2023年8月15日起施行的《生成式人工智能服务管理暂行办法》,提出了包容审慎、分类分级的监管方法,国家坚持发展和安全并重、创新和依法治理相结合的原则,从算法设计与备案,训练数据处理活动和数据标注,用户隐私、商业秘密的保护,防沉迷等方面作出了指引。

其次,数据质量不够高,数据资源存在分散现象。据张宾介绍,数据“投毒”等安全问题不容忽视,不仅影响数据质量,甚至会出现误导。而且,大模型的训练成本居高不下,算力资源缺乏且分布不均匀。

因此,“数据方面,亟须统筹建设高质量数据集并建立数据流通共享机制。国产智算芯片等基础软硬件较为薄弱,亟须大力推进人工智能新型基础设施建设带动国产化加快发展。”冯俊兰建议。

模型算法层面,存在可解释性问题、算法偏见问题、技术依赖和风险集中问题。

对此,受访者提出,要解释黑盒算法的决策过程,重视算法的公平性和透明度,确保训练数据的多样性和代表性,并对算法审查监督,防止偏见。

对此,梁寿愚认为:“不能过于依赖特定的技术专家,应积极培养内部技术团队,与多个技术供应商建立合作关系,降低技术依赖风险。”

当技术问题逐步解决,产品应用将迈向新的阶段。有观点称,今年的大模型热过去后,会有2—3年的沉降期,5—10年逐步回升,回升的速度和高度,取决于行业商业模式的可行程度。

中国信息通信研究院发布的《人工智能白皮书(2022年)》显示,预计到2023年,我国人工智能产业规模将超过8000亿元。“人工智能将以解决人类刚需而更深刻地载入史册。”语音及语言信息处理国家工程研究中心主任 、科大讯飞董事长刘庆峰认为认知大模型建设需要确保应用成效、确保自主可控、确保科学评估。可以预见,以大模型为代表的通用人工智能离人们越来越近,被定义为“新基建之智”的人工智能服务,会像今日的水电、通信服务一样便捷、普适、安全、低成本,真正“飞入寻常百姓家”。

埃森哲在其AI成熟度报告中表示,2024年,科技等行业的人工智能成熟度领先优势会减弱。比如,汽车公司的自动驾驶汽车销量将大幅增长,航空航天公司将建设人工智能远程系统,生命科学行业将推进人工智能在线高效药物开发。

对于各行各业来说,这都是一个巨大的机会。“人类已经从云原生走向了智原生时代。”樊冠军说,AI将在四大方面精准服务企业运营:智能业务运营、人机交互、知识生成和应用生成。

面对大模型的市场竞逐和新技术热潮,大模型“国家队”坚持自主创新,久久为功。当谈及新的时代需要新的智能服务运营范式,冯俊兰称:“创新运营供给模式,实现全场景全要素能力运营与供给。创新业务赋能模式,实现从X+AI向AI+X的根本性变革。创新产业合作模式,实现向体系化协同创新转变。”

没有关键词
热门文章
华为徐直军:建议大规模使用国产芯片在9月15日举行的2023世界计算大会上,华为技术有限公司副董事长、轮值董事长徐直军在一场演讲中透露了当下华为计算战略的最新进展以及对中国AI计算产业生态发展方向的判
2023-09-14
X