就在前不久,北京市科委官网发布《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》,这也是ChatGPT引爆AI大模型热潮以来,首份由地方政府出台的与大模型高度相关的政策文件,为各地结合自身情况,探索合适的AI大模型发展路径开了一个好头。
就在前不久,北京市科委官网发布《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》(以下简称《若干措施》),针对加强算力资源统筹供给能力、提升高质量数据要素供给能力、系统布局大模型技术体系持续探索通用人工智能路径、推动通用人工智能技术创新场景应用、探索营造包容审慎监管环境五大方向,提出了21条具体措施。
这也是ChatGPT引爆AI大模型热潮以来,首份由地方政府出台的与大模型高度相关的政策文件,为各地结合自身情况,探索合适的AI大模型发展路径开了一个好头。
《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》的框架结构
5月19日,北京市经信局联合市科委中关村管委会、市发改委进一步共同发布《北京市通用人工智能产业创新伙伴计划》(以下简称《伙伴计划》),对《若干措施》中的若干条目内容进行了细化,进一步明确了大模型发展的重点任务举措。
一、算力资源、数据要素、大模型技术体系凸显作为发展好AI大模型的核心基础
《若干措施》的前三部分内容分别围绕算力资源、数据要素、大模型技术体系展开。三者无疑是实现通用人工智能技术创新场景应用的核心基础,同时也是北京发展好AI大模型的重点和优势所在。
北京作为一个拥有人工智能核心企业1048家、占我国人工智能核心企业总量近三分之一的科技中心,近年来,其人工智能产业发展势头强劲,对智能算力的需求激增,为确保产业的持续健康发展,充分的算力资源不可或缺。同时,北京在人工智能技术能力方面全国领先,系统布局大模型技术体系具有坚实基础,通过锻长板可以进一步巩固已有的优势。除此以外,北京还是我国的政治、经济和文化中心,其在高质量数据要素供给方面具有得天独厚的优势,是使大模型更为智能和做厚做实北京人工智能竞争优势的重要基石。
《伙伴计划》对这三部分内容中的重点作了进一步的展开和细化:
(一)高效启动算力伙伴计划,加强算力供给规模与效率、降低算力成本、提高调度能力
加强算力供给是实施此次计划的重点目标,将算力伙伴位列五类伙伴之一。在第一批成员名单中,公布了2家算力伙伴,分别为阿里云计算有限公司与北京超级云计算中心。
同时,在八项任务中,也有两项与算力有关,分别为“加快满足近期迫切算力需求”与“提升中长期算力供给能力”。加快满足近期迫切算力需求方面,通过与云厂商建立合作,加快归集现有算力,为市场主体提供多元化优质普惠算力,保障北京市大模型团队和AIGC企业产品研发和技术创新。采用用户单位与大模型团队结对方式,对形成场景应用模式或试点案例的北京市大模型团队训练、初创企业行业模型调优及行业应用推理算力,给予10%的财政补贴。探索支持各区重点布局的产业园区、基地按照入驻即享原则,对大模型企业给予算力支持。
提升中长期算力供给能力方面,将加快建设海淀区北京人工智能公共算力和朝阳区北京数字经济算力中心作为重点项目,完善本市算力供给体系。建设北京市公共算力服务平台,汇聚云厂商和本地算力,形成统一服务窗口并实现算力任务调度,提升集约化、规模化、专业化算力能力,以商业化运营为主、政府适度补贴为辅,满足未来5-10年北京市人工智能企业对算力的规模化需求。提高环京地区算力一体化服务能力,形成全国算力网络调度枢纽节点。
除此之外,《伙伴计划》还提出利用高精尖产业发展资金等支持通用人工智能产业发展,推动算力基础设施建设等。
北京市在保障算力资源供给方面,初步形成了以政策撮合、资金支持为抓手,汇聚优质算力供应商,促进上下游低成本、高效率开展算力合作的经验举措。
(二)重视供给高质量训练数据,谋划建设国家级数据训练基地
就《若干措施》中提出的“提升高质量数据要素供给能力”,《伙伴计划》从“推出一批高质量训练数据”和“谋划建设国家级数据训练基地”两方面作出了进一步的响应,明确了重点举措。推出一批高质量训练数据方面,将梳理大模型训练数据需求清单和供给目录,建立数据供需对接机制。基于市大数据中心和北京国际大数据交易所探索建设可用于大模型训练的公共数据专栏和社会数据专区,推动公共数据和社会数据定向有条件开放。发挥在京国家机关、科研院所、企事业单位丰富的数据资源优势,用好北京国际大数据交易所社会数据专区成果及智源研究院中文语料库,形成训练数据的定向供给,对数据提供方给予一定比例的补贴支持。
谋划建设国家级数据训练基地方面,将在数据基础制度先行示范区布局中谋划建设国家级数据训练基地,探索高价值数据共享的版权、安全和激励机制问题,推动形成基于贡献的商业化合作模式。发挥本市从事人工智能训练数据的专业服务商优势,为大模型预训练的各个阶段所需的数据提供数据支撑和技术服务,开发涵盖文本、图像、视频等多模态的高质量数据集,助力国家级数据训练基地建设。支持发展基于AIGC技术的合成数据新产业。
其中提及的“在京国家机关、科研院所、企事业单位丰富的数据资源优势”“北京国际大数据交易所社会数据专区成果及智源研究院中文语料库”是北京在数据要素方面的既有优势;“数据基础制度先行示范区”“国家级数据训练基地”将是北京下一阶段的建设重点,有望形成新的政策环境和基础支撑优势。在数据要素领域,北京的发力点更多,高质量数据来源是其先天优势,叠加政策创新环境、资金支持和技术服务,将使北京在高质量数据要素供给上具备得天独厚的优势,进一步强化域内大模型企业的竞争力。
(三)将软件开发模式创新和芯片架构性能改进作为大模型基础软硬件体系提升的重点
《伙伴计划》针对提升大模型的“基础软硬件体系”提出了明确举措:一是变革软件领域的开发应用模式,利用生成式AI重构企业软件。以开源聚合创新,构建大模型开源社区,吸引科研院所、代码托管平台、开发者及团队在京形成开放、包容、活跃的创新氛围。在基础软件领域引入大模型应用,提升国产操作系统、办公、设计、编程软件性能,丰富信创软件品类。加强工业软件与大模型融合,加快推进智能工业软件开发应用。倡导模型即服务,提升云服务商、集成企业服务水平。鼓励互联网服务迭代升级,推动涌现大模型+互联网新软件新服务。
二是实施大模型底层支撑性技术筑基工程。支持企业加大研发投入,加强互联协议、网络传输、能耗优化等技术研发,提升片间互联速率;构建高速计算集群网络传输系统,提升芯片算力水平及集群表现。以Chiplet技术进步弥补先进工艺技术代差,超前布局先进计算芯片新技术、新架构。开展面向不同芯片架构、不同应用场景的软硬件精准适配攻关,加快不同芯片架构的接口适配、共性算子开发,加速推出基于自主算力的软硬一体化解决方案。
《伙伴计划》从软件开发模式创新和芯片架构性能改进两方面明确了基础软硬件体系提升的重点,下一步将以开源模式和引入大模型应用促进软件开发水平的提升;以超前布局先进计算芯片新技术、新架构,加快不同芯片架构的接口适配、共性算子开发作为提升大模型底层支撑技术的关键。
二、以通用人工智能技术创新场景应用牵引大模型和产业持续快速发展
《伙伴计划》不仅明确了通用人工智能技术创新场景应用的主要任务,还提出了具体的工作目标。
政务服务、金融服务、智慧城市作为三大优先实施大模型应用创新标杆试点工程的领域。围绕首都之窗智能问答、在线导办等场景,依托私有化部署的算力集群资源,逐步开展政务服务行业专有模型训练、精调、剪枝、蒸馏等工作,赋能“12345接诉即办”辅助场景,总结专用模型实施部署经验,探索政务服务大模型服务模式。支持金融机构利用大模型技术打造“全能业务助理”,提升金融从业者的服务半径和服务质量。探索大模型助力智慧城市建设,推动城市大脑等城市管理公共平台开放数据接口引入大模型辅助治理。
同时,点出虚拟数字人、数字医疗、电商零售等创新活跃的数据优势领域,要求加快推进大模型商业化落地应用。支持本市企业在“模型即服务”人工智能产业链中布局,加强垂直领域攻关,实现重点场景应用突破,丰富行业应用生态。在虚拟数字人、数字医疗、电商零售等数据优势领域,加快大模型在文字创造、人机交互、教育、影音等场景的商业化落地应用。加速信息交互领域的数字化转型,变革知识创造行业生产方式,激发持续的数字创新活力,深度赋能千行百业。
在具体量化目标方面,《伙伴计划》明确提出,“每年落地10个以上重点场景商业化标杆应用并形成10个以上行业标杆解决方案,培育一批应用大模型技术实现突破性成长的标杆企业”。政务服务、金融服务、智慧城市、数字医疗、电商零售等领域未来有望结合大模型和数字人等技术,持续打造优秀应用标杆,贡献优质解决方案,引领全国通用人工智能应用发展。
三、争创国家数据基础制度先行先试示范区,在探索包容审慎监管环境的同时,进一步强化产业竞争优势
《若干措施》提出了营造包容审慎监管环境的四点方案。《伙伴计划》中进一步提出在国家相关部委指导和支持下,争创国家数据基础制度先行先试示范区,建立健全鼓励包容创新和审慎监管的环境氛围。
北京在打造先行先试示范区方面经验充足、成效突出。例如,高级别自动驾驶示范区,在一系列政策创新、技术创新的推动下,已连续两年在全国城市智能网联汽车竞争力排名中位列第一;截至2023年3月,示范区内测试企业达19家,入网车辆数量达578辆,累计自动驾驶里程达到1449万公里。国家服务业扩大开放综合示范区和中国(北京)自贸试验区(简称“两区”)建设,累计落地全国突破性政策42项、全国标志性项目61项、向全国复制推广改革创新经验34项;2022年“两区”项目库新增入库项目5794个,同比增长61.7%,带动下全市实际利用外资174.1亿美元,同比增长12.7%,高于全国增速4.7个百分点。
通过争创国家数据基础制度先行先试示范区,一方面将为包容创新和审慎监管作出重要探索,另一方面将打造形成人工智能产业发展新高地,进一步巩固竞争优势。