近年来,我国数字经济快速发展,数字基础设施全球领先,数字技术和产业体系日臻完善,为更好发挥数据要素作用奠定了坚实基础。据统计,2022年,我国数字经济规模达到50.2 万亿元,同比名义增长 10.3%,已连续 11 年显著高于同期 GDP 名义增速,数字经济占 GDP 比重达到 41.5%,这一比重相当于第二产业占国民经济的比重。与此同时,也存在场景释放不够、数据供给不足、流通机制不畅等问题,通过实施“数据要素×”行动,能够发挥我国海量数据规模和丰富应用场景优势,推动数据在不同场景中发挥千姿百态的乘数效应,促进我国数据基础资源优势转化为经济发展新优势。 本文将从互联网+与数据要素x的对比、数据要素多年来发展状况以及相关政策与发展动力进行探讨。重点关注落实《“数据要素×”三年行动计划(2024—2026年)》的目标路径及发展趋势,希望能够为关注相关行业的朋友提供参考。 大数据相当于数据要素的一个前身概念。 2014年,大数据首次写入政府工作报告当中,2014年,广东省率先建立了中国第一个大数据管理机构——大数据管理局。此后沈阳、广州、成都也先后成立大数据管理机构。2018年10月,各省市就开始纷纷挂牌大数据局,浙江、山东、贵州等多个省市均成立了大数据局等大数据管理机构。 2019年,国家十九届四中全会首次提出将数据与土地、劳动、资本、知识、技术、管理并列为按贡献参与分配的第七大生产要素。随后,《关于构建数据基础制度更好发挥数据要素作用的意见》(俗称“数据二十条”)这一重要文件发布,引起了社会的广泛关注。“数据二十条”是我国数据要素行业发展的顶层制度文件,确立了行业发展的基础制度,创新数据产权观念,淡化所有权、强调使用权,聚焦数据使用权流通,创造性提出“三权分置”的数据产权制度框架,构建中国特色数据产权制度体系。 2023年10月25日,国家数据局正式挂牌,由国家发展改革委管理,响应《党和国家机构改革方案》,各省市也紧跟步伐,江苏省数据局、四川省数据局、内蒙古自治区政务服务与数据管理局、上海市数据局、云南省数据局、青海省数据局、河北省数据和政务服务局以及广东省政务服务和数据管理局、湖北省数据局等陆续揭牌成立。“数据局”揭牌不断登上新闻。 党的十八大以来,党中央高度重视发展数字经济,实施网络强国战略和国家大数据战略,将发展数字经济上升为国家战略。2015年,国务院印发《关于积极推进“互联网+”行动的指导意见》,大力拓展互联网与经济社会各领域融合的广度和深度。 《指导意见》围绕转型升级任务迫切、融合创新特点明显、人民群众最关心的领域,提出了11个具体行动,涉及的领域分别是:创业创新、协同制造、现代农业、智慧能源、普惠金融、益民服务、高效物流、电子商务、便捷交通、绿色生态、人工智能。 《“数据要素×”三年行动计划(2024—2026年)》的颁布,同样也提到了十多个领域:智能制造、智慧农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、智慧城市、绿色低碳等。 两份文件除了在推动的产业方向上相近之外,都多次提到了“融合”。一则是推动互联网与各个产业融合发展、创新发展;一则是将数据进行融合应用,提升数据复用能力,延长拓宽数据使用价值链。 “互联网+”和“数据要素×”本质上都是数字技术和经济社会的深度融合和双向赋能,路径或是“+”,或是“×”。那么,为什么互联网是“+”、数据要素是“×”呢? 国家数据局给出的答案是:数据要素的乘数效应通过协同优化、复用增效和融合创新三种作用机理得以实现,在深度和广度上都是对“互联网+”的拓展。 数据要素并不是单一的赋能“+”,而是能够发挥“乘数效应”。“数据要素×”是数据融入生产、分配、流通、消费和社会服务管理等各环节,通过与不同要素结合,作用于不同主体,发挥协同、复用和融合作用,对其他生产要素、服务效能和经济总量产生扩张效应,提升效率、释放价值和创新发展,助推构建以数据为关键要素的数字经济。 中国工业经济学会会长、中国社会科学院大学教授江小涓认为,数据要素有多个经济学角度的特点,比如多主体生产、多场景使用、敏感信息多、减损贬值快、可交易与交互,但最重要的还是多场景复用的能力,一组数据可以多次复用,所以才能不断挖掘出新的价值。 在这个社会当中,从个人到企业、组织、事业单位甚至是一个国家,时刻都在生产数据。 随着数字中国、数实融合的发展,一些单位和组织已经积累了大量数据,融入到智慧城市、智能制造的生产线当中,工业领域的know-how也大量生成。对于一些脱敏的公共数据,也可以在国家相关部门的网站进行查询,截至2022年底,全国333个地级行政区中建成公共数据开放平台的地区占比已达58%。 关于数据相关的产业链,可以根据不同的类型分为数据源、交易层、应用层、技术层、硬件支持等。 以数据为生产经营关键要素的企业,就称为数商,包括服务型、应用型和技术型数商。上海市数交所研究统计显示,自2013年至2023年,中国数商企业数量从约11万家增长到超过100万家。在2023全球数商大会上,国家数据局局长刘烈宏指出,服务型数商是数据流通的“推进者”,促进数据动起来;应用型数商是数据价值的“转化者”,促进数据用起来;技术型数商是数据资源的“开发者”,促进数据聚起来。 顶层政策的持续落地,能够推动行业健康发展,数据要素市场也将在相应的政策指导下开始创新。数据交易所作为各区域的平台,为场内数据交易提供保障和运营服务。 而数据要素化业务与传统数字化业务还有一部分区别:服务市场环节从此前对政企内部的数据治理流通转向外部数据流通与开发应用;对于数商的数字化服务能力也提出了更高的要求,除了此前的数字化业务,还要有数据经济、产品开发、资产管理和评估等配套能力。 另外,数据要素也在影响与之相关的产业,例如人工智能。 2022年,人工智能领域的代表人物吴恩达接受IEEE Spectrum采访时表示:“以数据为中心的人工智能”是一个系统的学科,旨在将关注点放在构建AI系统所需的数据上。对于AI系统,用代码实现算法,然后在数据集上训练是非常必要的。过去十年,人们一直在遵循“下载数据集,改进代码”这一范式,多亏了这种范式,深度学习获得了巨大的成功。但对许多应用程序来说,代码—神经网络架构,已经基本解决,不会成为大的难点。因此保持神经网络架构固定,寻找改进数据的方法,才会更有效率。当我最开始提这件事的时候,也有许多人举手赞成:我们已经按照“套路”做了20年,一直在凭直觉做事情,是时候把它变成一门系统的工程学科了! 也就是说,尽管此前对于数据的处理是占用机器学习大半时间的脏活,随着算力和算法的飞速发展,作为AI三要素之一的数据,改变了行业的关注方向。 《中国城市数据要素市场发展评估报告(2023年)》从政策环境、产业基础、数据供给、数据流通、数据治理等方面进行统计与评价,上海、北京、深圳位居榜单前三,并得出以下观点:目前城市数据要素市场化发展不均衡,呈现阶梯化特征;区域一体化发展取得成效,不同城市集群各显优势;沿海城市引领市场发展,中西部省会城市强势发力;数字经济助推作用显著,一线和新一线城市体现明显。这些观点基本符合近几年来大家对行业的认知。 数据要素法规制度尚不健全。数据产权、流通交易、收益分配、安全和监管等基础性法规制度尚不完善。数据的相关权利义务在法律性质、权利内容、权利归属等方面存在着诸多空白。数据资源的管理、定价、分配模式在法律层面尚无明确规定。 如何解决这些问题,需要从政策和技术两个层面着手:建立统一的标准以及完善的政策,为数据交易提供良好的平台,让数据交易的参与者都能“有利可图”,有盼头,才能有劲头,否则就只能得到“参与感”,而无法受益于数据要素和数字经济;另一方面,以大模型、区块链、隐私计算为代表的先进技术,也是推动数据要素x发展的重要动力,从技术层面上解决数据源、数据使用者、数据获益者们担心的问题,形成数据交易的良性生态,也为更多的客户转化奠定基础。 尽管国家已经出台了相当多的政策,从监管、鼓励到流程优化等,目前国内数据交易依然处在试水期。目前各省市数据交易所的产品,大部分还是以服务报告、研究报告、舆情监测等为主,或者是一些数据API等基于爬取平台数据进行二次加工的数据接口为主。用通俗的话来讲,此前的数商企业多了一个平台。 《行动计划》的颁布,针对的就是数据要素发展过程当中数据供给质量不高、流通机制不畅、应用潜力释放不够的现象。而这些现象,可以通过相关技术和政策层面进行解决: 合成数据 随着大模型崛起,通过合成数据进行推理和训练也成为了一种趋势和方向。而优秀的基础大模型,对于数据的需求反而降低了,可以实现少样本甚至是零样本学习。据报道,微软、OpenAI、Cohere等公司已经开始测试使用合成数据来训练AI模型,尽管合成的数据可能造成一定的的负面影响。在数据匮乏或即将用完的时代,高质量的真实数据可能并不足以支持大模型的训练,合成数据似乎也是缓解“数据荒”的一个有效方式。 因此,对于某些“数商”或者期望成为数商的企业来说,寻找或者自己创建合成数据,也是进入数据要素相关产业的一个方法。在确立标准保障的前提下,发展合成数据,似乎也是推动数据要素经济高质量发展的一个方案。 Web3与区块链 Web3的一大特点就是数据权属的确认,拥有数据的人和组织可以建立互为中心化的机制,个人也可以实现经济价值。而区块链领域,实现数据上链,也能够有效地促进数据经济发展当中的信息和隐私安全,同时为未来可能存在的数据交易争议提供有效证据。从数据可信到确权、交易、责任追溯、利益分配等,区块链都能从中提供技术和框架层面的支持。而这也是《行动计划》当中提及区块链的重要原因。 隐私计算 对于技术型数商而言,其实最关心的就是“别人知道了我们怎么办”。不管是学术单位也好,还是企业、组织也好,数据对于他们而言就相当于最高机密,因为有心人能够从些许数据和人员、组织动态当中就发现内部的变化和调整。 而隐私计算的特点,就是“可用不可见”,能够有效解决数据提供方在隐私方面的后顾之忧,通过对于数据进行加密传输完成数据的虚拟融合,实现了隐私信息的屏蔽和覆盖。目前主流的隐私计算技术主要分为三大类:以多方安全计算为代表的基于密码学的隐私计算技术,以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术,以可信执行环境为代表的基于可信硬件的隐私计算技术。 国家发改委负责同志曾经在接受记者采访时表示:在数据生产、流通、使用等过程中,个人、企业、社会、国家等相关主体对数据有着不同利益诉求,且呈现复杂共生、相互依存、动态变化等特点,传统权利制度框架难以突破数据产权困境。“数据二十条”以解决市场主体遇到的实际问题为导向,创新数据产权观念,淡化所有权、强调使用权,聚焦数据使用权流通,创造性提出建立数据资源持有权、数据加工使用权和数据产品经营权“三权分置”的数据产权制度框架,构建中国特色数据产权制度体系。 然而,淡化所有权、强调使用权,可能会对以数据生产和加工为主的企业造成动力不足的现象,事实上,很多企业对于相关数据就表示抗拒,因为可能涉及到相关机密数据或工业机理。通读《发展计划》可知,这并不代表顶层政策不重视所有权。 相反,《发展计划》提出,推动科研机构、龙头企业、技术服务商等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集,并明确提出加强供给激励,同时完善信息采集加工等环节的保障工作,在建立标准化流程的同时,努力为数据商提供相应的数据要素发展土壤。正是从政策方面引导机构和企业带来高质量数据,提升数据生产的积极性。 此外,相关的标准也在逐渐完善和优化,目前关于数据要素流通的标准体系,已经有指南、架构等在内的几十条国标发布。下图为数据要素流通相关标准体系结构图: 在智能化软硬件都飞速发展的今天,“让算力像水电一样即取即用”等理念逐渐成为共识,和算力甚至水电热网不同的是,数据资源具有的所有权归属、隐私权相关性、复用性等自有属性,都为数字要素的发展带来了挑战。而数据资源广阔、品类丰富、或者相关价格、安全与执行规范的不成熟,也是这片蓝海的特征。 我们可以预见,随着相关技术和体系的成熟,数据要素将会成为数字经济发展的新引擎。它将普惠地影响生产方式、商业模式,并为各行各业带来新的发展机遇。只要秉持开放共享的理念,数据要素无疑将成就更加繁荣的未来。 参考内容: 文章精选从大数据到数据要素
也谈数据要素x与互联网+
数据产业链与数商
图源:华西证券
传统数字化业务与数据要素化业务对比 图源:上海数据交易所标准政策落地,创新技术护航,数据要素迎来新生态
技术层面
政策层面
数据要素流通标准体系结构图 图源:全国信标委大数据标准工作组写在最后
中国数据要素政策大事记,36kr
专家解读 | 发挥“数据要素×”效应 构建以数据为关键要素的数字经济,国家数据局
从“互联网+”迈向“数据要素×”,腾讯研究院
《数据要素交易指数研究报告(2023年)》中国信通院
《中国城市数据要素市场发展评估报告(2023年)》,赛迪四川
《全国数商产业发展报告 (2023)》,上海数据交易所
“数据二十条”存五大权属焦点问题,“持有权”会是突破口吗?,财经E法
《“数据要素×”三年行动计划(2024—2026年)》
36氪研究院 | 2023年中国隐私计算行业洞察报告
“数据二十条”存五大权属焦点问题,“持有权”会是突破口吗?
“数据要素x”三年行动规划,面向应用场景挖掘数据价值,华西证券
“数据要素×”:何以赋能经济社会高质量发展?中宏网