法治资讯
法治资讯
国务院印发人工智能+行动意见,培育数据要素市场成关键举措
东莞常平律师获悉
人工智能是新一轮科技变革和产业升级的核心动力,正快速融入各个领域。近期,国家层面发布《关于全面推动“人工智能+”行动计划的通知》(简称为《通知》),明确要增强“人工智能+”行动的基础条件,提升计算资源、技术方案和数据支持。这标志着我国积极把握科技变革和产业升级的契机,致力于培养和壮大新型生产力的重要举措。数据是最新型的生产资源,它的数量和品质直接决定了人工智能技术能够实现的水平与深度,当前优质数据供应不够充足是个难题,解决这个难题是“人工智能+”计划能够产生实际效果的关键步骤。所以,迅速建设一个有助于发掘数据价值、推动快速交换、确保合法使用的数据资源交易场所,是执行《意见》的核心任务,也是为智能时代提供动力、建立国家新竞争壁垒的重要基础。
一、战略契合:数据要素市场支撑“人工智能+”行动的内在逻辑
数据要素市场的前进与“人工智能+”计划的实施,并非各自为政的两条路线,而是彼此需要、相互促进的联合体。这种内在联系表现在三个方面。
人工智能技术自身需要大量优质数据作为支撑,国家数据局局长刘烈宏强调,“人工智能技术应用的广度与深度,决定了高质量数据集建设的重要性”。当前先进的人工智能模型,尤其是大型语言模型,其发展过程依然遵循着“规模法则”这一核心准则,模型的整体性能直接受到训练数据在数量、品质以及种类上的影响。缺少大量优质的信息输入,再厉害的计算方式也无法发挥作用。统计表明,我国人工智能运用每日的符号使用量从2024年上半年的1000亿猛增到2025年6月尾的超过30万亿,在仅仅一年半的时光里增长了300多倍。这种几乎无穷的要求正在导致庞大的数据供应不足的问题。显而易见,构建一个能快速整合、管理并传播优质信息的交易场所,是顺应现阶段人工智能发展模式的要求。
另有一面,数据资源与智能科技产生相互促进的循环作用。数据资源市场不仅作为基础为智能科技提供支撑,双方还建立起一种互为动力、彼此增益、快速升级的循环机制。其一,优质的数据资源是提升智能科技应用水平的重要动力。国家数据局统计表明,在医疗健康行业对数据精确度要求极高的背景下,借助人工智能进行医学影像数据集的辅助标记,能够使后续训练的疾病诊断模型精确度增加百分之十五以上,并且人工智能的应用还能促进数据价值的开发。根据一些研究机构的分析,合成数据料将成为人工智能模型应用数据的主要构成,这有助于缓解真实数据供应的不足,同时也能为数据资源市场提供稳定且优质的素材。最后,一旦“数据资源与智能计算”这一高效融合的活力注入现实产业,便能切实强化众多领域的运作,促成明显的效能提升,进而促使循环加速运转 常平镇律师 ,不断累积财富增益。
二、现实审视:我国数据要素市场赋能人工智能发展的机遇与挑战
当前,人工智能与相关领域的融合发展不断深入,我国数据资源作为关键支撑,正有力推动人工智能技术的进步,在国际人工智能领域的竞争中展现出显著优势,产业基础、数据积累和应用场景等方面均表现突出。
经济领域展现出旺盛的动力,市场层面显现出蓬勃的生机。国内数据资源交易场所和智能科技行业之间已经构建起彼此增益的积极局面。中国互联网络信息中心(CNNIC)发布的信息表明,2024年中国人工智能主要产业体量已经超过7000亿元;与此同时,数据行业正在迅猛发展,依据国家数据发展研究机构估算,2024年全国数据行业体量达到5.86万亿元,年度增长率为15.8%,其中专业数据商品的市场价值占比超过30%,商品和服务种类持续增加。国内从事数据相关行业的企业数量已逾四十万,各类专业化的经营实体持续涌现,整个产业在吸纳劳动力方面的表现逐步增强,市场的活跃程度日益提高,这一切共同为“人工智能+”的发展奠定了稳固的产业根基。
数据基础建设持续加强。国家数据局统计,我国数据总量显著增长。2024年全国数据生产量达到41.06ZB,同比增加25%,增速比前一年提升2.56个百分点;到今年6月底,我国已建成超过3.5万个优质数据集,总体规模超过400PB。人工智能进步迅速,研发、培育及推演所需资料总量较上一年提升40.95%;智能家庭、自动驾驶车辆等智能装置信息增长幅度最大,分别达到51.43%、29.28%;无人机产业与自动化设备资料制造速率亦突破30%。值得注意的是,国内主要大型模型的训练资料里,汉语资料的比例大多超过六成,个别模型甚至达到了八成,这为满足本土人工智能产业提供了牢固的根基。
市场潜力巨大且社会条件多元复杂,为人工智能算法的培育、更新及精炼创造了世界仅有的“试验基地”和“实战平台”。此类优势正逐步从服务领域转向生产环节和公共管理层面,产生了显著的“实践主导”作用。我国在面向个人用户的消费市场,聚集了全球数量最多的互联网使用者和移动支付参与者,由此带动了电子商务、社会交往、视频短片等众多基于数据的人工智能服务模式涌现,形成了丰富的应用环境,在面向企业的产业领域,我国是唯一完整涵盖联合国产业分类所有工业种类的国家,正快速推动人工智能技术与现代工业体系的深度融合,促进产业升级换代。在自动化生产制造行业,已经建立了上万个数字化的车间和智能化的工厂;在无人驾驶技术方面,全国范围内已经开放了超过三万二千公里的智能互联汽车测试道路,测试行驶的总里程数已经累计超过一亿二千万公里,各种复杂的道路状况以及大量的实际路测信息,是训练和改进无人驾驶算法模型的重要条件。
不过,困难同样值得关注。现阶段,数据资源供给方面的不足和交易规则的不健全相互影响,构成了阻碍“人工智能+”推进的关键障碍。
数据供给存在数量不足与质量不高的问题,模型发展缺乏优质素材支撑。从数量角度分析,全球范围内优质中文资料所占比例非常小。中国工程院相关研究指出,通用规模达50亿的大模型训练数据集中,中文内容仅占1.3%。这种不均衡现象,造成国内众多人工智能系统在起步阶段只能借助英文材料或翻译质量不达标的资料,从而影响了它们对中文环境的认知能力。原始数据在品质上存在不足,里面混杂着许多杂乱信息、多余内容和不公平因素,必须通过繁琐的处理、标记和整理工作,才能作为模型学习的素材。我国在高级数据服务方面,尤其是数据制造、合法审查、不公识别等环节的行业发展不够完善,高水准数据提供的“制作水平”需要进一步改善。
价格与权益机制亟需改进,市场运作方式有待深入尝试。就价格方面而言,数据作为特殊的生产资源,其价值受场景影响很大,容易复制,且新增成本不断降低,因此常规的商品定价方法不适用。目前,各地数据交易场所虽然尝试了挂牌定价、协议交易、算法定价等多种方式,但尚未形成一套市场普遍认可、公平合理的价值评估和定价体系。某个公司的销售记录,对它自身来说,或许仅能用来回顾总结,意义不大;但对需要分析市场走向的AI系统训练方来说,却十分宝贵。怎样衡量这种“应用价值差异”并制定公平的分配方案,是行业普遍遇到的挑战。从权利分配体系来看,数据归属权与合法性问题构成了根本性的限制。数据归属权、使用权和收益权分离的实践仍不清晰,尤其是大型模型训练所依赖的庞大数据,其权利转移过程错综复杂,公司获取数据的合规代价和法律风险很大,迫切需要在制度上寻求突破,为数据资源的合法、顺畅流转设定明确的规范。
当前存在数据分散存储与流通不畅并存的状况,导致资源优势无法充分发挥。众多具有高使用价值的信息资料分别积聚在各个政府分支、不同领域以及大型公司内部,形成了信息资源分割的局面。由于归属权确认、保密要求、技术规范等方面的制约,这些信息难以完成顺畅的跨机构传输和整合利用。同时,行业内部的数据市场化调配程度也相当有限。制造业领域,国际数据公司(IDC)的统计资料表明,当前制造业数据里,格式规整的部分只占百分之二十左右,许多包含工艺流程信息的非格式化部分无法加以运用。尤其值得注意,工业领域的数据交易量在我国整体数据交易市场中的比例还不到百分之七。这说明,那些对实体经济具有强大推动作用的行业数据场景,正从重要的“生产要素”转变成了无人问津的“数字资产”。
三、突破困境的途径:数据资源市场能够有力促进“人工智能+”行动的关键步骤
为了应对困难、把握良机,需要采取多种方法、集中力量,借助加强资源供给、健全相关制度、革新管理方式、改善发展环境,来建立能够支撑“人工智能+”计划的高水平数据资源交易场所。
(一)强化优质数据供给,筑牢战略资源储备
要从根本上缓解优质信息资源匮乏的状况,需要由中央层面进行整体布局,迅速促进气象、交通、医疗、科研等核心领域的公共信息资源,在保障安全的基础上,按照规范化的准则和标准化的渠道,逐步向公众释放,从而创建一批具备国际水准的国家级和行业级人工智能公共学习资料库。必须认真对待战略资料库的积累和利用 东莞常平镇律师 ,一方面,要研究建立全国性大型模型“红色资料库”,巩固思想防线;另一方面,要加强对海外重要、常见、可信度高的战略资料的收集和商业运用,提升我国在全球人工智能领域的领先地位,为我国人工智能的持续进步奠定基础。
(二)优化数据定价模式,完善利益分配机制
科学成果的合理划分方式是启动数据资源交易活跃性的关键所在。必须迅速研究建立一个既能反映国家管理意志、又能展现市场机制的价格框架。具体实施层面,要明确公共信息财富的创造过程,即由政府部门核准的负责机构进行初步加工,转化为规范化的数据产品;接着由商业主体进行深度加工,开发出适配人工智能使用环境的专门产品及配套服务。价格制定方面,公共数据要作为社会整体数据价值的参照基准:初级建设时期,可以运用政府调控下的成本回收机制,承担数据管理与使用开支,促使大量公共数据进入流通环节;二级流通领域,应支持数据提供者和需求者依据数据在特定智能系统中的实际贡献,以市场手段商定价位,或者设计公平的利润分配方案,确保优质数据资源所有者能够获得人工智能进步带来的收益,以此引导市场不断提供具有高使用价值的数据。关于资源调配,需要研究制定公共数据授权经营的利益分配方案,将付费利用所得部分上缴政府财政,以此支持数据管理维护和公共事业服务,并且要确立恰当的分配规则,从而调动各方参与者的主动性。
(三)明晰数据产权结构,创新安全治理模式
要克服数据共享时存在的顾虑、抵触和能力不足等问题,需要在制度层面和技术层面实现创新。制度方面,要迅速推进“数据二十条”中关于数据资源持有权、数据加工使用权、数据产品经营权的“三权分置”方案,确保数据在“可利用但无法直接查看、可管理但无法自由获取”的条件下安全流转,以此消除数据供给者的担忧。从技术角度出发,研究应用数据真实性证明、深度伪造材料辨识、人工智能创作内容标记等手段,给进入模型学习的数据赋予“身份标识”,使其来源能够追踪、归属明确、授权清晰。若模型产出内容出现纠纷,可向回查明数据源头,为利益划分和责任认定提供技术支撑。另外,要提前规划好人工智能发展时期的知识产权制度,认真研究怎样明确训练资料、智能模型以及创作成果的版权归属和使用准则,设立公正的收益分配方式,为人工智能行业的持续进步提供规则支持。
(四)培育多元服务业态,构建协同产业生态
促进传统数据服务向价值链高端迈进,使其与大模型等人工智能技术的新需求紧密结合。首先,要增强数据处理技术的专业性和精细度。尤其是数据标注服务,要从过去简单的分类、框选,转变为服务于大模型价值对齐的精细、场景化标注,重点包含指令理解、偏好排序、逻辑分析等复杂工作,为模型赋予真正的“智能”。此外,应当着力推动高水准数据制造方法的研究与实践,视其为解决某些领域数据匮乏、隐私维护及信息壁垒问题的核心途径,通过创造模型学习不可或缺的、现实环境中不易取得的特殊场景资料,增强人工智能平台的稳定度和防护能力。另需着力推进国家人工智能实践平台的建设,凭借平台集中技术力量、专业人才及资金资源,促成数据服务供应方与人工智能应用公司的紧密合作,同时指导产业针对此类新型数据服务,迅速构建配套的技术规范、作业规范以及品质考核标准。最终要构成一个囊括数据整个生命历程的、多种多样的服务产业体系,为“人工智能+”计划持续提供优质丰富的“数据动力”。
常平镇律师?敬请于评论区发表高见,并对本文予以点赞及转发,以助广大读者把握法律与正义的界限。