设为首页 | 加入收藏 | 联系我们

河北法学

精文推荐

当前位置: 期刊首页 >> 精文推荐 >> 正文



【数字法治研究|何士青 许英达】数据生产力向善演化:生成逻辑、价值图景与法治进路
日期: 2026-03-05      信息来源:      点击数:

作者简介何士青,女,湖南长沙人,华中科技大学法学院教授,博士生导师,法理学学科负责人,湖北省“首届十大中青年法学家”之一,法学博士,研究方向:法理学、科技法治;许英达,男,福建厦门人,华中科技大学法学院博士研究生,研究方向:法经济学、数据法学。


摘要在技术与产业变革的范式叠加下,数据与新质生产力的连接关系逐步纤维化,已通过概念的延伸、关系的转变、载体的全同形成共荣共生、无法分割的嵌合体,数据成为参与劳动生产全过程、与新质生产力深层链接形成的数据生产力。然而,数据权属纠纷、源头污染、秩序紊乱构成发展数据生产力的制约因素。鉴于此,应形塑发展数据生产力的价值图景,从科技法律二元互动理论、制度经济学等维度深度剖析其现实症结及危害,并提出以完善数据产权制度、建立数据托管制度助力数据定分止争;以兼顾法律实质主义与现实效果治理数据源头污染,从而促进数据生产力的持续健康发展;以构建软硬法相结合的法律多元主义规制体系来稳定数字生产秩序。

关键词数据生产力;功能向善;数据要素;数据信托;数据产权制度


一、数据生产力的生成逻辑:概念、关系、谱系的嬗变演化

随着数据要素化、资产化进程的推进,数据赋能”“数据要素×”等概念表述成为数据常见的出场形式,亦深化了社会各界对数据与新质生产力赋能与被赋能之关系的固有认识。然而,实践中数据与新质生产力的连接关系逐步纤维化,已通过概念的延伸、关系的转变、载体的全同形成共荣共生、无法分割的嵌合体,数据不再是简单的数据,而是参与劳动生产全过程、与新质生产力深层链接形成的数据生产力。

(一)概念的延伸:从数据赋能数据生产

无论是狭义还是广义语境下的数据本质皆不新,并非一个全新语义的概念。作为仅指技术指向对象的狭义数据,系缘来已久的旧范畴;作为囊括工具用途的广义数据,不仅被广泛运用于社会生活,还被冠以大数据”“数据技术等成熟概念以拓展内涵和外延空间,为社会各界所知悉和应用。然而,当对数据进行体系化的释义考察时,却发现国内外权威词典、数据法规政策文本及不同使用语境下的数据释义莫衷一是,定义口径、概念内容、含义层次皆存在不同程度的差别。换言之,数据概念尚未在国内外形成适配于各领域、各学科的通用性定义。这不仅增加了学界的对话成本,还容易遮蔽数据与新质生产力的内在联系,产生二者现实关系混淆不清、高度遮蔽的现象,阻碍数据生产力的理论证成,故亟需从狭义数据和广义数据维度,重新诠释数据与新质生产力之关系。

在基础语义支撑下,作为仅指技术指向对象的狭义数据和新质生产力的关系,更多地体现在赋能与被赋能方面。从国内外各大词典所作的规范性解释考察,数据是一种信息资源或加工原料。譬如,《在线汉语词典》中将数据解释为电子计算机加工处理的对象;而《牛津词典》则将其定义为事实或信息,尤指经检验并用于发现事物或做决定的事实或信息;从国内外相关法律、法规、政策所作的描述性解释理解,数据是一种依托介质载体存在的电子资料。我国《数据安全法》第3条规定:本法所称数据,是指任何以电子或者其他方式对信息的记录。美国的《开放的、公开的、电子化的及必要的政府数据法案》指出,数据为以任何形式或介质记录下来的信息。不管采取何种解释,结果都指向了数据是新资源的事实,这与新质生产力所要求的是相承相接的,而新业态、新模式、新技术、新产业都离不开数据资源的添附支撑,故二者的赋能与被赋能关系显而易见。

在拓展语义环境下,作为囊括工具用途的广义数据,以大数据”“数据技术的缩写,甚至是社会发展背景的形式,被广泛运用于社会生产活动和公民的生活空间。譬如,智数时代(又称数智时代),其概念并不是由单一个体或组织首次提出的,而是在信息技术和人工智能技术快速发展的背景下,社会和学术界对这个时代特征的一种共同描述,该概念强调了智能技术特别是人工智能和大数据在现代社会中的广泛应用和重要性。此语境下的数据指向的是一种可凭借自身而生产创造价值的技术手段,从事实上拓展了数据的概念内涵,使数据与新质生产力的关系在概念的范畴上从数据赋能迈向数据生产

(二)关系的转变:从独立作用互嵌共生

数据与新质生产力的关系并非仅依靠数据赋能数据要素×”单向度作用实现的,二者因具有内在统一性、处在共生系统中,而呈现出一体两面的互嵌体关系。从数据的固有属性出发,对比土地、资本等传统生产要素,数据具有非排他、复制无碍、高度渗透、交互成本极低等特性,因而其发挥作用的路径是非线性的,充满了漫反射,继而产生乘数效应、创新效应、溢出效应、网络效应等,这些作用机制和方式让数据与新质生产力之间产生千丝万缕、网格细密化的数据流和价值流,从而使二者深度链接、榫卯相合。可以说,数据要素作为驱动新质生产力发展的原料已高度渗入社会生产的各层次、全链条、多环节,不仅是数字经济的支撑生产要素,更是低空经济、人工智能等领域的核心要素,深刻形塑着新经济时代生产力与生产关系的协变关系。

从数据要素与新质生产力的嬗变历史考察,数据要素化、生产化的进程亦是新质生产力成型的进程。马克思指出,各种经济时代的区别,不在于生产什么,而在于怎样生产,用什么劳动资料生产。此论断让生产要素成为判断社会形态更替的尺度,也丰富了人类考察社会结构的理论视角。揆诸经济发展史,人类社会经历了从高度依赖大自然的农业生产到劳动资料异常集中的工业生产,再到资源信息化、技术智能化的数字经济时代,生产要素的更替变化提振生产力水平,从而形塑出崭新的经济形态和社会样貌。数据作为本世纪最富有创造力、创新性的资源,取代旧传统要素的主导地位,成为社会生产的新兴支撑要素乃顺应趋势的结果。在该轮替过程中,人类逐步凭借数据工具以统合、加工、挖掘以及使用等方式,将数据要素与社会生产有机结合,日趋完成对生产力水平、全要素生产率的提高和社会生产关系的再造,从而激活数据与生俱来的多重效应,最终实现新质生产力的合成。故而,二者实为同一过程的不同侧面,处在互嵌共生的生态关系之中。

检视数据要素与新质生产力的相互作用,二者处在互相哺育的状态。一方面,数据要素通过培育新劳动资料、劳动对象和劳动者促进新质生产力的发展。数据技术的发展为数据要素价值的释放提供处理工具,使广义的数据成为社会生产必不可少的劳动工具,而数据自身的特性也使得这种工具不仅可以同时为多人使用,且不会因使用的频次高而发生物理贬值。狭义的数据自始便满足劳动对象的资格条件,可以经由市场交易或赠与行为加入至社会生产中,形成譬如数据服务、数据产品等新劳动对象;数据产业的快速发展产生新兴职业,孵育诸如数据工程师、平台审核员等新型劳动者,数据要素大量投产倒逼大量传统劳动者通过系统学习、再教育培训,形塑数据思维、数据能力、数字素养,以期适应技术与知识密度更高的工作内容、结构更复杂的劳动环境,继而提高新质生产力的质与量。另一方面,新质生产力的发展也为数据创造、流动和技术提升创设条件、提供便利,以全新动态的理念增进数据生产的包容性、安全性和稳定性,为数据生产培厚扎实的环境根基。

(三)谱系的全同:从起点一致四新四化

平台是数据和新质生产力发展的共同原始起点。无论是数据要素的投入生产、转化为现实生产力,还是新质生产力发挥作用都离不开相应的物质载体,纵使二者聚焦口径、作用机制和表现形式皆有所不同,以平台为基本起点的事实却是不证自明的。于数据而言,数据原生固有的可复制性、非排他性赋予其准公共物品的性质,尽管它较传统生产要素的流通效率高、交易成本低,但仍需要经由数据平台完成供需双方的联接。平台集成化、透明化的特点不仅使数据要素流通利用成为现实,还降低多方主体的信息搜寻、议价谈判、定价决策等成本。于新质生产力而言,其生成、发展及迭代皆无法摆脱平台的基础性兜底。国家多次提到要通过建设高速泛在的智能化综合性数字信息基础设施”“加快形成全国一体化算力体系夯实数字经济的基础生态,继而促进新质生产力的高速发展,而任何数字基础设施的本质都离不开平台的支撑,故而平台系数据和新质生产力发挥作用的起点基础。

新技术、新产业、新模式、新业态是数据要素投入生产、转化为现实生产力和新质生产力发挥作用的共同新质载体。于数据而言,新技术给予其释放价值的空间、新产业助其完成产品包装和价值变现、新模式优化其要素化与资产化的作用路径、新业态使其得以发挥规模集群效应,缺少四新的支撑,数据将无法实现从低价值密度的海量数据到高价值水平的数据资源的跃迁,数据的价值将无从体现;于新质生产力而言,四新是其从根本上脱胎于旧质、优于旧质的显著标志,缺乏技术变革、产业转向、模式升级和业态更迭,新质生产力将失去内核根基,沦为运动口号或符号现象,难以维系高质量发展。

数据价值化、数字产业化、产业数字化、数字化治理是数据要素投入生产、转化为现实生产力和新质生产力发挥作用的共同价值目标。从功能主义的角度出发,揆诸数据和新质生产力的目标指向和价值追求,二者的精神谱系是同脉同源的,沿着资产增值产业集群数化表达的路径展开。一方面,数据扩张趋势和新质生产力发展要求需要以四化赋予和释放价值,经济的底色在于创造价值和实现增值,数据与新质生产力同属于数字经济背景之产物,共同拥有利益创造和追逐的基因属性;另一方面,数据发展格局和新质生产力背景需要以四化夯实阶段成果和稳定发展环境与生态。数据要素和新质生产力可持续发展的内在规定性使得模块化的处理结构、体系化的发展框架以及处于动态调整中而又有序的发展环境成为二者共同指向的现实追求。


二、数据生产力向善演化的现实症结:产权、质量、秩序的真空缺位

数据是经济数实结合、新业态向善发展、社会法治数字化的核心枢纽,亦是凝聚数据生产力的关键要素,迥异于实体型生产要素,具有虚拟性、破碎性和易改性,在欠缺技术与制度规范时,易发生数据权属纠纷、数据源头污染、数据秩序混沌,制约数据生产力发展。

(一)权属纠纷:数据生产过程的复杂性导致利益分配困难

纵观人类财产发展史,人类所视若珍宝的财产不断流转,从土地资产到金融资产再到知识资产,生产要素和资产形式亦持续变化。随着价值的与日俱增,数据生产要素的权属纠纷日益增多,确权难度与日俱增。

数据生产活动复杂性导致确权困难。数据生产过程所涉环节繁多,导致价值生成机理复杂,而难以完成定价与确权。事实上,数据生产流程的基本参与主体和底层逻辑并不复杂,仅需信息提供者、存储平台提供者和信息加工者便可循环运作,而信息存储与处理一般可由信息加工者兼任,抑或由信息处理者通过外包服务购买来实现数据信息的存储功能,所以实际仅凭信息供需双方便能够实现信息流通与开发利用。与之对应的信息确权亦仅需在信息供需双方间协商即可。然而,现实中由于无法判定数据生产要素是否经过提炼浓缩,数据生产要素是否处于终局形态难以评估,故而数据生产要素具有价值密度低、资源碎片化、增值不确定等独特性质。这些特性使得数据生产力的创造主体裂变成数据的收集者、传输者、存储者、清洗者、标注者等,增加了数据生产利益在现实中分配的难度。

从激励约束的角度审视,为激励数据加工者挖掘低价值密度的海量数据,必须承认其贡献并予以再生产的价值补偿,但数据作为数字社会的重要生产要素,数据加工者在开发利用的同时,亦需要支付相应对价,故而数据加工者再生产的价值补偿和数据加工者所需支付的购买对价形成一对矛盾关系,二者如何定额是数据确权的难点。一方面,大多数信息提供者因不具备专业知识和技术,欠缺专业的信息处理和预判能力,故而在面对数据要素的买断行为时,无法准确估量出手价格,这种买卖双方间存在的信息与知识不对称容易导致信息买断交易的不平等;另一方面,信息加工者在处理信息的过程中必然涉及二次创作或二次传播,容易发生篡改信息或错误编译利用信息的行为。

数据生产要素特殊性导致确权困难。数据生产要素的产权分配一般没有经过事先约定或存在强迫行为。在现实语境中,大部分数据生产要素的产生和使用是信息提供者的无意识表达或从事其他活动和行为的副产品,具有内敛性和掩盖性,譬如用户浏览页面、参与用户改进计划意见反馈等,这些活动所产生的数据信息,提供者不以为意,而处理者亦不需要与信息提供者充分协商便可随取随用,相应的产权分配自是未经过事先约定。由于信息提供者和处理者双方在知识技术、信息加工和影响范围等方面天然失衡,信息供给侧往往被迫同意授权。以国内外互联网行业为例,作为高新技术行业的代表,某些垂直领域的互联网巨头有着高度集中的市场份额,使用者欲通过平台购买或使用服务,必须在注册阶段同意授权一系列用户须知条款,否则便无法正常使用或应用。总的来说,无论是产权没有事先约定还是存在强迫行为,信息提供者的意思表示都容易被扭曲,诱发数据产权分配的纠纷。

(二)源头污染:流通利用的过度开放阻滞应然功能的实现

从实务的角度出发,当数据以受害者身份出场时,污染指向数据质量问题,将扭曲数字生产力和生产关系的作用机制,影响数字生产力的功效发挥,使其功能作用指向发生偏移,从而损害数据所有权人的合法权益。

首先,数据污染损害社会信用。社会信用是现代经济社会和传统经济社会的核心区别要素,构成社会主体间交易往来、沟通联络和资源链接的现实基础。优良的声誉和信用具有变现的潜力和价值,能够为社会主体生产活动的资源采购和资金筹措节约成本,因为各社会主体会根据全面公开或是行业团体内部的信用评价结果,确定是否与其他社会主体缔约。所以在网络空间中,声誉一旦因为数据污染而受到侵害,必然导致社会主体利益受损或尊严丧失。数据污染造成的社会主体声誉信用损害存在两种基本情形:第一种情形是以数据造假来增加虚假信用,例如刷单”“炒信等;第二种情形是以贬损交易对手的方式来降低对方声誉信用,例如雇佣水军恶意差评对手。两种类型的行为皆通过数据污染影响了社会信用机制的正常运作,应受到法律的否定评价。

其次,数据污染扭曲资源配置。不同于刷单”“炒信等行为,虚假流量型的数据污染直接利用数据信息的算法推荐机制,垄断资源的分配、协调和控制,二者尽管都与内容传播紧密相连,但在作用机制和实际手段上区别明显。虚假流量型的数据污染阻断内容的匹配连接,不直接利用虚构声誉和信用欺骗消费者,而是以操纵流量的方式搭上算法推荐机制的便车,让算法推荐失灵和误判,从而获得更高的流量推送和商业曝光,蹭到高流量所对应的高价值匹配红利。此种行为使得在真实流量与操纵流量泥沙俱下的现实语境内,诚信经营的商家的合法权益和公平竞争的机会无法得到保障,参与维权与获得权利救济的渠道狭窄甚至缺失,举证亦异常艰难,最终只能妥协加入虚构流量的序列。尽管在司法诉讼过程中,法官可以通过援引原则性条款,如违反诚实信用原则和商业道德,给予行为人法律上的否定评价,实现个案的公平正义,但该原则的内容过于宽泛,适用过于主观,很难保证司法裁判尺度的一致性与准确性。

最后,数据污染误导信息决策。具体作用路径如下:一方面,在用户所知悉的内容领域,自动化批量生成虚假内容,对内容生态和舆论氛围造成负面影响。譬如,利用生成式人工智能合成素材来源不明、内容深度伪造的虚假视频内容,并把这些内容真实性、准确性具有高度不确定性的作品投放至短视频平台、微信公众号等自媒体平台,造成对公众接受信息渠道的源头污染。另一方面,利用机器学习机制,直接对联合学习单位的共同数据池进行投毒。此种现象是数据生产力参与主体所关注和着重讨论的领域,实践中亦针对该种情形开发出了多种数据投毒识别与防治技术手段。但任何配套技术的引入都需要额外的成本代价,为防止数据投毒而开展技术攻防行动会加剧企业创新开发成本的提高,且不当或无效地防治产品的产出容易招致道德风险,导致对外提供服务或者产品的质量受损,甚至催生企业安全经营问题,从而制约数据生产力的发展。

(三)秩序混沌:数据生产秩序受限于其内在规定与倾向性

于数据内部秩序而言,作为数据运行的驱动要素,算法不仅是数据秩序的内在规则,亦是导致数据反对数据的要因。数字赋权下的算法权力逐私利、强推荐,以技术至上主义为核心,容易形成以数字技术和数据信息为中心维度的新型权力,若欠缺法律管制和技术控制,将严重威胁到数字正义,损害公民利益和社会利益,诱发更深层次的社会问题。具体有:一方面,歧视性反馈循环侵害数字弱势群体利益。作为数据驱动要素的算法,其本质即一套可自动执行、人工设定的问题解决规则,而这些人工制定、授权的规则往往利用算法黑箱进行掩饰,内嵌种族、职业、收入等倾向性内容,将数字弱势群体、边缘群体和少数群体排除在规则利益之外,并形成歧视性闭环。另一方面,蜂群思维阻碍公民自由表达的权利。在数字技术赋能下,公共博弈场上的话语争夺与议程控制充斥着蜂群效应,即看似没有领头蜂,但总有无形之手在幕后煽动和控制着整个蜂群去凝聚共识和铲除异己,使虚伪的共识得以产生,真实的公民意见无法或怯于表达。

于外部数据秩序而言,数据安全、数据垄断和数据鸿沟等问题引发的数据秩序混乱已构成外部制约。随着数据社会化使用的程度加深,数据不仅存在内生矛盾,还需要面对外部秩序混乱的问题。一方面,数据生产活动公域化诱发大规模的数据安全问题。近年来,随着政府、企业和社会组织不断推出数字平台,数据生产活动愈发进入公域,嵌入社会治理,成为社会生活的重要部分。数据的集成、精析和利用,使人们所适应的社会环境愈发透明公开。对数字技术的控权者而言,只要数据采集的样本量足够大,就可以使平台使用者的隐私无处遁形;对数据被收集者或生产者而言,其社会生活日趋离不开诸如地图导航、免密支付等数字应用。二者看似联结成服务与被服务、辅助与被辅助之关系,实则背后隐藏着控制与被控制之关系,倘若数据被收集者或生产者的信息因平台控权者故意或监管不力而导致丢失和泄露,或者被他人窃取、盗买、篡改和利用,数据安全危机将不可避免。

另一方面,数据生产原料私域化滋生隐私安全问题。数据生产力的生成与发展需要海量数据的收集和整理,这必然涉及个人私域的生活、工作和人际往来等生活细节,会让个人生活领域的隐私透明度降低。事实上,数字技术对私域安全的入侵问题并非全然是大数据收集信息和分析问题导致的,而是数字化进程中伴生的负面效应。在数字技术与社会深度耦合时,数据生产原料亦日趋私域化,拥有海量数据处理能力的智能机器通过网络实时检索、收集和分析着公民的个人数据,以姓名、性别和身份证号等数据精准标识每个公民;以地址、实时位置等数据定位每个公民的惯常住所和生活轨迹;以电话号码、邮箱和社交账号等数据识别公民的社会关系……这种现象多方渗透,蕴藏的数据安全风险难以估量。


三、数据生产力向善演化的价值图景:向善、安全、公平的本源诉求

理者,物之固然,事之所以然也。发展数据生产力的法理包含推进数据经济建设之固然,同时蕴含加强数据法治建设之所以然,发展数据生产力必须明确和坚持一套符合社会发展和符合人的内在理性的法伦理发展观,以此来消解数据生产力的现实症结。正如数字法理蕴含着超越于现代法理的丰富内容和理论体系,发展数据生产力必须坚持数据功能向善、数据安全秩序、数据公平利用、数据良法善治等。

(一)总体原则:数据功能向善

善是人类孜孜以求的道德理想,从抽象地谈论人性本善到考察人类行为动机之善、再到关注人类行为结果之善,人类对善的追求随着社会演进和实践发展而不断深化、不断拓展。当今时代,如何合理用好数据,让它发挥价值的同时,减少滥用或作恶的可能受到人们关注。数据功能向善是发展数据生产力的总体原则,具体原因如下。

第一,数据功能向善助力于实现人的正当利益。人是一种功利动物,每个人都有着自己的利益诉求,正如马克思所言:个人总是并且也不可能不是从自己本身出发的。人是处于一定社会关系中的具体的、现实的人,人的社会性决定了个人对利益的追求应该以社会为尺度,决定了个人利益的正当性寄予在与公共利益的契合中,而追求个人利益的行为无害于公共利益则是善的最低标准。数据科技可以助力于实现无害于人的利益,譬如,医疗数据可运用于疾病疫情防控、挽救生命;网络安全数据使监管部门可以动态预警,挽救公民的人身、财产和其他权利免于遭受非法侵犯。

第二,数据功能向善助力于建立良好社会秩序。关于科技与秩序的关系,卡西尔(Cassire)提出科技是自然的现象、本质和规律的反映,科技所追求的不仅仅在于各类事物的相似性和共同性,而且在于各类事物之间的稳定和秩序;从词源学上考察,古希腊语的科学(Episteme)一词源自一个意指坚固性和稳定性的词根,故而科技本身具有秩序的含义,正是科技的秩序含义决定了科技是一种维护社会秩序的有效方式,科技发展的进程意涵着一种稳定的平衡,将人类的思想和行为导向稳定化和巩固化

第三,数据功能向善助力于伦理道德发展。科技的人本实质使得科技与伦理道德有着不解之缘,科技的伦理道德价值在古代就为思想家们所认识,德漠克利特(Democritus)的科学是使人获得美好的道德品质的需要是这方面的经典表述。在近代,科技的有用性激发了人的逐利本能,应用科技追逐利益的行为冲击了传统的伦理道德,这就是卢梭所观察到的现象:人的德行”“随着科学与艺术的光芒地平线上升起消逝。在现代,科技对伦理道德的挑战依然存在,不仅科学的意义被娱乐的喧嚣所掩盖,而且科学研究本身也渗进了过多功利色彩。鉴于此,我们更不能忽视科技,尤其是数据科技发展对伦理道德的正向价值:一方面,科技活动具有丰富、巩固、强化伦理道德的重要功能,从科技活动中凝练出的科技精神亦成为伦理道德的重要组成部分;另一方面,伦理道德在回应科技挑战的过程中得以持续发展。

(二)基本要求:数据安全秩序

无论处于何种社会,追求趋于稳态的社会秩序乃基础的治理目的与价值诉求,安全与秩序系人类社会的核心范畴,在法治社会占据首要位置。与现代工业文明发展进程如影随形的社会威胁是安全问题,新兴技术的积聚与集成拓宽了数据生成方式与运用场景,塑造出数据多点存储、多方流转、多元共享的全新格局,蕴藏的法律风险呈现形式多样化、高度隐蔽化、敞口全周期等演化趋势,数据安全秩序的重要性不言而喻。换言之,无论是物理世界里的社会生产,抑或数据虚拟世界中的生产活动,都需要保持存在着某种程度的一致性、连续性和确定性,避免发生断裂和无规则性的现象

数据安全是经济平稳运行、人民幸福生活的现实基础。数据安全秩序是与数据混沌等相对的概念范畴,当数据陷入混沌,稳定的数据生产关系和结构将失去一致性,相应的行为边界和连续进程将发生模糊断裂,整个数据生产活动抗风险能力变弱,社会公众将失去聚焦、理性预期以及安全感。为了规避数据秩序混沌、守住数据安全秩序,必须采取法治手段,以普遍适用的约束性法规引导、修正和规制社会主体的数据生产行为;以定型化、规范化、体系化的制度让安全秩序的本源政策可以持久稳定地向善运行;以充分激发人的主观能动性让数据安全秩序中有关经济社会和生态文明的规律法律化,转化成内嵌法律约束力的社会行为准则。揆诸当下,当风险和不确定性充斥着现代社会,数据安全秩序便转化为法的价值目标,即法律应当在维护数据生产安全秩序中发挥正能,具体表现如下。

首先,必须以数据安全规范体系保障数据要素流通秩序。在数据要素流通试点培育和推广中,各地发现数据安全与数据要素流通之间存在抵牾,流通涉及数据交互、堆叠、储存、变现等具体环节,容易造成更大的风险暴露和安全威胁,带来数据污染、数据泄露等问题,亟须通过建立高效的数据安全规范体系,防止风险产生与堆积。其次,必须以数据安全规范体系助力行业增强风险防范能力与意识。在国家数字规制框架下,各地组织研究和编制数据安全管理的实施指南与技术标准,但数据安全合规工程所涉主体、对象众多,牵连的关系和矛盾错综复杂,数据安全标准的制定与执行难度巨大,业务门类多的企业还需同时面对多重审查。最后,必须以数据安全规范体系应对数据流通利用的复杂现状。目前我国仍存在以下问题:一方面,技术和产品的迭代更新和范式转移与数据管理模式的滞后性产生矛盾,必须诉诸数据安全合规以应对管理转型尴尬期的管制留白;另一方面,数据流通利用环节关涉的主体、程序和对象的形态变幻莫测且具有阶段性,必须通过数据安全合规,保障数据管理策略的有效和厘定发生数据事故的责任补偿。

(三)价值依归:数据公平利用

公平乃人类探寻美好和共同善的永恒话题,是社会向上发展的显著标志和价值基础,如何提出公平的社会方案是学界乃至社会各界孜孜以求的目标。可以说每个社会秩序都面临着分配权利、限定权力范围、使一些权利与其他权利相协调的问题,分配社会资源决不可以超越某种外部界限,必须在个人权利和社会福利之间创设一种适当的平衡。鉴于此,为促进数据生产力实现该种平衡和功能向善,应以数据公平利用为价值依归。

第一,数据公平利用促进数字包容以发展数据生产力。数字包容的学理范畴与实践意义颇为深远,关照人类在数据应用与参与数据治理的全过程,不仅强调对数据利益分配不公的规制,更重视发挥数据在增进社会包容度方面的作用。数据公平利用使得数字包容沿着消除新发展动能、业态和技术带来的不平等运用数字工具促进数据公平利用以发展数据生产力行进。具体机制如下:一方面,倒逼数据与传统生产要素包容并济、结合发展,扩大数据生产力的放大、叠加、倍增效应;另一方面,通过缩短区域发展差距、优化资源配置、均等配置公共服务,促进改革与发展成果平等地惠及边山穷地区。

第二,数据公平利用解放数字弱势群体以发展数据生产力。迈入数字时代,数据构成社会运行的基本要素,社会活动经由数字技术的转译从现实空间转至赛博空间,数字孪生充斥人类社会,人类被赋予数字化人格。社会生产组织乃至社会秩序发生重构,产生资源分配的不公和失序。由于不同主体在数据处理能力、设备等方面存在禀赋差异,所以当其参与数据利用与权益分配时将分化出数字强势群体与弱势群体,二者的力量差距超出社会一般标准将严重破坏公平正义,制约数据生产力的发展。鉴于此,有必要通过制定社会规则来保障数据公平利用,帮扶和解放数字弱势群体,确保公民平等、自由等基本权利与人权价值得到落实。

第三,数据公平利用纠正算法歧视以发展数据生产力。数据科学家凯西·奥尼尔(Cathy O′Neil)认为,数据与算法之关系形如枪械与弹药,数据本身是无偏中立且不蕴含价值取向的,但因为人类输入行为,而产生指向性与倾斜性,而算法加持下的数据又加剧这种偏斜,造成更多不公平的结果。倘若数据中裹挟着物理世界的歧视和偏见,那么有毒数据将会塑造出不公平的算法规则,并随着算法的传播复制感染其他应用场景。相反地,若是数据进行全过程反歧视审查,算法歧视存在的风险和空间将被最大程度地限缩。


四、数据生产力向善演化的法治进路:制度、自由、良法的软硬之治

数据生产力愈发成为人类改造自然的全新动能,揭示着人类社会生产的活动自直接转向间接,自简单工具转向智能工具,自资源密集型劳动转向知识密集型劳动,自经验决策转向数字决策,但仍面临诸多制约因素,必须给予法律保障。

(一)市场自决:加快数据要素交易制度化

通过法律制度确认数据权属是发挥数据功用的前置条件,为克服数据生产活动复杂性和数据要素特殊性所导致的确权困难,需要完善数据产权制度,并可适时尝试探索建立数据托管制度,二者两相结合构筑起健全的数据确权体系。

一方面,应完善数据产权制度。自数据二十条推出以来,我国便着力建立健全三权分置的数据产权制度体系,着力打造数据高效流通、有序生产交易、创新开发使用的体制机制。推动数据确权的意义颇深,需要给予必要的法律保障:其一,提高数据生产领域的立法深度和司法水平,依数据类型分级构筑数据权益保护机制。针对公共数据,应深入探索公共数据授权运营管理制度的开发和完善;针对企业数据,应始终坚持企业自治和数据合规相结合,健全企业数据授权合同的全过程机制;针对个人数据,应按照个人数据的敏感程度实现数据权益的分层保护。其二,合理评估和厘清衍生数据使用权的权属关系,对基于原生数据经由二次或多次创作的衍生数据的定分止争和定价方式予以明确。其三,强化数据精准确权配套设施的构筑与完善,促进数据登记、信用评估、资产公证等配套设施的制度化使用。其四,基于技术自矫和创新完善数据产权制度。具体可以使用区块链、隐私计算等前沿技术构筑数据生产、流通和利用的溯源体系,确保数据生产要素在凝聚数据生产力过程中的真实可信与溯源可查;提供数据确权技术开放共享合作机会与窗口,成立社会创新主体的技术开发利用联盟,有计划地以共享模式减少数据要素市场的确权代价,形成基础研创、技术更新、成果转化、战略升级的全链条闭环。

另一方面,应健全数据托管制度。揆诸传统数据生产模式,数据处理者在数据收集、存储和使用等环节一肩挑,这让数据处理者不仅成为数据活动的参与者,还是数据权属和利益分配的裁判者,不利于公平正义的数据生产力发展格局的形成。目前我国正大力促进东数西算工程的落地,该工程意在发挥西部边疆绿色能源优势,弥补我国人均算力在区域分布方面的不足,这本质上是一种数据托管。故而,探索权属分离的数据托管制度具有可行性。基于数据托管的创新框架,数据的存储、利用、管理等职能将彼此独立、各司其职,不再由数据处理者大包大揽,而是通过诉诸第三方权威中心,转由数据托管者为各方参与主体提供安全可信的公共数据存储与托管服务。数据存储将由第三方机构负责,数据处理者则在数据托管机构和国家有关部门的监管下收集和处理数据,并完成面向消费者的数据产品和服务供给,处理数据的全过程、全环节的数据存储必须在托管机构的框架之下完成,制度建设初期的数据存储可优先确保高价值数据的托管,后续再将托管范围扩张到全部数据。

(二)价值衡平:兼顾法律实质主义与现实效果

数据污染的规制问题和法律关系复杂多元,并非线性直接的,其间所涉利益牵扯众多,必须结合技术特征与样态、数据的属性特征等方面综合评价。为防止数据污染扭曲数字生产力和生产关系的作用机制、损害社会主体的声誉信用,制造虚假流量而构成不正当竞争,生成虚假信息而导致错误决策,应坚持实质主义和法秩序统一。

首先,应树立动态调节三元利益的规制理念。在适用现行法规制数据污染行为之时,需要在司法个案裁判中注重平衡社会公共利益、市场经营者利益、消费者权益之关系,侧重突出社会公共利益的保护。譬如,当有人在机器联合学习演训中于公共数据池里面录入有毒数据时,该行为虽隐蔽且不一定会发生危害结果,所以未必能进入诉讼的视野,但是其危害性和安全隐患却可能导致社会整体利益的减损,所以在判定此类行为的性质时,必须综合各个要素予以评价,不仅要考虑数据池正常数据本身的价值体量、机器学习正常演训可以创造的价值,还需要考虑虚假数据训练结果对于社会的贻害。

其次,应透过社会现象把握本质关系。尽管数字技术嬗变的频率、方式和程度令人咋舌,不同类型的数据生产行为具有不同样态,同一类型的数据生产行为于不同时期亦有不同表征,但只要其本质属性与数据污染定义高度重合或符合类型化特征,那么它们间的法律规制与适用便需要统一。譬如,卖家为提高商铺的在线评分,以好评返现的方式给予买家部分价款返还,从而换取五星好评。尽管该行为与虚构交易刷单行为有明显区别,卖家也确实为此返还了一定数额的价款,但其本质仍符合引诱消费者给予好评进而在短期内提高产品或服务销量,同样会造成服务信用评价结果失真和功能失效,且卖家往往会通过事先作价把让利空间压缩得很有限,所以当为法律所制约。

最后,应合理兼顾和尊重个体自由。并非所有行为模式和后果符合数据污染特征的行为必然要受法律所调整、规制。以艺术文学作品的打榜为例,在自愿自发的情况下,受众可能通过多次重复在线品读同一作品或购买专辑等方式为喜爱的文艺工作者冲榜,尽管该行为符合数据污染的定义,客观上会造成著作、电视剧、音乐专辑等打分失真,可能会误导后续买家购买到低于自身预期评分的产品或服务,但由于该行为系公民的意志和行为自由的表现,且不违反法律法规和社会公共道德,故而不宜以反不正当竞争法等法律规范对其予以负面评价、过分干涉,相反地应合理兼顾和尊重个体的自由空间。

(三)宽严并济:实现法律多元主义的良法之治

数据的内在规定性和稳定预期由算法所操控,而算法是代码设置+数学表达的产物。尽管算法黑箱不是造成数据生产秩序混沌的单一要因,却是实现数据有序治理的必由之路。由于数据和算法具有门槛性、专门性和集合性,所以算法黑箱的治理思路不能仅从法律中心主义出发,而必须坚持松解与控制并重、开放与封闭共存的硬法软法法律多元规制结构。从理论角度剖析,硬法规范可以通过明确治理对象、目标和措施为算法黑箱治理圈定裁量边界、提供兜底性手段;而软法规范能够敞开治理的结点,为社会公众有序参与算法治理贡献合作框架和参考标准,从而重塑社会信任机制,实现数据生产秩序的良法之治。从实践角度审视,欧盟、美国等国际数据治理先行者已形成运行良好、软硬法兼具的法律多元规制体系,为各国提供借鉴范本,我国可合理吸收借鉴成功经验。

摆脱算法黑箱操控数据的现实,必须依靠软法之治重聚社会信任之基。揆诸当下,软法规范的惯常表现形式为基于社会商谈和行业共识而推出的治理规范或行为规则,譬如现行的大数据、人工智能等安全治理准则代表了行业软性约束的前沿实践,为规制算法权力过度膨胀、消解数据内生性问题贡献了学理镜鉴和现实理路。概言之,实现算法黑箱软法治理应以社团、行业等组织之力敦促开发者主动提高算法模型的易读性和可解释性,有条件地向监管部门披露算法内置参数和源代码。但在传统理论语境下,任意性规范的遵守并不严格,一般由被规范主体自决,软法之治的效果不尽人意。鉴于此,必须同步推行遵守或解释机制,即在任意性规范的基础之上附加强制披露义务,若被规范主体选择不遵守软法规范时,必须向社会和监管部门作出详尽合理的解释说明,继而确保任意性规范治理框架下灵活自主性与适当拘束力的宽严并济。

除软法规范外,消解数据生产秩序的内在张力必须依靠硬法规范的支撑和兜底,否则治理目的及其功能将无法实现,法律规范将沦为运动式、口号式的倡导性条款。为帮助数据摆脱算法的操控事实、实现硬法控制,应从算法权利与算法问责展开制度构建。算法权利以明确权利义务关系的手段,实现算法的前端法律控制,制度设计原理在于通过多方主体间权利博弈制约和权利平衡合作,完成对被规范对象的行为模式的调整,继而优化算法语境下各方主体的力量对比和权益结构;算法问责旨在以后端法律控制的方式,构筑适配于算法设计与应用全链条的多方权责体系,继而纠正数据生产过程中算法诱发的有失精准与公平的行为,以便司法部门和监管部门公平公正地判定责任权属。


结语

技术改变人类的生存方式和发展模式,但人类的理性批判却从未终止。当数据作为新型要素的价值功用被社会广泛认可和接纳后,数据生产力的生成和发展路径亦得到证实,但受制于旧有法律规制模式和框架,以及法律具有的自限性和滞后性,数据生产力的发展并未被完全充分地纳入法律保障的视域,这显然与数据生产活动日益社会化的趋势和规范化的需求相悖。故而,法治应对数据生产力予以必要强度的回应,以适应数字经济时代的需要和规范数字产业的发展。针对数据权属纠纷、源头污染、秩序紊乱等制约数据生产力发展的因素,提出以完善数据产权制度、建立数据托管制度助力数据确权;以兼顾法律实质主义与现实效果治理数据污染,从而促进数据生产力在法治轨道上运行;以法律多元主义为出发点,构建硬法软法相衔接的法律多元规制结构以稳定数字秩序。


因篇幅限制,已省略注释及参考文献。

引注:何士青,许英达:《数据生产力向善演化:生成逻辑、价值图景与法治进路》,载《河北法学》2025年第3期,第80-96页。



地址:河北省石家庄市友谊北大街569号

Copyright© 2004-2005 All Rights Reserved 冀ICP备11009298号