青年 | 张欣:算法行政的架构原理 本质特征与法治化路径
算法行政的架构原理、本质特征与法治化路径:
兼论《个人信息保护法(草案)》
图 | 张欣副教授
目录
一、技术赋权和技术赋能:算法行政的建构原理
二、我国算法行政的核心特征和相关风险:以信用监管为例
三、算法行政的法治化路径——兼论《个人信息保护法(草案)》
四、结语
引言:从数字治理到数据驱动型治理
在人类治理的历史长河中,赋予治理客体以“可计算性”(calculability)已经成为现代性的标志特征之一。从治理效能来看,以数字和评估作为基石的量化治理方式具有可预测性、可协调性以及非人际化优势,有助于增加问责度、透明度和效率性。因此,自17世纪人类在教育领域首创量化和书面评估的方式开始,量化治理实践开始向公共领域渗透和拓展,在审计、管理、审判以及立法领域被广泛运用。伴随着数字革命的到来,社会治理方式突破了简单地、线性地使用数字进行预测、衡量和协调的低阶模式,开始以大数据分析为基础,以政府开发的多元应用为平台,全方位推动治理方式在时间、空间和对象等多个层面的深度转变。
首先,数据解析技术在公共行政领域的广泛应用使得执法者可以突破时间的限制,将相对人的过去、现在和未来紧密联结,并将其作为精准决策的依据。例如,美国和英国刑事司法系统中已经依据被告的过往历史、当下犯罪指控等信息对其再犯风险进行评估,从而作为保释和量刑决策的参考依据。其次,远程通讯技术和数据共享技术可以突破空间的限制,在行政机构甚至市场主体之间实时共享限制措施,形成联动制约网络。例如,利用大数据技术广泛归集失信信息,各政府部门和市场主体已经广泛共享失信黑名单,形成“一处失信、处处受限”的联动惩戒局面。最后,人脸识别等人工智能技术突破了个体信息收集的物理限制,治理基础不断细粒化,实现以个体为单位的精准跨域治理。例如,在新冠肺炎疫情防控期间,疫情防控部门利用步态识别技术通过人脸、步态、行为、穿着等特征对疫区返程人员开展多重精准识别,即使个体在佩戴口罩的情况下,仍然可以通过多特征精准识别和研判,实现多端联动和警示信息实时推送。由此可见,与数字治理相比,数据驱动型治理是一种综合工具、架构和生态层面的深层次治理变革。
与迅速迭代的数据驱动型技术相比,无论是在数据治理领域,还是在算法规制领域,相关法律规范更新却呈现缓慢滞后的局面。大规模、系统化的算法行政实践虽然具有客观高效的优势,但却可能对个体产生歧视和不公,侵害公民的隐私并导致行政机关产生信息依赖。笔者聚焦算法行政领域,深入剖析其架构原理和本质特征,以我国信用治理和信用监管中的算法实践为分析视角,结合《中华人民共和国个人信息保护法(草案)》(下称《个人信息保护法(草案)》)中的核心条文,探讨我国算法行政的法治化路径。
一、技术赋权和技术赋能:算法行政的建构原理
伴随着海量数据和高效算力,大数据技术重新界定了国家、社会的互动关系和二元边界,实现了全方位、系统化的国家赋权和社会赋权。在社会层面,大数据技术赋予和扩展了公民的知情权、表达权、参与权和监督权,网络政治生态的权力结构呈现出动态演化、合作共生和多方博弈的新图景。在国家层面,通过控制底层代码和塑造其运行的合法环境,大数据技术重新分配了信息权力,对国家和政府赋能。一方面,网络化、平台化的生态环境促使政府转变其在整个网络生态中的样态和架构,由中心化、单一化的治理支点演变为平台化、分布式的多元治理网络,实现了治理信息收集、加工和反馈的及时、精准与高效;另一方面,算法技术的专业性、高效性消解了传统行政决策中专家和政府官员的知识性和专业性地位,重构了行政决策多元主体之间的知识化和专业化格局。二者相互作用,促使算法技术扩展式嵌入行政实践之中,软件代码和统计操作趋向于取代法律规则,形成了“自动分析、自动决策、自动执行”的算法行政系统。
(一)大数据时代政府通过平台化改造实现数字化转型
作为行政和强制性政治组织,政府机关在传统时代以正当使用暴力和统治结构下的命令与服从关系从社会获取资源,获取国家在治理结构中的自主性。伴随着科学技术的出现,对效率、理性的推崇推动国家进入“技术治理”时代。首先,通过行政决策过程吸纳专家参与,实现科学知识对行政决策所需信息和知识的聚合、分析和预测功能,实现国家和社会治理的科学化、理性化。但网络时代的社会交往方式发生了实质性改变,并且社会中的个体由小范围、封闭式、亲熟化的交往演变为借助移动互联技术的大范围、开放式、陌生化的交往。个体在社会交往中所能产生的辐射和影响达到了前所未有的范围和程度。其次,信息科学技术重塑了社会表达与集体行动。公民借助互联网平台在公共空间中的影响与日俱增。公共沟通领域的热门话题或者焦点事件常成为公民集体在线表达和集聚的诱因,具有线上线下相互转化、虚实结合的特性。在网络社会的新型架构下,以国家和政府为中心节点、单一化和分散化的传统治理思路的局限性开始显现。面对动态性、复杂性、场景化的治理对象,频繁出现监管真空、监管滞后和监管失效的问题。因此,以大数据技术为代表的新型信息技术进入国家技术治理的视野,促使政府治理思路逐步实现从“总体支配”到“技术治理”的重要转变。党的十八届三中全会提出推进国家治理体系和治理能力现代化的重要目标。“十三五”规划纲要也提出以社会治理精细化为重点,充分运用现代信息技术和大数据技术的重要目标。
由此可见,自党的十八届三中全会提出“国家治理现代化”这一重要方针,国家和政府在治理网络中的组织架构、制度依托、决策工具和治理背景实现了全方位演进。以电子政务泛在化、感知化和智能化为发端,我国政府向着智慧化、现代化、智能化、服务化的运行形态和模式快速发展。在智慧政府到智慧城市的建设中,各类型“一站式、一门式、一网式、一窗式”的智能化便民综合服务信息平台在整合信息资源的基础上,为行政相对人提供了个性化、精准化、扁平化的服务。例如,在强势推进的社会信用体系建设过程中,各省市均基本建成统一的社会信用信息共享平台以解决信息壁垒问题。以厦门为例,其打造了极具特色的“两网、两库、两窗口、一支撑”格局,其中,“两网”即开通政务内网“信用工作平台”和“信用厦门”网站,“两库”即建成法人信用信息库和自然人信用信息库,“两窗口”即在自贸区和政务服务中心分别设立信用服务窗口,“一支撑”即依托市级共享协同平台搭建信用信息共享协同平台。从技术治理的架构视角来看,算法行政过程中依托的信用信息共享协同平台集中体现了大数据时代政府平台化和数字化的核心思路。
面对复杂、动态、分散的治理对象,传统条块式的行政组织架构无法适应治理对象的高度流动性和专业复杂性,因此,需要在组织架构上作出实质性改变,以解决条块式架构中存在的信息流动不畅、决策滞后和应对乏力的问题。大数据技术具有高效、便利、互联互通的特性。通过利用信息技术将自身架构延展至平台化和扁平化样态,政府机构可以在原有的行政组织架构中以最小边际成本实现治理过程信息聚合能力和治理决策流动性的提升,以此降低行政行为和公共服务带给社会主体的成本。这种在架构层面的治理逻辑的改变,集中性地体现出现代技术治理语境下,国家已经不再是传统意义上政治秩序生成的顶端,也不再是大型权力聚合体的存储者,转而调适并开始充当规制权力技术设施的连接点(nexus)。这种平台式的架构,一方面,有助于打通各行政机关之间信息的共享和流转,一定程度上减轻了条块式监管架构的僵化问题;另一方面,平台式架构可以为政府行政提供“扩展槽”,通过与社会性、商业性平台的扩展对接,形成更大范围的辐射性和嵌入性。
(二)智能时代专家意见的主导地位让位于数据和算法
早在德国社会学家韦伯论述“法制性支配”类型的官僚制特点时就曾指出,专业知识在确立官僚系统的优越性上发挥着重要作用。专业知识一方面保证官僚系统拥有权力,另一方面官僚组织在处理政治事务过程中又可依靠累积的经验和知识增强其权力。公共政策制定活动的现代化和理性化思潮使得现代行政过程日益推崇“专家理性理论”,专家因具备“技术理性”而获得行政决策的正当性。因此,现代公共政策制定领域不仅对行政部门的专业知识、技术理性赋予较大信任,还进一步扩展专家群体的范围,将“行政精英”以外的学术专家引入决策过程,构建知识专业化运作的缜密体系。这种在行政过程中对专家意见的推崇和尊重构成了现代公共行政活动的一大特点。然而,伴随着信息技术的发展和应用,下列三项核心诱因致使智能社会中的专家意见逐步让位于数据和算法,客观上为算法自动化行政的应用和普及奠定基础。
首先,专家技术理性模式不断高度专业化和技术化,并开始融合数据化的方式对自身参与的公共政策进行论证和评价。例如,集中体现现代公共政策领域对行政专家评价理念的“技术理性”绩效评价模型在过程和形式层面追求客观理性化,注重科学、逻辑性的数据论证,通过知识筛选和数据结果设定对公共政策的绩效作出具体评价。伴随着决策绩效数据化和理性化趋势的增强,行政决策本身也进一步呈现出量化和技术化特质。因此,以技术理性为表征的量化绩效评价制度为数据和算法进入行政决策过程提供了重要的激励机制。
其次,由大数据技术和平台生态作为驱动,衍生出数字时代的“分布式信任”(distributed trust)机制,使得公众的信任流动方向从权威专家和行政官僚开始流向数据和算法。正如牛津大学研究员瑞秋·波茨曼在《信任革命》中提出的,智能社会中公众的信任模式已经发生实质性改变。一方面,数字信誉机制为公众提供了“信任跃迁”(trust leap)动力,使得公众愿意承担风险去尝试新的东西或者改变传统的行事方式。例如,公众已经频繁使用网约车平台搭乘陌生人的车或者通过爱彼迎入住陌生人的房屋。另一方面,伴随着公众对传统机构和组织信任的瓦解,区块链提供的分布式账本技术、大数据技术提供的个人信誉足迹追踪服务重构了人际关系规则 ,使得公众信任的流动方向由立法者、司法者和执法者以及各类权威专家的机构式信任开始平行流向基于数据、机器人和算法的“分布式信任”。这种信任和支持为算法自动化决策的普遍应用奠定了正当性和合理性基础。例如,当知名非营利组织ProPublica通过发布专门报告的方式揭露美国司法系统运用COMPAS算法对被告进行审前风险预测评估的程序可能存在种族歧视风险时,美国纽约州刑事司法部门仍然公开对该款软件生成评估分数的科学性和准确性表示支持和信任。这种从一般公众到行政官僚对数据、算法等技术的信任和支持为算法自动化决策的普遍适用奠定了社会基础。
最后,伴随着规制对象的复杂化、动态化、场景化特征的凸显,信息权力在行政专家和大数据技术应用之间进行了重构性分配,并对行政决策运行模式和运行生态朝向自动化和智能化演进起到了至关重要的作用。正如以色列历史学家尤瓦尔·赫拉利曾提出的 “数据主义”潮流所根植的一种信念,即人类决策者并不具有将大量数据流提炼成信息、知识或者智慧的能力,因此数据处理工作应当委托给具有计算能力的算法,其能力远超过人脑。以被喻为经济发展新引擎的数字经济为例,其以数字技术创新应用为牵引,以多元化、场景化、个性化为特征,实现了经济产业要素的全面重构和深度融合。以大数据、云计算、人工智能为代表的数字技术深度嵌入,并不断扩展到新业态和新模式的迭代发展之中,引发了监管模式、监管理念、监管生态的全面变革。由于新兴业态多具有模式新、主体多、法律关系复杂等特点,仅依靠传统专家治理模式开展信息收集和处理,其局限性日益凸显。因此,顺势而为,积极利用大数据和算法技术,提升行政机构数字治理能力成为题中应有之义。
(三)软件编码和统计操作趋向于取代法律规则
在《通过数字的治理》一书中,法国学者阿兰·苏皮奥特(Alain Supiot)率先指出宪法和法律秩序已经呈现数字化转向,数学量化已经成为新的规范性法律基础。一些学者甚至提出,伴随着数据和推理方法的不断积累,最终会达到美国学者雷·库兹韦尔提出的与“技术奇点”相匹配的“法律奇点”(legal singularity)时刻。无论是数字治理,还是法律奇点,核心意涵均体现为法律规范的可计算性。伴随着数字技术和人工智能的发展,很多曾经被认为是隐形和传统的知识开始变得可被编码和计算。正是因为法律规则所具有的可计算性特征使得算法行政决策从基础原理上变得可能。就法律规则的构成要素而言,其以条件假定、行为模式和后果模式为核心结构对人们的权利、义务和法律后果进行规定。法律规则所具有的微观指导性、可操作性、确定性、逻辑性、体系性使其可以在很大程度上被代码化。大数据技术具有识别出人类无法检测到的模式和相关性的能力,并将海量数据转换为特定的高度数据密集型的知识形式,从而创造出新的知识生产模式。在实践中,很多法律规则已经被简化为一系列数字化的参数和指标,甚至具有被软件编码和统计操作所取代的趋势。例如,奥巴马在2013年5月发布的行政命令中规定,所有政府发布的公共文件均应当以机器可读格式发布。英国金融行为管理局已经开发出“机器可执行的监管”(machine-executable regulation),其以代码形式发布监管,具有即时、自动、成本低廉、精准和自我实现的特点。此外,在荷兰的莱布尼茨法律中心发起的“元法律”(MetaLex)项目中通过XML格式对法律规则进行编码转换,使得行政部门能够轻松访问不同级别乃至不同国家和语言转换后的以元数据格式为表现形式的法律规则,使其成为具备机器可读性和可执行性的法律代码。因此,伴随着大数据、云计算和云存储技术的兴起,以算法为核心架构嵌入公共行政领域中的算法规制(algorithmic regulation)作为一种新的社会秩序系统渐次出现。这一规制形式通过收集规制环境中各类组件产生的实时数据,计算并分析相关行为以及可能产生的风险,为达到预定监管目标形成最优管理策略并动态优化具体执行方式。
综上所述,算法自动化行政的架构原理基于三个层面依次发生。首先,国家和政府转变自身的技术治理理念,将自身重置为具有平台化、数字化特质的“规制权力技术设施连接点”,为算法行政实践提供组织基础和发展契机。其次,专家技术理性绩效评价、分布式信任和智能社会信息权力的再分配致使专家意见逐步让位于数据和算法,客观上为算法行政的应用和普及奠定制度基础。最后,法律规范的可计算性和大数据技术的兴起使得海量数据被转换为特定的数据密集型知识形式,算法规制作为一种新的社会秩序系统最终得以出现。在组织基础、制度基础和技术基础的综合作用下,算法行政一方面深刻地体现出计算理性对沟通理性和公共话语空间的转换;另一方面,当算法通过优先级配置、分类、关联以及过滤四项功能嵌入行政决策的各个领域之时,还勾画出技术对国家和政府的动态赋权和赋能过程。数据和算法不仅作为现代社会的信息要素和治理客体而存在,更从宏观层面作为基础治理环境和重要治理技术而存在。
二、我国算法行政的核心特征和相关风险:以信用监管为例
目前已有大量英文文献梳理和探讨域外算法行政的实践规律和本质特征,但聚焦于我国自动化行政实践的研究仍然十分有限。在厘清算法行政架构原理的基础上,本部分以我国信用监管实践为例,深入探究我国算法行政的特征和可能存在的相关风险。
面对我国社会日益严峻的信任危机和原有信任治理资源的频繁失效,以数据驱动的新型信用治理应运而生。《社会信用体系建设规划纲要(2014—2020年)》 中指出信用治理要“以健全覆盖社会成员的信用记录和信用基础设施网络为基础,以信用信息合规应用和信用服务体系为支撑”。《促进大数据发展行动纲要》 中也指出要建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,在信用体系建设环节,推动数据汇聚整合和关联分析,提高信用治理的精准性和有效性。因循这一治理思路,2019年发布的《关于加快推进社会信用体系建设构建以信用为基础的新型监管机制的指导意见》 中进一步指出,以加强信用监管为着力点,创新监管理念、监管制度和监管方式,建立健全贯穿市场主体全生命周期,衔接事前、事中、事后全监管环节的新型监管机制。由此可见,从顶层架构出发,我国的信用监管和信用治理领域正在以数据驱动型治理为思路,以算法自动化决策为机制,积极筹建创新型、智能型、精准型的算法行政机制。目前的实践和探索中,我国算法行政集中展现出如下三项核心特征和相关风险。
(一)以统一社会信用代码为基础构建多类信用信息平台
如前文所述,算法自动化行政的构建机理之一在于政府通过平台化改造实现数字化转型。实际上,无论是政治管控逻辑还是商业生产逻辑,都可以通过微观层面的“账户—数据—评分”框架予以统一,通过平台化改造实现数字化转型并获得“规制能力”(regulability)。具体而言,一方面,需要政府作为平台打造其纵向控制结构,例如通过身份认证、行为追踪、记录评分等形式构建规制能力。另一方面,还需要在横向维度将多类别的信用信息平台联通,通过信用信息互享互通、自动对接等方式扩展其规制能力的辐射边界。以福州市为例,在推进信用领域的算法行政实践时按照“一库、一平台、一网、N应用”的架构原则具体搭建底层基础设施。
为构建智能化、数字化、精准化的信用监管和信用治理机制,我国首先通过公民个人身份证号码和组织机构代码建立起统一的社会信用代码,将个人和组织的身份数字化,为信用信息收集和记录个体信誉足迹活动提供纵向底层架构。社会信用代码对于个人和组织身份识别具有唯一性、真实性和准确性,可以满足信用记录长期性、连续性、准确性和全面性的要求。数字化的身份识别代码还可以打通多个行政机构之间的子系统,为信息高效收集、互通流转和共享奠定重要基础。在实施社会信用代码的基础上,我国各行政部门对业务系统加以改造,建立了一批社会信用信息共享平台与智慧审批平台、网上执法平台、公共资源交易平台。这些平台自动对接,实现了横向的互联互通,通过实现自动比对、自动拦截、自动监督、自动惩戒、自动反馈等方式有效扩展算法规制能力的横向边界。
这种横纵兼具的数字化信用治理平台极大地扩展了政府的规制能力,为构建守信联合激励和失信联合惩戒制度,推进失信被执行人跨部门协同监管奠定了规制基础。但与此同时,由于信用奖惩机制通过信用画像模型和各省市各部门建立的信用信息平台系统化、高效化、泛在化地嵌入多元应用场景之中,一旦发生信用信息记录错误或者基于某一信用特征要素设定存在偏误,就可能导致某一个体或者某一群体在基于信用画像的算法行政系统中被不当锁定,可能在多个场景中受到不利影响。以《厦门市守信联合激励与失信联合惩戒行为清单》《厦门市守信联合激励与失信联合惩戒措施清单》建立的联合奖惩机制为例,仅第一批清单就涉及23个领域、238项联合奖惩措施。《威海市级查询使用信用记录事项清单》亦推动在45个部门的263个行政管理事项中查询使用信用记录,涉及评先选优、干部任用、行政审批、财政性资金安排、公共资源交易等领域,初步形成了“办事先查信用”的工作机制。因此,平台化、数字化的政府虽然通过横纵架构极大地增强了规制能力,但这种平台化架构还同时暗藏风险,一旦个体受到算法歧视,将会有极高的概率延续现有的分类和阶层现状,发生个体不公的结构性锁定效应。
(二)以大数据模型进行信用画像建模推动信用治理自主化和全周期化
信用画像又称为信用建模,是指通过收集、汇聚、分析等方法对个人和企业信用状况利用相关数据进行自动化处理,并对其信用相关特征作出量化分析和预测,形成信用特征模型的过程。在我国信用监管实践中,已广泛利用大数据模型展开信用画像作为具体监管决策的依据。例如,苏州地税依托江苏地税数据库,开发了自然人纳税信用管理平台,对自然人基本情况、涉税行为及相关财产信息等定向采集,借助省、市政府信息交换平台,与银行、工商、司法、海关、房产管理、国土资源等部门进行信息交换,获取自然人失信违约、行政处罚及资产等信息,作为自然人纳税信用评定的重要补充。在平台化和数字化基础之上,苏州地税局还积极运用网络爬虫等互联网工具,对各类网站发布的征信内容进行收集,借助大数据技术对纳税人进行信用画像,据此实施分类服务和管理,作为自然人纳税信用评定的参考指标。这一实施机理与英国税务机关利用欺诈和逃税行为模型识别可疑的纳税申报表的实践具有异曲同工之处。英国税务机关开发的大数据模型Connect(联结)使用文本和数据挖掘技术,一方面提取包含在三十多个结构化数据库中的包括工资单或者土地登记事项的相关信息,另一方面提取来自社交网站或者政府网站的非结构化数据构建个人申报收入的欺诈性监测指标。一旦发现异常,该模型可以将相关数据自动发送给行政机关,并依据代码启动程序自动执行法律,通过直接将税收规则应用于所收集的事实数据来规定纳税人应付金额。在确定金额的过程中,还会限制税务人员对执行规则和缴纳金额的裁量空间。在苏州地税采用的信用画像模型中,对税收相关法律规则进行解构形成建模指引,通过对纳税人的行为特征及风险偏好、遵从倾向进行归纳、分析和预测,设定关键性、客观性指标进行评估并赋予分值,形成四项信用等级并生成个人纳税信用趋势分析报告。这种算法行政实践集中体现出了“自动收集数据、自动化分析、自动化决策、自动化执行”的自主性和全周期性特点。
这一实施模式无疑具有高效、精准的绩效优势,极大地节省了税务机关的人力和财力。但在算法日益具有自主性决策地位的行政实践中,这可能引致以下两种风险。首先,为提升精准性和可预测性,信用画像采用的数据既包括结构化信用数据,又包括非结构化数据。在未获得当事人知情和同意的前提下,对当事人社交媒体平台发布的非结构化数据进行抓取和分析,形成具有直观利益影响的信用画像,可能对个人信息的自主可控带来不利影响。其次,信用画像模型和大数据监测技术的自主性逐步增强。一些信用监管实践中采用的自动对接、自动比对、自动拦截、自动监督、自动惩戒模式可能消解相对人的知情权、参与权、异议权甚至救济权。
(三)以指数化和智能化打造动态信用分级分类监管工具
在顶层设计、平台建设、信用智能模型建设之外,我国的信用监管和信用治理还呈现指数化、指标化、动态化和智能化特征。在“信用+监管”“互联网+监管”作为核心指导思想推动监管改革的政策背景下,我国各省市、各层级、各部门的监管机构开始广泛利用大数据和云计算等信息技术着力推动监管有效性。这些监管工具多以大数据和云计算技术为支撑,对接各类信用信息平台,形成指数化、指标化、动态化、智能化的分类分级监管。目前,我国信用监管指数工具主要在全国层面、各省市层面和专业监管层面予以适用。
首先,以国家信息中心为主体,通过全国城市信用状况监测平台对收集和监测的5 000多个网站公开信用信息、各省信用信息共享平台、各城市黑名单统计数据形成综合评价,定期发布对全国36个城市的综合信用指数排名。国家发展改革委通过参考这一综合指数,对相关行为主体与信用有关的活动和行为进行监测,并生成对城市信用状况的综合评价。其次,以广州公共资源交易中心为代表,一些省市自行创设信用指数并将其运用到行政决策之中。例如,广州公共资源交易中心通过大数据技术每日抓取各方交易主体信用信息,通过智能算法为企业进行信用评分,每日动态更新发布公共资源交易信用指数,并将信用评价结果广泛应用到建设工程招投标、政府采购等领域,信用评价范围覆盖招标人、投标人、评价专家等各方主体。最后,监管机构还与第三方平台企业合作,通过协同联动机制构建细分监管领域的信用指数监管工具。例如,浦东新区市场监管局率先运用“大数据”理念,尝试在网络订餐行业实施“互联网+信用监管”模式,在陆家嘴地区通过入网餐饮单位的市场主体信息基础数据及动态监管数据,建立有关营业执照、餐饮服务许可证、食品安全量化分级监管信息。在该餐饮平台中生成的信用评价、交易记录、投诉举报等数据也同步传输到监管机关,形成大数据技术与信用监管实践的深度融合。
智能化、动态化的信用监管指数基于综合评价和统计指数理论,运用大数据技术,对信用信息进行采集、汇总、分析、加工和综合处理,通过建构指标和权重赋分体系,借助指数模型和测算方法反映样本主体的信用状况 ,为行政决策提供重要参考。其不仅具有较强的客观性、整体性,其动态化采集还具有及时性、精细性和预测性特征,而且有助于监管机关实现全周期视角的分级分类监管。但与此同时,指数类监管工具的开发和使用还可能伴随诸多风险。
首先,指数类监管工具需要一定的数据积累以对分析模型不断优化。若数据或者样本不充分,可能对准确性和有效性产生影响。其次,由于指数类监管工具涉及利用大数据技术进行复杂建模。很多行政机构采用政府购买服务的方式委托平台科技企业代为开发,开发后的监管工具可能被直接应用于平台企业利益相关领域,因此可能存在“技术俘获”的风险。再次,大数据分析技术聚焦事物相关性而非因果性,若无算法影响评估制度进行定期评估,指数类信用监管工具的完整性、科学性和准确性可能存在有效性和准确性风险。最后,伴随信用指数工具呈现跨部门跨领域化,信用监管工具不断嵌入和拓展应用到复杂场景之中,如何妥善处理人机协作以及如何对依据其作出的具体行政行为进行有效解释和说明也将产生技术和制度的双重挑战。综上所述,信用监管领域广泛应用的指数类指标虽然高效、便捷,但可能在透明度、问责度以及公正性层面仍存在局限性。
三、算法行政的法治化路径——兼论《个人信息保护法(草案)》
前文通过剖析算法行政构建原理,以信用监管领域为例总结了我国算法行政实践的核心特征以及与之伴随的相关风险。以大数据技术为代表的各类信息科技既是算法行政的运行背景,也是其得以有效实施的核心驱动力。但在算法行政实践激扬时代之时,平台化、自主化、全周期化和指数化为内核的新型监管实践还需因循法治化发展路径,对算法权力予以合理控制,对行政相对人的程序性权利予以保障,以确保算法行政实践在包容审慎、科学公正的基础上有序发展。综览我国相关立法,《中华人民共和国个人信息保护法》一旦通过,将是第一部系统性、综合性、基础性地对自动化决策和自然人个人信息自动化处理予以规定的法律。该部草案稿一共八章70条,对个人信息处理规则、个人信息处理活动中各方的权利和义务以及履行个人信息保护职责的部门予以了系统规定。本部分聚焦于《个人信息保护法(草案)》中与算法影响评估、算法审计和公共事业领域自动化决策活动相关的核心条文,为探寻我国算法行政的法治化路径提供规则层面的讨论基础。
(一)建议细化算法行政过程中个人信息处理应遵循的合法性和必要性原则
《个人信息保护法(草案)》第二章第三节专门对国家机关处理个人信息进行了规定,是本次立法的一大亮点,弥补了长时间以来我国网络与信息化立法多聚焦商业场景中的自动化决策而忽略公共事业场景中算法行政的薄弱之处。我国已有立法中,《中华人民共和国电子商务法》《网络交易管理办法》《数据安全管理办法(征求意见稿)》均对商业场景下自动化决策应当遵循的原则和合规框架进行了规定。但面对实践中公共事业场景中算法行政应用已趋于泛在化和规模化的急迫现实,相关立法却十分滞后和薄弱。如本文前述,以数据驱动型治理为内核的信用监管风潮已经形成,一系列信用信息共享平台和大数据信用画像已经在各个层级和领域内作为行政决策的基础架构和重要参考,但却鲜有立法从根本上对算法行政过程中个人信息处理规则进行规定。这导致算法行政的应用边界不断扩展之时,公众可能无从知晓某一对其产生影响的决策是由算法作出的,对于决策形成过程亦无法有效参与。即使知晓相关决策的存在,个体亦难以理解算法决策的运行逻辑和具体依据,因此持有异议并挑战算法决策的行动空间十分有限。因此,《个人信息保护法(草案)》第34条规定,“国家机关为履行法定职责处理个人信息,应当依照法律、行政法规规定的权限、程序进行,不得超出履行法定职责所必需的范围和限度”。这一规定在一定程度上确立了算法行政的合法性和必要性原则。例如,我国目前存在对于个人失信信息的界定和收集不当夸大化,一些地方政府存在滥用信用监管技术的问题。因此,第34条的规定有助于国家机关在处理个人信息时严格遵守法律、行政法规授予的权限和程序,防止不当使用甚至滥用算法行政工具。
另外,《个人信息保护法(草案)》第35条规定,国家机关为履行法定职责处理个人信息,应当依照本法规定向个人告知并取得其同意。本条对于初步确立算法行政领域的“通知—公告”机制具有重要意义。以信用监管和信用治理为例,哪些信息应当被纳入信用信息,对于其边界很多公民或者市场主体并不知晓。对于一些地方政府或者行政部门利用大数据技术生成公民或者企业信用画像的行为和技术原理,更是鲜有制度化的通知程序,对于相对人的知情权、参与权乃至异议权的行使均带来不利影响。例如在交通运输领域,若铁路公安局或者国家发改委等国家机关通过全国信用信息共享平台将相对人列入限制乘坐火车高级别席位名单或者限制乘坐火车人员名单,依据相关规定,仅需铁路运输企业在中国铁路客户服务中心(12306)网站、“信用中国”网站发布限制购买车票人员名单的完整信息,并未要求其提供个性化的通知和公告程序。实践中,很多相对人直到自己购买车票受到限制之时才意识到其已被列入限制名单,且常出现因不知情而错过公示期和异议期的窘境。由此可见,通过立法确认并保障相对人在实质层面的知情权和同意权具有重要意义。因此,建议立法机关在条文中对国家机关自动化处理个人信息的告知形式和要求进行适当细化规定,以避免实践中以统一公示代替告知从而使得知情同意流于形式。总体而言,《个人信息保护法(草案)》能够以专节形式提出国家机关处理个人信息的原则和应当履行的法定职责,对于未来搭建公共事业场景中自动化决策的法治化治理框架具有重要意义。
(二)建议引入算法影响评估制度以扩展自动化决策风险事前评估制度
《个人信息保护法(草案)》第54条第1款规定,“个人信息处理者应当对下列个人信息处理活动在事前进行风险评估,并对处理情况进行记录:……(二)利用个人信息进行自动化决策”;第2、3款规定,“风险评估的内容应当包括:(一)个人信息的处理目的、处理方式等是否合法、正当、必要;(二)对个人的影响及风险程度;(三)所采取的安全保护措施是否合法、有效并与风险程度相适应。风险评估报告和处理情况记录应当至少保存三年”。该条在我国立法中首次明确规定了自动化决策风险评估制度。但此次立法中确立的是自动化决策风险的事前评估制度,与国际上通行的算法影响评估实践虽有类似亦有不同。实际上,美国、加拿大和英国均已通过明确立法要求公共事业场景中行政领域使用的算法技术开展算法影响评估。算法影响评估制度作为算法问责制的核心支柱已经日益获得广泛关注。其要求算法设计者、开发者和使用者从事前、事中和事后等全数据周期阶段对算法的技术架构、防治不良影响的技术措施、权利救济渠道、算法透明实现机制等方面进行系统评估。从《个人信息保护法(草案)》第54条的规定来看,我国确立的自动化决策风险事前评估制度与美国、加拿大等国确立的算法影响评估制度有四点核心差异。
第一,我国草案稿集中于风险评估,而非更为广泛的影响性评估。但从操作层面来看,何谓风险其实是一个棘手而又难以解决的问题。只有明晰了风险的衡量标准和基准,才可能在此之上搭建起更具可行性的平台。第二,我国的风险评估主要集中于对个人的影响和风险程度。而目前国际中的通行做法不仅聚焦于对个人的影响,还对社会、经济、生态等多方面的影响予以关照。第三,我国的风险评估并不区分被评估系统的优先级。实际上,欧盟、美国和加拿大的算法影响评估,更加注重对自动化决策系统重要性、应用场景的划分,在重点领域中实施更为严格的评估方法。第四,我国的风险评估聚焦于事前阶段,而国际通行的算法影响评估实际上是采取事前、事中和事后阶段的全周期视角的评估。
算法影响评估制度实际上对于创建负责、公正、安全、透明的算法行政实践具有至关重要的制度意义,其不仅有助于政府机关科学系统地评估行政领域采用智能化分析工具的风险以及对个体、社会、经济乃至生态带来的影响,还能够促使行政机关开发并创建更为人性和公正的算法行政系统。尤其在与个人基本权利密切相关的高风险行政领域之中,算法影响评估制度更加有助于科学、审慎地对算法技术分阶段地合理利用。因此,建议我国立法机关可以适时扩展自动化决策风险事前评估制度的适用阶段、启动条件和适用场景,将算法影响评估引入自动化行政程序的视野之中。
(三)建议明确算法行政领域的算法审计制度并适当扩展审计依据
《个人信息保护法(草案)》第53条规定:“个人信息处理者应当定期对其个人信息处理活动、采取的保护措施等是否符合法律、行政法规的规定进行审计。履行个人信息保护职责的部门有权要求个人信息处理者委托专业机构进行审计。”该条明确规定了个人信息处理的审计制度。就自动化个人信息处理而言,仅通过赋予个人以新型系列权利的方式难以周全保证治理实效。个人在行使各项权利时,基于时间、精力、知识等限制,可能出现怠于行使或者行使不利等情形。因此,我国立法中要求个人信息处理者采取系统化的审计措施有助于与个人数据和算法权利形成协同效应。
综观国际相关立法,欧盟和美国、加拿大等国家均在与算法问责制度相关的立法中明确规定了对自动化决策处理进行稽核的算法审计制度。例如,最早颁布算法问责制相关立法的纽约自动化决策工作组就通过发布指南、会议召集等方式在公共事业领域中积极推动算法审计实践。就较为通行的算法审计实践而言,不仅审计过程中需要对算法应用的基础数据是否存有偏差进行定期检查,以确保模型部署后的公平性,还需要对模型设计、如何使算法更具道德性和可解释性等方面提出具体审计报告。算法审计的重要目的在于算法对公民和社会造成不良影响之前就采取预防和纠正措施。我国目前的算法行政实践中,由行政机关主动开展的算法审计鲜有报道。但由于第三方科技企业既常成为政府委托购买服务的承担主体,又会成为日后相关领域的被监管主体,因此对公共事业场景中的算法应用实行审计具有十分重要的政策意涵。
从目前国际通行的治理实践来看,我国此次立法规定了自动化决策审计制度无疑具有重要意义。但现有规则设计集中性地存在两点不足。首先,对于在何种情形下由个人信息处理者进行内部审计,何种情形下需要启动外部审计未能予以规定。一方面可能对于个人信息处理者的合规指引不清,另一方面可能使得审计制度流于形式而未能起到真正效果。建议立法者适当考虑应用场景和优先等级,对公民基本权利可能产生实质性影响的行政领域规定强制性的算法审计制度,具体的启动条件、认定标准和审计主体可以通过次级立法予以详细规定。其次,目前的条文中规定算法审计的依据限定为符合法律、法规,而未采取国际上较为通行的“法律法规+道德伦理”的审计模式。这可能使得我国规定的算法审计制度在审计内容上存在局限。智能社会中法律、法规常常滞后于技术的发展和应用实践,若作为单一审计依据可能存在局限性。因此,建议立法机关适当扩展算法审计的依据,及时吸收具有共识性和已在国际算法审计实践中被上升为正式规则的伦理规范,为算法审计制度落到实处奠定良好的规则基础。
四、结语
自工业革命以来,每一次技术变革都引发了社会形态、社会结构以及社会治理方式的改变。大数据、人工智能等当代信息科技迅猛发展,孕育并推动了数字社会的全面诞生,促进了数据驱动型治理实践的出现。在大数据时代,政府因循社会架构的变革规律,通过平台化改造实现了数字化转型,为算法行政奠定了底层基础架构。公共政策技术理性绩效评价模式、分布式信任和智能社会信息权力的再分配致使专家意见逐步让位于数据和算法,客观上为算法自动化行政的应用和普及奠定了制度基础。法律规范的可计算性和大数据技术的兴起使得海量数据被转换为特定的高度数据密集型知识形式,算法规制作为一种新的社会秩序系统得以出现。算法行政虽然高效、智能、动态、精准,但其可能对个体权利产生实质性影响,在决策透明度、问责度以及公正性层面亦存在风险。因此,应当明确算法行政应当遵循的合法、透明、问责、公正等核心原则,实施算法影响评估制度和算法审计制度,将算法行政实践切实纳入法治化发展路径。