扫码关注官方微信公众号

关瑞玲 栾晓曦 潘伟杰:我国数据要素市场技术创新|《产业转型研究》专刊报道

2023-03-31

导 读

《产业转型研究》专刊前六期刊物在发行后收获了强烈反响,得到了产业界的一致好评。日前,《产业转型研究》专刊第七期刊物已正式刊发。本公众号会对《产业转型研究》专刊第七期中所收录文章进行持续报道,欢迎各位读者关注。

本文为清华大学互联网产业研究院关瑞玲、栾晓曦以及贵州省大数据发展管理局潘伟杰联合发表于《产业转型研究》专刊 2022 年第 12 期 总第 340 期的文章,特此分享,以飨读者。


△《产业转型研究》专刊第七期



我国数据要素市场技术创新

文/关瑞玲  栾晓曦  潘伟杰

关瑞玲、栾晓曦:清华大学互联网产业研究院

潘伟杰:贵州省大数据发展管理局





   
IPFS分布式存储技术      

     
   

IPFS(Inter PlanetaryFile System,星际文件系统)是一个点对点的分布式版本文件系统,补充(甚至是取代)HTTP(Hyper TextTransfer Protocol,超文本传输协议),将所有具有相同文件系统的计算设备连接在一起。用基于内容的地址替代基于域名的地址,让网页的使用更快、更安全、更健壮、更持久。


 
IPFS具备如下优势:  

 

   

   
01|内容不可篡改

每个文件都有单独的一个 CID(ContentID),即便只更改一个字节,CID 也会随之变化,能有效地避免内容被篡改的风险。

02|多副本备份

文件在 IPFS 网络中将按照系统的规划和设置,以碎片式的方式分布到各地存储空间中,副本数可以按需求设置,以保证文件不丢失。

03|自带文件下载加速

由于每个文件在系统中都存在多个副本,在得到文件下载请求后,会从存储副本的多个节点向请求方发送文件,副本分散的节点越多,文件调用速度越快。

E27E



   
先进隐私计算技术   

     

隐私保护计算(Privacy-PreservingComputation)是密码技术、分布式、机器学习、差分隐私等多种技术的统称,在提供数据保护的前提下,实现跨机构之间数据价值挖掘的技术体系,目的是让多个数据拥有者,在不暴露数据本身的前提下,实现数据的互通共享、共同建模,从而产生远超数据本身的价值,与此同时还能保证数据安全,不泄露给其他参与方。

隐私保护计算能够保证满足数据安全的前提下,做到数据价值的互通、共享,使“数据可用不可见”得以实现。隐私计算通过实现对加密数据进行计算或在不透明环境下对数据进行计算,来避免来自计算参与方或其他方的攻击,以实现完成计算任务的同时保证计算过程和结果的隐私与安全的目标。

隐私计算是涵盖了人工智能、分布式计算、密码安全、网络通信等众多学科的交叉融合技术。当前基本共识的 3 种技术路径分别为:联邦学习(FL)、多方安全计算(MPC)与可信执行环境(TEE),三者中,MPC 和 FL 是软件解决方案,而 TEE 是硬件方案。

01|安全多方计算

安全多方计算(Secure Multi-PartyComputation,SMPC)最早是由图灵奖获得者、中国科学院院士姚期智提出,解决一组互不信任的参与方各自持有秘密数据,协同计算一个既定函数的问题。多方安全计算能够保证参与方获得计算结果,但有且仅有其对应的计算结果无法获得结果以外的信息。在整个计算过程中,参与方对其所有的数据始终保持绝对的控制权。

02|联邦学习

联邦学习(Federated Learning,FL)最初是由谷歌提出并实现应用的。数据在整个过程中保持本地存储,不存在数据泄露的风险。2021年4月IEEE(国际电气与电子工程师协会)发布了联邦学习第一个国际标准。按照IEEE的定义,联邦学习是一种综合技术框架,可以使各方在不对外暴露各自私有数据的情况下完成联合机器学习任务。联邦学习本质上来说是以数据收集最小化为原则,在保持训练数据去中心化分布的基础上,实现参与方数据隐私保护的特殊分布式机器学习架构,且基于联邦学习协同构建的机器学习模型与中心化训练获得的机器学习模型相比,性能几乎是无损的。

03|机密计算/可信执行环境介绍

机密计算(Confidential Computing)是一种基于硬件可信执行环境实现数据应用保护的技术。机密计算联盟将机密计算定义为“通过在基于硬件的可信执行环境中执行计算来保护数据应用中的隐私安全的技术之一”。为了减少机密计算环境对特有软件的信任依赖,机密计算重点关注基于硬件可执行环境的安全保证。基于硬件的可信执行环境(Trusted ExecutionEnvironment,TEE)作为机密计算的核心技术,因其提供了一个基于硬件防护能力的隔离执行环境,近年来逐渐成为大家关注的焦点。本质上来说,机密计算的安全性与硬件本身的安全性是强相关的。尤其在当前国际经贸摩擦不断加剧、国际形势瞬息万变的格局下,对于通过采购国外的硬件产品实现隐私保护仍待商榷。

31F28



   
数据资产封装技术      

     

数据资产封装技术是以区块链为底层支持,依托算法和智能合约,实现数据资产交易的技术体系。数据资产封装技术的核心是算法,以技术为核心的数字资产交易规则,避免人为因素干扰,凸显数据资产交易过程中的资产属性和技术属性。

2019 年 10 月 24 日,在中央政治局第十八次集体学习时,习近平总书记强调,“把区块链作为核心技术自主创新的重要突破口”“加快推动区块链技术和产业创新发展”。

区块链其本质是有多个节点共同维护的分布式数据库,具有不易篡改、可追溯、公开透明等特征。

根据分布式账本的公开程度,区块链可分为公有链、联盟链、私有链三类。公有链的数据对所有人开放,且满足技术条件的任何人都可参与链的运行维护;私有链被独立个人或机构掌握;联盟链是介于两者之间。联盟链是现阶段能较好地平衡区块链“三角悖论”的解决方案。数据资产封装技术以联盟链为底层支持,既满足多方参与确保数据的真实可信,还为数据安全提供保障。

智能合约是一种旨在以信息化方式传播、验证或执行合同的计算机协议,允许在没有第三方的情况下进行可信交易,这些交易可溯源且不可逆转,其目的是提供优于传统合同方法的安全保障,并减少与合同相关的其他交易成本。智能合约是架构在区块链上的应用,当合约中的条款被触发时,通过代码实现自动执行不需人为操控,实现代码即规则,由技术代替传统的中介(或担保方)降低未建立信任基础的用户之间的合作成本,增强互信。





 

订购须知

   

《产业转型研究》专刊现已发售第一期至第七期,各位读者如欲购买,可点击文末“阅读原文”自行订购,也可联系以下老师订购:

朱栩葶老师:    
联系电话:010-83021220    

邮箱地址:zhuxt6@sem.tsinghua.edu.cn



内容来源|《产业转型研究》2022年第12期 总第340期
编辑|段文秀
审核、责编|杨帆