注: 本篇博文为个人阅读了几篇《隐私计算白皮书(2021)》后记录的一点点学习笔记,具有主观的“偏向性摘录”,不代表全局普遍观点。若想了解更详细内容,建议看原报告。(侵权即删!!!)
参考资料 [1] 《隐私保护计算与合规应用研究报告2021》来源:中国信息通信研究院。 [2] 《隐私计算白皮书2021》来源:隐私计算联盟、中国信通院云大所。 [3] 隐私计算联盟《隐私计算与区块链技术融合研究报告(2021年)》。
一、隐私计算类似大集合
隐私计算不是某一个具体技术,而是一类技术的统称,就像个大集合,其由密码学、数据科学、人工智能、安全硬件等许多领域交叉融合而成,主要有安全多方计算(MPC)、零知识证明(ZKP)、联邦学习(FL)、同态加密(HE)和可信执行环境(TEE)等。另外,隐私计算与区块链技术的融合是它的一个拓展领域。
-
1)安全多方计算(Multi-Party Computation,MPC)为代表的隐私计算技术:研究两个或者多个持有私有输入的参与者,在不泄露各自私有输入数据的情况下联合计算一个函数,各自得到他们预定的输出。MPC具有严格的安全定义,包括输入隐私性、结果正确性、各方公平性、结果传递保证等。MPC基于三条发展路径:分别为秘密共享、混淆电路和不经意传输。
- 秘密共享(Secret Sharing,SS)协议:最早由Shamir和Blakely在1979年提出,指将秘密信息拆分成若干片,由若干参与者分别保存,并通过参与者的合作,对分布式存储的各片进行安全计算,全部分片或达到门限数的分片根据多个份额可重新恢复秘密信息,其计算量小、通信量低,构造多方加法、乘法及其他复杂的运算有特别的优势,能实现联合统计、建模、预测等多种功能。
- 混淆电路(Garbled Circuit,GC):起源于姚期智院士针对百万富翁问题提出的混淆电路解决方案,其使用布尔电路构造安全函数计算,保证一方输入不会泄露给其他方,计算出结果,并能指定结果由哪方获得或两方以分片形式共有。该技术可实现各种计算,常用于通用计算场景,通信量大但通信轮数固定,适用于高带宽延迟场景。
- 不经意传输(Oblivious Transfer,OT):由Rabin于1981年首次提出,指数据发送方有n个数据,接收方接收其选定的一个数据,同时发送方不知道接收方的选择。OT常用于构造安全多方计算协议,是GMW协议、混淆电路设计、乘法三元组的基础构建,还可以用于实现隐私集合求交(Private Set Intersection, PSI)、隐私信息检索(Private Information Retrieval,PIR)等功能。
-
2)零知识证明(Zero-Knowledge Proof,ZKP):指证明着能够在不向验证者泄露任何有用信息的情况下,使验证者相信某个论断是正确的。零知识证明是一种两方或多方的协议,通过一系列交互完成生成证明和验证,被应用在区块链系统中,主要体现在可验证计算、身份认证、分布式存储、共识机制、计算压缩与扩容等方面。 -
3)联邦学习(Federated Learning,FL)与隐私保护技术融合:基本原理是客户端从中央服务器下载现有预测模型,使用本地数据对模型进行训练,并将模型的更新内容加密上传至云端,再由中央服务器聚合产生新的模型。反复上述过程,原始数据始终存储在本地,而无需交换和传输原始数据。通过对各参与方之间的模型信息交互过程增加安全设计,使得构建的全局模型既能确保用户隐私和数据安全,又能充分利用多方数据,是解决数据孤岛和数据安全问题的重要框架,其强调的核心理念是“数据不动模型动,数据可用不可见”。 -
4)同态加密(Homomorphic Encryption,HE):允许在加密后的密文上直接进行计算,且解密后的计算结果与基于明文的结果一致。半同态(旨仅支持有限的密文计算深度,如Paillier支持密文间的加法运算,但不支持乘法运算)和全同态加密方案两类。同态加密算法以通信量小、通信轮数少为特点,已经在MPC、FL和区块链等存在数据隐私计算的场景落地应用。 -
5)可信执行环境(Trusted Execution Environment,TEE):指通过软硬件方法在中央服务器中构建一个安全的区域,保证其内部加载的程序和数据在机密性和完整性上得到保护。TEE是一个隔离的执行环境,为在设备上运行的受信任应用程序提供了比普通操作系统更高级别的安全性,以及更多安全元件功能。
二、隐私计算面临的挑战
三、区块链技术面临的挑战
- 1)链上账本数据公开可见,无法满足多元化的数据隐私保护要求:为在更广阔的领域使用区块链技术,需要解决链上数据的隐私保护问题。虽然区块链可以解决链上数据的正确性问题呢,如数据上链后不能篡改、可追溯等,但如何保证数据存入区块链之前的真实性和可靠性仍存在挑战。
- 2)链上数据处理能力不足,制约了区块链进一步拓展应用场景:首先区块链智能合约的计算能力亟待扩展。仅通过区块链链上智能合约实现的逻辑极为有限,急需在保证数据隐私安全的前提下扩展链上的计算能力。其次,缺乏链上链下协同、可支持多种业务验证需求的可信执行环境。
四、隐私计算与区块链相融合
区块链具有数据可溯源、难以篡改、公开透明、智能合约自动执行等技术特点,是解决多方协作和多方信任问题的一把利器。隐私计算与区块链都综合利用了密码学、分布式系统等技术,既有相似之处又各有特点。
隐私计算最核心的计算,但整个过程还有完整的系统需要用的辅助技术很多,主要有区块链和证书授权中心等。
在区块链隐私保护的技术体系中,全球技术研究布局始于身份隐私、计算隐私和硬件隔离,逐渐向多元化路线发展。在2017-2019年期间,研究重点是区块链参与者身份和交易金额的隐私保护,随后研究方向逐渐从单一隐私保护算法向混合的、通用的隐私计算技术发展,其中安全联合建模和数据授权计算是近期的研究重点,具有重大发展潜力。
-
区块链隐私计算框架能在数据共享过程中有效保护个人信息,并为数据真实性、数据确权等问题提供可行解决方案,实现全流程可记录、可验证、可追溯、可审计的安全、可信数据共享网络,并为进一步建设高效、高安全和高流动性的数据要素交易市场打下基础。 -
隐私计算过程中的每一方都需具有相同信任根的证书链,各参与方之间通信使用证书链建立SSL安全通道,认证授权隐私计算框架实现参与方间的双向认证,从而确保参与方身份真实准确,实现对隐私计算任务定向授权,验证后执行任务。
区块链与隐私计算的有机结合,使原始数据在无需出域与归集的情况下,可实现多节点间的可信协同计算和数据隐私保护。同时,能够解决大数据模式下存在的数据过度采集、数据隐私保护,以及数据储存单点泄露等问题。
五、隐私计算与区块链相融合的优势
隐私计算虽然实现了在多方协作计算过程中对于输入数据的隐私保护,但是原始数据、计算过程和结果均面临着可验证性问题。而区块链因其共享账本、智能合约、共识机制等技术特性,可以实现原始数据的链上存证核验、计算过程关键数据和环节的上链存证回溯,确保计算过程的可验证性。因此将区块链技术对计算的可信证明应用到隐私计算中,可以在保护数据隐私的同时增强隐私计算过程的可验证性。
-
1)提升身份及密钥管理的安全性和灵活性:基于区块链隐私计算可实现密钥分发功能、密钥协商功能、多重签名及组装验签功能和分布式身份和可验证声明功能。 -
2)解决数据共享参与者身份及数据可信问题:
- 提升隐私计算的活动监测和监管审计能力;
- 提升恶意参与者的作恶成本;
- 提升参与共享计算的数据质量。
-
3)增强区块链的隐私保护功能:区块链的隐私保护方案分为三大类,混淆方案、隔离方案和密码学方案。链上交易机密性、不可链接性和不可追踪性是密码学方案的主要目标。通过在区块链系统中引入用于隐私保护的密码学算法,比如同态加密、环签名、零知识证明等隐私增强技术,直接解决数据隐私保护问题。目前,半同态加密是区块链链上数据隐私保护的主要手段。 -
4)扩展数据安全流通纵深体系:链下计算,链上只保留验证部分,从而提升区块链的数据处理和隐私保护能力。 -
5)构建全程闭环的数据生命周期安全管理:数据共享计算参与者可以在链上用智能合约来实现计算过程中的协作管理功能,由参与方之间共同治理隐私计算过程,协作过程公开公平、公开透明、权责对等,避免了中心化协调方参与带来的隐私泄露的风险;链上参与方计算过程的数据使用情况可以存证留痕,确保参与方按照约定的方式进行计算,提升数据共享协作效率。 -
6)培育共享共生的数据要素市场生态:数据要素市场化的前提条件是成熟的数据确权机制和稳定的数据流动性。
|