1. 在线隐私的简史
互联网刚刚诞生时,所有的内容都是未加密的。人们通过一个特定的地址访问网站,这个地址以"HTTP"开头。当时,这并不是什么大问题,因为人们在线访问的都是内容,而这些内容本身已经是公开的。但随着电子邮件的出现,问题变得有些复杂。当电子邮件通信未加密时,任何互联网上的人都可以监听进出你计算机的数据,从而读取你的私人信息。
那时,一群密码学家和隐私爱好者,称为"密码朋克",开始思考未来的在线隐私问题。他们的基本假设是,利用现代密码学技术确保在线信息只能被预定接收者读取,而不会被其他人窃取。这一思路最终在1993年发表的《密码朋克宣言(A Cypherpunk's Manifesto)》中得以体现,为今天日常使用的所有现代隐私技术奠定了基础。该宣言充满了远见,如下摘录所示:
- 隐私对于电子时代的开放社会至关重要。
- 当我请求我的电子邮件服务提供商发送和接收信息时,我的服务提供商无需知道我在与谁交谈,或我在说什么,或者别人对我说了什么。
- 开放社会中的隐私要求匿名交易系统。
也许最重要的是,宣言中提到:
- "我们用密码学、匿名邮件转发系统、数字签名和电子货币捍卫我们的隐私。"
密码朋克不仅仅是理想主义者;他们还是建设者。所以,他们开始创建他们认为世界需要的工具,以保障隐私。端到端加密和"相当好的隐私" (pretty good privacy,PGP) 的发明人 Phil Zimmerman 就是一个密码朋克。维基解密的创始人 Julien Assange 也是密码朋克。BitTorrent 的发明人 Bram Cohen 是密码朋克。许多核心 Tor 开发者也是密码朋克。甚至比特币发明者的化名 Satoshi Nakamoto 也是密码朋克。当今人们在线上所拥有的那些微不足道的隐私,都归功于密码朋克。
虽然历史上曾有一些加密技术用于私人通讯,但直到互联网的出现和90年代密码朋克的崛起,密码学才开始在普通民众中流行开来。各国政府反对民间使用密码学,而密码学直到那时主要还是被军方使用。事实上,密码学使得进行大规模人口监控变得困难甚至不可能。因此,政府试图禁止密码学,迫使电信公司为其服务加入"后门"------一种在用户不知情的情况下解密通讯的方式。
密码朋克进行了反击,多年来,研究人员和政府之间展开了"密码战争"。研究人员认为后门弊大于利,而政府则声称没有后门,犯罪分子就能逍遥法外。最终,人们接受了这样的事实:如果美国政府拥有后门,那么任何拥有足够资源的人(如外国政府如俄罗斯)也最终能够访问相同的信息。通过对本国公民的进行大规模监控,政府实际上是在帮助敌人做同样的事,从而削弱了他们的主权。幸运的是,美国政府最终放弃了反隐私立场,任何人现在都可以自由地进行加密通信。
从此,设计一个新型的互联网协议成为可能,通信将被加密,这样没有人可以看到用户与他们访问的网站之间传输的数据。这个新协议被简单地称为 HTTPS,字母"S"代表"安全"。这就是当今浏览器地址栏中那个小锁的含义。
自90年代起,HTTPS得到了广泛的应用,现在已经占据了超过80%的互联网流量。问题解决了吗?其实并不是。正如人们在2013年随着斯诺登事件的揭露所发现的,政府并没有消除监控。它们没有拦截通信,而是直接去找在线服务提供商,要求他们提供用户数据。
这一危机被一个事实加剧了:公司越成功,它们能访问的用户数据就越多。因此,它们更容易成为大规模监控和数据盗窃的目标,而这两者在过去十年中呈指数增长。今天,能够访问一家公司的用户数据意味着可以获取数百万,甚至数十亿人的数据。

显然,确保数据传输的安全已经不再足够。当今仍然面临大规模监控和数据泄露的原因是人们的数据在处理过程中并未加密。似乎存在一个根本的悖论:为了能够使用互联网,需要开放自己的数据,这使得容易受到监控和数据泄露的风险。这意味着人们必须放弃隐私才能使用在线服务吗?幸运的是,并不需要,而解决方案再次是加密技术。
2. 引入全同态加密(FHE)
全同态加密(FHE)是一种技术,使得数据可以在不解密的情况下进行盲处理。
作为一个 web 服务的用户,你会使用一个密钥加密你的数据,并将加密后的数据发送到 web 服务器,在服务器上进行盲处理。处理后的结果会被加密并发送回你,你可以使用你的密钥对其解密。从你的角度来看,什么也不会改变;你仍然会将数据发送给 web 服务并得到响应。但是,提供服务的公司现在可以在不查看你的数据并且不需要保护它的情况下进行处理,因为你的数据不仅在传输过程中是加密的,而且在处理过程中也是加密的,最终结果也会被加密(即端到端加密)。
使用 FHE,除了你自己,没有人能看到你的数据。政府、黑客,甚至提供服务的公司都无法看到你的数据,因为他们没有你的密钥。他们也无法破解它,因为 FHE 使用的加密方式甚至能抵抗量子计算机的攻击。
为了说明 FHE 是如何工作的,假设你想通过将图片发送到云端图片编辑工具来应用一个滤镜。下面是使用 FHE 的操作步骤:
- 1)第一步:选择一张图片,并使用私钥加密它。
- 私钥将用于加密图片,生成的加密图片看起来就像一堆随机的像素。没有私钥,就无法知道原始图片是什么。
- 2)第二步:将加密后的图片上传到云端,并选择要应用的滤镜。
- 假设你现在想使用在线云端图片编辑服务为它应用一个艺术滤镜。运营该服务的公司无法知道你上传了哪张图片,因为他们没有你的私钥。然而,他们可以对加密后的图片应用滤镜,生成一个新的加密图片,这个新图片同样看起来像一堆随机像素。
- 3)第三步:下载结果,并使用你的私钥解密它。
- 完成后,只需下载新的随机图片,并使用你用于加密原始图片的相同私钥进行解密。你现在可以看到应用滤镜后的图片结果,尽管你从未将其展示给任何人。
可以在 Hugging Face 上直接体验以上demo:
FHE 可能一开始看起来像魔法,但它实际上基于著名的数学概念"同态"(homomorphism),意思是"相同结构"。本质上,用于加密的私钥只是改变了数据的解释方式,而没有改变其结构。这使得你可以对加密数据应用数学运算,并使用原始私钥重新解释结果。私钥就像是"罗斯塔石碑(Rosetta Stone)":
- 除非你拥有它,否则你无法理解你看到的内容。
那么,为什么如今还没有在各个领域使用 FHE 呢?答案是,虽然 FHE 最早在 1970 年代末就已经被设想出来,但直到 2009 年才有实际的实现。最初,FHE 的速度太慢,无法实用------它的速度比没有 FHE 的处理慢了大约一百万倍。原本只需要一秒钟的操作,使用 FHE 后需要 11 天。显然,这并不适合用户使用!
然而,这种情况已经发生了变化。新的密码学突破和强大的硬件缩小了在没有隐私保护和使用 FHE 完成相同任务之间的时间差。仅在过去两年中,从慢了 100 万倍进展到了慢了 1000 到 100 倍,而且预计到 2025 年时,FHE 的处理速度将低于 10 倍慢。这标志着 FHE 有望变得普及,能够在需要隐私保护的地方广泛应用。
FHE 将启用的应用领域包括以下几个方面:
- 预防医学:想象一下,提前知道自己在一生中需要做什么来保持健康。借助 AI,这变得越来越可能,但这需要分享所有的健康数据------从 DNA 到病史,再到生活习惯。使用 FHE,你可以将所有这些数据以加密形式发送,AI 会返回加密的健康建议,只有你能看到。
- 面部识别:从科幻小说到我们手中的现实,面部识别现在已经成为我们日常生活的一部分。使用面部识别进入大楼,解锁手机,标记图片中的人,未来还将用它来登录各类网站。然而,这需要你的生物识别指纹被存档,而这些数据如果落入不法之手,可能会被用来冒充你。通过 FHE,你可以安全地进行身份验证,而任何人都无法窃取这些生物识别数据。
- 语音助手:每当你或你的家人对 Siri、Alexa 或 Google Assistant 说话时,个人信息都会被发送到背后的公司。使用 FHE,你的语音查询将以加密形式发送到 AI 助手,AI 可以回应你,而无需知道你询问了什么!这意味着你不再需要担心家人的数据被滥用或被盗。即使家里有麦克风在最隐私的地方,也不再重要,因为没有人能监听到你的对话。
- 私密智能合约:从设计上讲,区块链是公开的,这意味着所有流入 Web3 应用的用户数据对全世界都是可见的。使用 FHE,可以实现私密智能合约,其中输入和输出都是端到端加密的,这意味着可以安全地构建使用敏感个人数据的去中心化应用程序。
即使是定向广告也可以通过同态加密实现。这项技术可以实现的功能几乎没有限制。到某个时候,不使用它的唯一原因将是:要么需要人工参与提供服务(有时是可以接受的),要么提供服务的公司正在出售你的数据(这是绝对不可接受的)。
3. HTTPZ:一种新的互联网协议用于端到端加密
实现 FHE 的普及是互联网隐私的一个关键里程碑,因为这意味着网络上的所有内容都可以实现端到端加密,同时不影响用户体验。
这反过来可能会催生一种新的互联网协议------HTTPZ,标准化端到端加密,并取代 HTTPS 作为在线服务实现的默认协议。使用 FHE 的网络服务将简单地公开一个 HTTPZ URL,而网页浏览器将在用户端处理加密和解密。对于最终用户来说,一切都将在后台发生,用户无需任何操作。
当这一切发生时,人们将不再关心隐私问题,不是因为隐私不重要,而是因为隐私将通过互联网协议的设计得到保障。
Zama团队是一个由密码学家和工程师组成的团队,致力于隐私保护,其所构建开源的 FHE 技术,帮助公司使其产品实现端到端加密。Zama团队的愿景是:
- 有一天能看到 HTTPZ 这一愿景的实现,从而终结大规模监控和数据泄露!
参考资料
1\] Zama团队2021年8月博客 [People shouldn't care about privacy](https://www.zama.ai/post/people-should-not-care-about-privacy)