大数据时代下,“匿名化”真的能保护我们的隐私安全吗?

1

过去十年以来,我们收集与存储个人数据的能力呈现出爆炸式的增长。由于全球三分之二的人口能够访问互联网,电子病历成为常态,物联网亦快速兴起,这种趋势很可能迎来愈演愈烈之势。通过填写在线调查或者统计浏览习惯,从金融或者医疗服务当中大规模收集到的信息拥有令人意外的巨大潜力。其推动了医学、社会科学以及人工智能的科学进步,并有望彻底改变企业与政府的运作方式。

然而,大规模收集并使用详尽的个人级数据也带来了法律层面的隐私难题。最近,DeepMind共享英国国家健康服务局(NHS)医疗数据以及剑桥分析公司大量购买Facebook数据集等事件,都让人们愈发关注个人数据的保密性、隐私性与道德使用等问题。

为此,数据匿名化也开始受到了广泛关注。所谓匿名化,就是在共享数据集内容之前首先其其中的身份信息进行剔除,这也是各类研究与商业机构所采取的主要个人隐私保护范式。全球范围内的各类数据法普遍认为匿名数据不再属于个人数据,允许各方自由使用、共享以及销售。例如,学术期刊正越来越多地要求作者向研究界提供匿名数据。虽然匿名数据的标准各不相同,但现代数据保护法(例如欧盟〈通用数据保护条例〉(GDPR)以及〈加州消费者隐私法案〉(CCPA)等)都认为数据集中的每个人都应通过匿名化方式得到保护。GDPR提出的要求进一步明确了这种新的匿名化标准:数据不应包含可能导致真实身份复原的明显身份识别因素,这也将匿名化问题正式归入法律范畴。

而为了保护这些有意或者无意间将自己的个人信息交予数据库的用户,大多数机构也会消除数据中的身份信息。在具体流程中,他们会删除明显的个人身份标识,包括姓名与社保号码;有时也会采取其他预防性措施,例如向集合中引入随机“噪声”数据或者利用常规标识替换特定细节(例如将1990年3月7日出生,调整为1990年1月至4月间出生)。处理完成之后,代理机构即可发布或者出售这部分信息。

>>> 数据匿名化处理被证明无效

2

要看什么匿名,如果是中心化的匿名,最终只能有限的保护我们的隐私,因为存在破解和攻击的可能,就连facebook的数据也被窃取过,所以中心化的可逆的加密保护是无法真正保护隐私的。

自从去中心化区块链流行起来,这项技术得到了快速的普及。区块链这种去中心化的单向加密的方式目前是无法破解的,除非私钥被盗。

我们看到的比特币被盗都是私钥被盗导致比特币丢失。不要误以为是区块链技术被破解。

所以,未来继续去中心化的区块链才是能够真正保护隐私的。

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章