大数据是我的主要研究方向之一,同时也在带大数据方向的研究生,所以我来一下这个问题。
首先,大数据主要关注的是群体而不是个体,所以在大数据记录个人信息的同时会自然对个人数据形成一个有效的应用边界,从这个角度来看,大数据对个人隐私的威胁是有限的。随着一系列相关规定和技术的发展,未来大数据对于个人隐私的采集和应用都将越来越规范。
所谓大数据“窥探”用户的隐私,通常是从数据采集开始的,数据采集目前有三个主要的渠道,包括传统信息系统(各种ERP)、Web系统(包含App)以及物联网系统(包含视频记录)。传统信息系统的应用领域比较广泛,包括教育机构的信息系统、医疗机构信息系统、政务机构信息系统、办公系统等等,虽然这些信息系统记录了大量的个人隐私数据,但是由于应用边界非常明确,所以总体上是安全的。
可能会导致个人隐私出现问题的领域目前主要集中在Web系统,以及各种移动应用(App)。随着web2.0和移动互联网的发展,个人通过互联网能够完成的操作越来越多,与线下的结合也越来越紧密,所以Web系统会记录用户大量的消费信息。
由于各大互联网平台都积累了大量的用户数据,所以目前互联网企业也是推动大数据技术发展的重要力量,因为互联网企业既有技术能力同时也拥有数据,所以在大数据时代,互联网公司拥有了天然的竞争优势。得益于大数据技术的推动,人工智能技术也获得了发展。所以,用户在使用互联网的同时,自身的数据也驱动了技术的发展。
大数据时代,后台会根据用户的相关信息和行为,生成用户画像。算法会根据用户画像推测用户的性别、年龄、职业、学历等常规信息,还可以推算出用户的爱好、消费习惯、目前状况等等隐性信息。
举几个搜索相关的简单例子:
1. 某人最近经常淘宝搜索孕妇相关商品,经常查询养身信息,很容易就推算出这是一个很注重养身的准妈妈,然后后台就会推送一些相关产品。
2. 某人最近经常搜索的手游,足球,论文,招聘信息,那么这个大致就是一个即将毕业的“大四狗”。。。
当然目前还不止这些,现在大数据收集的越多,算法越先进,未来个人隐私将无处可藏!