曹丽娟制图
■本报记者 武晓莉
随着大数据的深入发展,国内外对数据资源的需求越来越迫切,数据脱离最初收集者,并在不同组织之间的流通是大势所趋。当前,数据流通发展过程中可能面临的隐私安全、数据滥用、标准缺乏等问题十分严峻。对于互联网用户来说,数据的收集、流通过程完全是一个“黑匣子”。
工业和信息化部日前召开了大数据行业组织对接座谈会,将在全国范围内开展大数据企业调查。这次的调查摸底,正是为了加强对数据流通企业的社会监督,打破数据流通的“黑匣子”,让企业公开披露数据采集、管理、流通等环节的信息。在不断加强行业自律的基础上,引导行业建立依法合规、阳光透明的流通规范,保护广大网民的隐私和其他合法权益。
数据收集泄露个人信息
前几天,记者接到一个投诉。北京的宋先生收到一个短信,称其建行卡积分快过期了需要兑换。短信中对其姓名、卡号等情况均知晓,而宋先生前阵子也的确查过积分。于是,工作忙碌的他毫不怀疑地在手机上按提示进行了操作。几分钟后,他的卡在云南被分两次划走了将近2万元。
美国某公司曾公布匿名处理过的、三个月内的部分搜索历史,供人们分析使用。虽然搜索用户个人的相关标识信息被精心处理过,但通过其中某些记录项,还是可以准确地定位到具体的个人。《纽约时报》随即公布其识别出的一位62岁的寡居妇人,并分析出她家里养了三条狗,并患有某种疾病。
如今,数据的收集、处理和交易已经非常频繁,而个人隐私的保护也受到了空前的技术挑战。相关非法收集、使用的案例层出不穷,互联网用户的个人名誉、财产等安全受到极大危害。基于此,对数据交易的规范已经刻不容缓。
中国信息通信研究院韩涵博士说,目前,基于大数据对用户的行为特征进行分析并得出用户偏好的营销行为已经广泛开展,数据隐私保护问题极其突出。据据美国Verizon公司今年4月发布的《2015年数据泄露调查报告》统计,仅2014年全球95个国家就发生了近8万起数据泄露安全事故,涉及上亿个记录。
2016年8月,山东考生徐玉玉因为隐私泄露导致被诈骗后身亡的事情也在社会上引起了热议。
数据流通活力与风险并存
中国信息通信研究院闫树博士认为,数据流通是指数据从最初收集的主体转移到另外一个主体的过程,以货币换取数据的行为称为数据交易。数据资源的流动性和可获取性是大数据应用和产业发展的基础。近3年来,数据流通行业在我国从无到有,目前数据交易所的数量已经超过15家。
据韩涵介绍,随着大数据行业的深入发展,国内外对数据资源的需求越来越迫切,数据脱离最初收集者并在不同组织之间的流通是大势所趋。我国从2015年开始开展面向应用的数据交易市场试点,探索开展大数据衍生产品交易,鼓励产业链各环节的市场主体进行数据交换和交易,促进数据资源流通。当前我国大数据企业发展势头良好,在大数据资源建设、大数据技术、大数据应用领域涌现出一批新模式和新业态。
但无论国内还是国外,大数据行业在发展过程中始终是活力与风险并存的。
瞭望智库相关研究人员表示,大量事实表明,如果不能妥善处理大数据的安全问题,将对用户的隐私造成极大的危害。一些网络运营商和企业将收集而来的数据信息进行大数据分析,分门别类地整理后销售给他人,在为自己牟取巨大利益的同时,也给用户带来了巨大的安全隐患。“上述这些隐私泄露问题,加剧了公众对数据流通与数据交易的不信任感。”韩涵说,数据隐私问题得不到解决,数据流通市场就存在致命缺陷。
把数据“黑匣子”置于阳光下
美国联邦调查委员会发布的报告认为,积累数据的方法和具体搜集的数据内容全都在数据交易平台的“黑匣子”里,人们很难意识到自己的信息被如何存储和利用,以及隐私如何被破坏。虽然数据流通本身并不对其所采集信息的每一个人产生直接影响,但这种行为本身应当是为用户所知悉并且许可的。
因此,建立健全数据资源交易机制和定价机制、规范交易行为等一系列健全市场发展机制的举措,是将数据“黑匣子”置于阳光下,充分保障网民的隐私权、知情权的重要手段。
严峻的现实使得我国数据流通行业需得到尽快的规范。今年全国两会期间,全国人大代表邵志清就提出议案,呼吁制定“大数据法”。可以说,规范数据的共享开放和交易流通已经刻不容缓。
闫树和韩涵都认为,需要正确认识数据流通与数据保护的重要性。虽然数据流通行业往往不可避免地要涉及个人数据甚至用户隐私,但对于用户个人数据的保护是基础和前提,数据流通行业的发展不能以泄露用户隐私为代价;对于那些不敏感的数据,经过去特征化、匿名化、脱敏、分类、归总等规范的手续流程后,应予以流通许可。通过对个人数据做好分类规范,按照对个人权益的影响程度、影响方式等进行相应的行为规范确定,在数据收集、使用等环节明确规则,清晰界定网络平台的义务等,力争达到个人数据保护与促进信息自由流通的平衡。
据了解,随着2016年《数据流通行业自律公约》的发布,我国大数据领域的数据安全已经形成初步规范并达成行业共识。目前,在工信部的指导下,中国信息通信研究院正在进行大数据全产业链调查行动,通过线上线下并行的方式,对全国大数据企业的数据采集、管理、流通情况进行摸底,以期对下一步的规范工作提供依据。