题名动态社会网络数据发布个性化隐私保护方法研究
作者毕晓迪
答辩日期2017-05-26
文献子类硕士
授予单位中国科学院研究生院
授予地点北京
导师梁英
关键词动态社会网络 隐私保护 个性化 匿名规则 K-匿名
学位专业其它专业
英文摘要“社会网络”是指社会个体成员之间因为互动而形成的相对稳定的关系体系,关注的是人们之间的互动和联系。近年来,新浪微博、Facebook、QQ空间等综合社会应用得到用户的青睐,成为人们沟通交流、获取信息和展示自我的重要途径之一。除了这些典型的社会网络,与我们日常的工作和学习密不可分的邮件收发网络、论文合作网络、电话接听网络等也属于社会网络,同样有着个体之间的交互。用户在社会网络中的活动产生了庞大的数据,这些数据通常被称为社会网络数据。近年来,随着社会网络的发展,数据泄露事件频发;同时,大数据挖掘的广泛应用,造成社会网络公开发布的数据和泄露的数据进一步暴露隐私,用户隐私面临威胁。 目前,社会网络中用户个性化隐私保护主要针对单实例发布的静态网络,即数据发布后不再进行任何改变,不能适应具有高度动态性的社会网络的更新迭代过程。比如,攻击者可以根据2次单实例匿名的社会网络分析出社会网络图中结点的度信息变化,结合其背景知识进行分析,获取用户隐私。其次,用户的个性化隐私保护方案较少,难以满足数以亿计的社会网络用户的隐私保护需求,用户偏好设置上只考虑了用户隐私保护程度这一单一的偏好,忽略了用户发布的社会网络数据可用性。因此,开展动态社会网络隐私保护方法研究,满足用户的个性化隐私保护需求,同时确保数据的可用性变得非常重要。 本文开展动态社会网络数据发布个性化隐私保护研究,定义了数据保护个性化模型,支持隐私保护强度与数据可用性2种隐私偏好,提出基于匿名规则的图数据隐私保护方法与基于隐私偏好的二次匿名位置属性隐私保护方法。使用新浪微博数据和SNAP公开的某研究机构邮件收发数据进行验证,对数据安全性和可用性相关指标进行了评估,实验结果表明本文方法兼顾了用户隐私保护和数据的可用性的个性化需求。论文的主要贡献包括以下几个方面: 1. 提出了一种动态社会网络数据发布隐私保护个性化模型 隐私保护个性化模型从用户的角度出发,定义了隐私偏好,描述用户个性化隐私保护需求,兼顾隐私保护和数据可用性的平衡。用户隐私保护级别计算,包括一致性判断、互斥性判断和隐私偏好融合。根据隐私保护级别进行隐私保护参数计算,如时间窗口、匿名阈值、匿名距离等,支持不同隐私保护方法的个性化参数计算,支持社会网络好友分组信息映射。为动态社会网络数据发布中的个性化隐私保护方法奠定基础。 2. 提出了一种基于匿名规则的动态社会网络图数据隐私保护方法 针对社会网络数据发布的动态性与不安全性,为避免使用不同时刻的社会网络数据进行关联攻击,兼顾结点属性多样性,提出了一种图数据隐私保护方法。根据匿名规则进行结点聚类,求解当前时刻的匿名图,保证同一个匿名集中结点属性多样性最大的前提下,数据发布后的结点属性与边的泄露的概率均小于1/k。之后生成相邻时刻数据关系图的差集,结合当前时刻的匿名图,删除前序时刻不存在的结点与边,对已发布数据进行逆向更新,保证不同时刻下的匿名图具有相似的图结构,抵御关联攻击。 3. 提出了一种基于隐私偏好的二次匿名位置属性隐私保护方法 针对社会网络中签到功能的位置隐私泄露问题,利用社会网络已有的好友分组信息设置隐私偏好,生成具有不同隐私保护强度的分组可见的匿名签到位置,代替用户真实位置。首先,利用用户对不同好友分组设置的隐私偏好,计算隐私偏好等级,确定该级别k值,结合用户历史位置信息求解k-1个匿名点,使k匿名集中的点具有最大概率相似性;在此基础上使用差分隐私技术进行二次匿名,分别计算好友分组匿名签到位置,使不同分组的好友看到不同签到位置,既保护了位置隐私又确保签到位置可用。
语种中文
学科主题计算机应用
公开日期2017-06-20
内容类型学位论文
源URL[http://ictir.ict.ac.cn/handle/311040/2581]  
专题中国科学院计算技术研究所学位论文_2017硕士
推荐引用方式
GB/T 7714
毕晓迪. 动态社会网络数据发布个性化隐私保护方法研究[D]. 北京. 中国科学院研究生院. 2017.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace