面向移动数据安全发布的位置模糊化方法研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:huangy3874308
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,数据作为新兴的生产要素,正在深刻影响着人民的生活方式与国家经济社会的发展。与此同时,数据的深度融合与应用衍生出的数据安全威胁和隐私保护问题,也越来越引起国家与社会大众的关注。2020年7月,第十三届全国人民代表大会发布了《中华人民共和国数据安全法(草案)》,填补了我国数据安全领域一直以来的立法空白,也彰显出国家对数据安全与数据隐私保护的关注和重视。随着全球定位系统(GPS:,Global Position System)和全球移动通信系统(GMS,Global System for Mobile Communication)的发展,人们所在的地理位置被越来越多地记录与保存,产生了大量的位置数据。以位置数据为首的移动大数据在路线导航、兴趣点推荐、城市规划、交通管理等许多方面都有广泛的应用,极大地提升了人民的生活质量和国家的治理水平。为了更好地利用移动数据,深入探索其中的价值,移动数据的收集商在获得用户许可的前提下可能会将位置数据发布。为了避免隐私泄露,数据收集商在发布位置数据时会将对应的用户标识信息脱敏或者直接去除。但是已有研究表明,即使在发布时去除用户标识信息,隐私攻击者仍可以通过对比发布数据和自有数据的重叠部分推测出数据背后的真实用户,脱敏数据仍存在严重的隐私威胁。因此,位置数据发布之前一般还需经过相关隐私保护方法的处理,其中最常用方法是对原始位置数据进行模糊化处理。位置模糊化的主要思想是用更低精度的、泛化的位置代替原始的精确位置。为了在保证数据隐私的同时保留数据效用,随意地模糊化是不可取的。因此,如何设计出一个有效的位置模糊化方法成为了研究者们关注的重点。先前的研究中,移动数据的位置模糊主要从两个角度出发:位置和轨迹。基于位置的方法将研究重点放在单个位置点的隐私保护效果,忽略了位置移动的序列关系。基于轨迹的方法将轨迹内位置的时空相关性纳入考虑,保护整条轨迹的隐私,但是往往需要高昂的计算成本。由此,本文创新地提出了一个折中的思路:在基于位置的模糊化方法中加入对位置间时空移动模式的保护,设计出一种面向移动数据安全发布的位置模糊化方法。首先,本文设计指标对位置移动时空序列关系的隐私进行衡量。具体地,统计位置序列中某位置与其所有可能的下一位置,称为移动模式。计算不同移动模式出现的数量,并基于香农信息熵的思路,改进设计出一步流量熵指标,对位置移动模式的不确定程度进行衡量。其次,本文设计出了一个基于k-means聚类的位置模糊化方法——“匿名地图”算法。匿名地图算法在保证位置隐私约束的同时,也能对位置的移动模式的隐私性加以改善。并且,根据位置隐私问题场景的特点,本文对匿名地图算法的初始化簇中心和更新簇中心两个组件进行改进。设计出兼顾簇中心间距离和周围位置密度的密度k-means++初始化方法,和使用区域最大、最小经纬度的均值作为新簇中心的更新方法。最后,本文在真实数据集上进行了充分的实验以验证模型的有效性和稳健性。实验中,本文分别对匿名地图组件的运行效率和匿名地图算法的隐私保护效果进行衡量,并设置了不同自定义参数水平下的对比实验。实验结果表明,在不同的参数设置下,本文提出的方法在隐私保护效果与运行效率方面都能明显优于基准模型。
其他文献
可再生能源,特别是光伏发电的广泛应用将成为能源供给发展主流与现实。纵观全球光伏市场,每年光伏新增装机容量增速稳定,新兴市场数量、规模与日俱增。我国光伏累计装机容量已连续5年位于全球首位,行业整体发展趋势向好。当前光伏政策正处于补贴退坡、平价上网的发展时代,投资者面临着更为严苛的投资环境。因此,寻求提升光伏发电经济性能的有效途径是当前亟待解决的科学问题。度电成本,作为国际上衡量光伏发电经济性的重要指
学位
信用违约互换(CDS)是买卖双方关于一个信用事件或信用违约是否发生的交换现金流的双边金融协议。当合约双方中的一方违约时,CDS协议可能在到期日或信用事件发生之前提前终止的风险被称为交易对手信用风险。近年来,随着金融市场中的违约事件和突发事件频繁出现,信用风险己成为金融风险中的一个重要组成部分。因此,对信用风险建立相应的数学模型,并开展深入探讨显得十分迫切和有意义。本论文介绍了2类CDS定价的关键模
学位
海运集装箱运输是当今全球最普遍、主流的运输方式之一。获取较好的物流运费对于相关公司机构的管理部门意义重大。本文将研究集装箱运价中的拼箱价格会受到哪些因素的影响,并尝试获取一个预测性的模型,来帮助相关人士进行运价预测。在此选用海运拼箱价格进行研究,其影响因素与整箱类似,而且其价格更具综合性。论文在介绍了上海发往美国本土目的地的拼箱航运相关内容后,采用了灰色关联分析、多元线性回归分析和时间序列分析三种
学位
在互联网高速发展的时代,我们在移动设备上消费是个再正常不过的场景,电商企业现在对于利用营销手段获客,吸引用户进入平台已经不是一件难事,但是由于电商平台竞争激烈,用户选择越来越多,如何在短暂的,碎片化的时间内,使得用户快速对平台内商品激发兴趣,提高用户在电商平台的活跃度,保持长周期的用户留存,并使用户形成消费习惯,成为了电商企业的重大挑战。现在越来多的企业在自己的电商平台引入个性化推荐模块,来提高用
学位
近些年来,随着电子商务产业的持续快速发展,我国快递业务量连续六年位居世界第一,与此同时,我国的主要快递公司已经投入了很大的资金在转运中心的建设上,目前头部的几家快递公司的转运中心,已经具备了相当高的自动化水平,但是,由于末端的需求分散,并且路况复杂,因此在末端取件和派送的过程中,都需要大量的快递员进行取件和派件,但是由于劳动力人口的下降以及快递公司末端的成本压力,快递员的从业数量无法保持与快递业务
学位
新中国已经走过波澜壮阔的70年,如今,中国GDP总量已经跃居全球第二,人均GDP已超过万美元的大关。在中国经济急速发展,取得如此成就的同时,也带来了诸多的社会问题,如雾霾遮天,贫富差距悬殊等,这些问题都为将来经济的健康发展埋下了隐忧。在习近平新时代中国特色社会主义思想的指导下,我国经济要由高速增长阶段转向高质量发展阶段,而各种社会问题的解决,就变得尤为重要。近年来,各种解决社会问题的理论研究层出不
学位
云时代的到来,互联网已经不仅仅是一个单纯靠流量取胜的门户时代,随着社交网络平台快速发展,网络是一个人人都可参与创建内容、发表观点和交流意见的互动平台。这些可以是对某个产品或者服务的评论,也可以是对某个热点事件或人物的观点等。对于个人而言,在购买某样物品或者“种草”某家店铺之前,会浏览相关的评论、讨论;对于企业而言,可以对网上的评价信息进行收集与分析,不仅可以建立与维护自身的形象,还可以根据客户趋势
学位
户外广告贯穿了人们生活的每个场景。户外广告不仅可以对于受众进行全方位的触达,更是可以通过不同场景中特有的媒介进行营销活动及广告内容的延展。户外媒体作为历史最悠久的一种媒体表现形式,在互联网时代的发展并不是那么顺遂。互联网广告强交互性及精准性正在让线下广告逐渐失去光彩。在过去的几年中,线下广告的市场规模一度出现了负增长,直到户外广告不断蓄力并将户外广告的整体规模拉回正常增长轨道。程序化广告交易技术诞
学位
党的十九大报告指出:“完善公共文化服务体系,深入实施文化惠民工程,丰富群众性文化活动”。公共图书馆是基层文化惠民的主阵地,在完善公共文化服务体系、建设学习型社会中发挥着不可替代的作用。然而公共图书馆都面临着图书逾期归还率高的现象,这种现象严重削弱了图书馆的信息资源共享的职能,损害了大多数读者的阅读权利。以上海市公共图书馆的数据为例,2018年所有图书馆的图书逾期归还比例高达16.91%,其中区县级
学位
随着大数据时代的到来,越来越多的企业开始利用数据驱动的方式做出智能决策。然而现实生活中数据往往会出现缺失、偏差、过时等因素导致传统方法做出的决策风险过高。未解决不确定环境下决策问题,为此鲁棒优化应运而生。与随机优化不同,鲁棒优化不假设数据分布情况,并做出保守决策使得在最差情况仍然能保持目标收益。鲁棒优化的求解技巧不仅可以应用在诸多管理案例中,也可以应用到概率不等式上下界的求解过程中。本研究针对概率
学位