关于负调查的若干问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：goonesownway

【摘要】

：

随着互联网的发展，数据安全和隐私保护的重要性越来越明显。信息的负表示是一种新的很有前景的数据安全和隐私保护方法。负调查就是在信息负表示思想的基础上提出的。这种调查

【作者】

：

包亚飞

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2013年期

【关键词】

：

数据收集方法隐私保护负调查 NStoPS-Ⅱ算法数据安全

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的发展，数据安全和隐私保护的重要性越来越明显。信息的负表示是一种新的很有前景的数据安全和隐私保护方法。负调查就是在信息负表示思想的基础上提出的。这种调查方法能在收集数据的同时有效保护用户的隐私，特别适合用于敏感数据的收集。　　负调查所收集到的是部分负类别信息。如何将收集到的负调查结果转化为正调查结果，对结果的可信度进行评估，负调查中类别数与可信度之间的关系等都是负调查中的重要问题，也是本文的的主要研究内容。具体而言，本文的工作主要包括以下几个方面。　　 (1)提出新的更加合理的由负调查结果估算正调查结果的方法。已有的由负调查结果估算正调查结果的方法并不完善，有可能计算得到包含负值的正调查结果。本文提出了两种新的由负调查结果估算正调查结果的算法:NStoPS-Ⅰ算法和NStoPS-Ⅱ算法。两种算法各有优缺点，NStoPS-Ⅰ算法可扩展性更强，不仅适用于普通负调查，还能用于高斯负调查等负类别被选概率服从任意分布的负调查。NStoPS-Ⅱ算法并不能直接用于负类别被选概率服从任意分布的负调查，但是计算效率更高。所提出的两种算法均不会得到包含负值的不合理的结果。通过模拟实验将本文中提出的两种算法和已有的方法进行了比较，发现所提出的两种算法所得结果一致，并且比已有方法更加接近原始正调查结果，更加准确合理。　　 (2)提出负调查结果的可信度计算方法。本文通过分析正调查结果给定时可能的负调查结果的分布，得到了给定负调查结果时正调查结果的分布规律，然后在此基础上给出了负调查结果的可信度计算方法。由于给定负调查结果时正调查结果的分布并不对称，本文提出了计算最小置信域的一个贪心算法。实验方面，本文通过模拟实验分析了不同分布和参加调查人数对负调查可信度的影响。此外，当参加调查人员愿意提供更多信息时，可采用多选负调查，本文也对多选负调查结果的可信度计算方法作了讨论。　　 (3)考虑到类别数是设计负调查时需要考虑的重要参数，本文从实验角度对类别数与负调查结果的可信度之间的关系进行了分析。模拟实验的结果表明，当类别数增加时，负调查结果的可信度并不是一定增加或一定降低。　　负调查作为一种新的数据收集方法，并不直接收集用户的原始真实信息，特别适合用在敏感数据的收集上。如何根据收集到的负调查结果估算正调查结果，对结果的可信度进行评估，以及负调查类别数与可信度之间的关系，都属于负调查中的核心问题。为此，本文提出了更加完善合理的估算正类别分布的算法，对负调查结果可信度的进行了评估，并用模拟实验进行了分析和验证，对负调查的应用有重要的指导意义。

其他文献

面向闪存存储系统的缓冲区管理与存储管理研究

闪存首先由东芝公司于1984年提出，此后因特尔公司和日立公司相继推出其产品。闪存由于性能更好、体积小、抗震以及低功耗等优良特点已广泛应用于移动设备和嵌入式设备，随着其容

学位

闪存缓冲区算法存储管理空间利用率地址映射映射方式

基于SSI的船舶机务管理信息系统的设计与实现

红我国加入WTO以后,国内的航运需求增长很快。为了保证航运的正常进行,航运企业每天都要处理大量的信息,传统的凭个人经验决策的方法已不能满足现代航运业发展的需求,实现船

学位

船舶机务管理系统J2EEMVCStruts2SpringiBATIS

分布并行字符串相似性连接方法研究与应用

相似性连接是数据挖掘分析领域的基础操作,在数据清洗、生物信息学和信息集成等众多领域有着广泛的应用意义。相似性连接处理的数据类型一般包括字符串、集合、向量和图等类

学位

字符串相似连接编辑距离分布式计算Spark

面向STEP的产品信息本体可视分析研究与实现

随着计算机技术的不断发展和集成化趋势日益明显,企业的信息平台结构逐渐从客户/服务器方式向语义Web的方向发展。使用本体的概念来表达产品数据信息已经得到了验证并且产品

学位

语义可视STEPOWLHSM本体

基于密度聚类和投票判别的三维数据去噪方法

三维扫描技术被广泛使用在逆向工程、文物保护、工业生产、刑事侦查、三维传真等领域。点云数据就是指由扫描得到的以点的形式记录的数据,每一个点对应一个三维坐标。三维扫

学位

点云数据异常点检测基于密度聚类投票判别算法

基于NS2的NODV路由协议的改进研究

随着现代移动通信网络的发展进入了一个新阶段，移动通信网络除了满足用户的数据高速传输外，还需要未来的网络具有灵活性、适应性等特性。无线自组织网络(AdHoc)是一种自创造、

学位

Ad Hoc网络AODV路由协议拥塞跳数服务质量技术改进

社交网络中基于概率的可伸缩聚类算法研究

社交网络作为一个新兴事物正被越来越多的人所接受,其发展到今天已经与我们的生活息息相关。过去几年里,人们只是把“社交化”加在媒体、游戏等前面进行大肆宣传,所以现在我

学位

社交网络图聚类降维位置敏感哈希算法统计推断

车牌识别系统的关键技术研究

车牌识别技术(LPR, License Plate Recognition)是智能交通系统(ITS)中的重要技术之一。本文对车牌识别系统中涉及的关键技术进行研究与探讨,并给出有效的解决方法。车牌定位

学位

车牌识别边缘特征字符轮廓八方向梯度特征敏感区域二义识别

基于视频序列的人体检测和跟踪技术研究

本文主要研究了基于视频序列的人体检测和跟踪技术,该技术能够应用在智能监控,人体动作分析,人机交互,基于内容的视频检索以及智能驾驶系统等领域中,其涉及到模式识别、人工

学位

运动目标检测人脸识别人眼识别人体检测人体跟踪

基于NMEA 0183的GPS导航轨迹恢复技术研究

由于GPS设备能够提供定位、导航和路线规划等多种实用功能,它已经成为人们出行生活中必不可少的电子设备。与此同时,这也更突显出GPS设备所携带的数据的重要性。对于取证工作

学位

GPS设备取证GPS轨迹恢复NMEA 0183文件雕复数据恢复

关于负调查的若干问题研究

与本文相关的学术论文