关于负调查的若干问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:goonesownway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,数据安全和隐私保护的重要性越来越明显。信息的负表示是一种新的很有前景的数据安全和隐私保护方法。负调查就是在信息负表示思想的基础上提出的。这种调查方法能在收集数据的同时有效保护用户的隐私,特别适合用于敏感数据的收集。   负调查所收集到的是部分负类别信息。如何将收集到的负调查结果转化为正调查结果,对结果的可信度进行评估,负调查中类别数与可信度之间的关系等都是负调查中的重要问题,也是本文的的主要研究内容。具体而言,本文的工作主要包括以下几个方面。   (1)提出新的更加合理的由负调查结果估算正调查结果的方法。已有的由负调查结果估算正调查结果的方法并不完善,有可能计算得到包含负值的正调查结果。本文提出了两种新的由负调查结果估算正调查结果的算法:NStoPS-Ⅰ算法和NStoPS-Ⅱ算法。两种算法各有优缺点,NStoPS-Ⅰ算法可扩展性更强,不仅适用于普通负调查,还能用于高斯负调查等负类别被选概率服从任意分布的负调查。NStoPS-Ⅱ算法并不能直接用于负类别被选概率服从任意分布的负调查,但是计算效率更高。所提出的两种算法均不会得到包含负值的不合理的结果。通过模拟实验将本文中提出的两种算法和已有的方法进行了比较,发现所提出的两种算法所得结果一致,并且比已有方法更加接近原始正调查结果,更加准确合理。   (2)提出负调查结果的可信度计算方法。本文通过分析正调查结果给定时可能的负调查结果的分布,得到了给定负调查结果时正调查结果的分布规律,然后在此基础上给出了负调查结果的可信度计算方法。由于给定负调查结果时正调查结果的分布并不对称,本文提出了计算最小置信域的一个贪心算法。实验方面,本文通过模拟实验分析了不同分布和参加调查人数对负调查可信度的影响。此外,当参加调查人员愿意提供更多信息时,可采用多选负调查,本文也对多选负调查结果的可信度计算方法作了讨论。   (3)考虑到类别数是设计负调查时需要考虑的重要参数,本文从实验角度对类别数与负调查结果的可信度之间的关系进行了分析。模拟实验的结果表明,当类别数增加时,负调查结果的可信度并不是一定增加或一定降低。   负调查作为一种新的数据收集方法,并不直接收集用户的原始真实信息,特别适合用在敏感数据的收集上。如何根据收集到的负调查结果估算正调查结果,对结果的可信度进行评估,以及负调查类别数与可信度之间的关系,都属于负调查中的核心问题。为此,本文提出了更加完善合理的估算正类别分布的算法,对负调查结果可信度的进行了评估,并用模拟实验进行了分析和验证,对负调查的应用有重要的指导意义。
其他文献
闪存首先由东芝公司于1984年提出,此后因特尔公司和日立公司相继推出其产品。闪存由于性能更好、体积小、抗震以及低功耗等优良特点已广泛应用于移动设备和嵌入式设备,随着其容
红我国加入WTO以后,国内的航运需求增长很快。为了保证航运的正常进行,航运企业每天都要处理大量的信息,传统的凭个人经验决策的方法已不能满足现代航运业发展的需求,实现船
相似性连接是数据挖掘分析领域的基础操作,在数据清洗、生物信息学和信息集成等众多领域有着广泛的应用意义。相似性连接处理的数据类型一般包括字符串、集合、向量和图等类
随着计算机技术的不断发展和集成化趋势日益明显,企业的信息平台结构逐渐从客户/服务器方式向语义Web的方向发展。使用本体的概念来表达产品数据信息已经得到了验证并且产品
三维扫描技术被广泛使用在逆向工程、文物保护、工业生产、刑事侦查、三维传真等领域。点云数据就是指由扫描得到的以点的形式记录的数据,每一个点对应一个三维坐标。三维扫
随着现代移动通信网络的发展进入了一个新阶段,移动通信网络除了满足用户的数据高速传输外,还需要未来的网络具有灵活性、适应性等特性。无线自组织网络(AdHoc)是一种自创造、
社交网络作为一个新兴事物正被越来越多的人所接受,其发展到今天已经与我们的生活息息相关。过去几年里,人们只是把“社交化”加在媒体、游戏等前面进行大肆宣传,所以现在我
车牌识别技术(LPR, License Plate Recognition)是智能交通系统(ITS)中的重要技术之一。本文对车牌识别系统中涉及的关键技术进行研究与探讨,并给出有效的解决方法。车牌定位
本文主要研究了基于视频序列的人体检测和跟踪技术,该技术能够应用在智能监控,人体动作分析,人机交互,基于内容的视频检索以及智能驾驶系统等领域中,其涉及到模式识别、人工
由于GPS设备能够提供定位、导航和路线规划等多种实用功能,它已经成为人们出行生活中必不可少的电子设备。与此同时,这也更突显出GPS设备所携带的数据的重要性。对于取证工作