面向云环境的语义感知多关键词密文排序检索方法

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:t123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算技术的发展,越来越多的用户选择将自己的数据外包至云端以节约硬件和软件维护的成本。为了保护外包数据的隐私,数据拥有者必须在将数据上传之前对其进行加密。然而,对数据的加密会影响数据的可用性如进行排序检索,目前已有的明文排序检索方法不能直接应用到密文检索上,因此如何在文档中实施有效的可搜索加密是亟待解决的问题。目前,许多可搜索加密方法都采用了TF-IDF模型(词频-逆文档频率)。然而,TF-IDF模型忽略了用户检索关键词和文档之间的隐含语义特征,所以其返回的搜索结果可能不能满足用户真实的搜索意图。本文针对云环境下密文检索方法的语义缺失问题,采用了不同的语义模型和实现方案,提出了如下三个方法:(1)基于Doc2Vec模型的语义感知多关键词密文排序检索方法(DMRSE):该方法以Doc2Vec模型为基础,利用Doc2Vec模型提取文档集中的语义特征并生成文档对应的特征向量。该特征向量是一种相对低维的分布式表示,采用这种低维的特征向量本方法在检索时间消耗和空间消耗上有了显著提升。并且,本方法还可以支持针对密文的动态更新,大大提高了本方法的可用性。(2)基于LDA主题模型的语义感知多关键词密文排序检索方法(LDA-MRSE):该方法以LDA主题模型为基础,利用LDA模型提取文档集中隐含的主题信息并生成文档-主题矩阵和关键词-主题矩阵。LDA主题模型采用无监督学习方法,使得其更适合于云环境下的应用。为了进一步提升本方法的效率,提出一种基于完全二叉树的索引,可以将检索时间消耗降低至亚线性级。(3)基于LDA主题模型关键词提取的改进方法(LDA-ESSS):该方法为了进一步提高LDA-MRSE的检索精度,利用主题信息对文档集进行关键词提取,并将原主题向量扩展以保存提取的关键词信息。本方案改进了原方案检索时关键词信息缺失问题,实验表明,本方案可以提高语义检索精度,并同时实现更高的排序隐私和较高的检索效率。
其他文献
随着抗生素和抗癌药物的普遍使用而带来的细菌/肿瘤耐药性问题,一直是困扰着人们的一个难题。开发出一种高效低毒,作用范围广,不易产生耐药性的新型药物迫在眉睫。抗菌肽具有
目的:分析局部晚期直肠癌患者治疗前肠道菌群的组成,探讨不同菌群构成对直肠癌患者放射治疗过程中出现下消化道反应时间的影响。方法:收集2017.12-2018.7期间30个治疗前直肠
风能是21世纪世界各国大力发展的绿色、可再生能源。我国近海风电资源十分丰富,海上风电事业发展迅速。其中超大直径单桩基础作为被最广泛应用的风机基础形式,具有极大的发展潜力和空间。超大直径单桩基础在服役期间受到风、浪等动荷载的共同作用,在此情况下对其进行瞬态动力学分析将具有明确桩基受荷性状、检验桩基稳定性和指导优化实际施工的重要意义。以江苏省如东县某近海区域的水位地质条件为基础,运用有限元模拟软件AB
电磁层析成像(Electromagnetic Tomography,EMT)技术是一种新兴的无损检测技术,具有非侵入和非干扰性介入的电磁成像特性。它基于电磁感应原理,是通过电学手段对目标场域进行激励与检测,再利用检测信息进行成像。可以通过获取检测区域的电导率和磁导率分布,并根据采集的感应电压进行电磁特性分布的重建。它有着巨大的潜在应用空间,可用于工业过程监控和生物医学检测等。由于传感器阵列对成像的
混沌序列作为一种特性良好的伪随机序列,近年来已经得到了广泛并深入的研究,混沌具有初值敏感、有界、非周期等特性,让它在加密、通信等领域中深受重视。传统的数字混沌序列
知识实践是社会学研究的一个重要组成部分。为了探索知识实践的深层指导原则,社会学家Karl Maton主要立足于伯恩斯坦的语码理论和知识结构理论提出合理化语码理论。该理论有五个维度,其中的语义维度是与系统功能语言学家合作的成果。其中的语义波与知识累积建构有着密切的联系,并指出语义波的形成主要凭借“语义引力”和“语义密度”两大要素。语义波理论推动了话语意义研究,但其应用尚处在初期发展阶段,理论框架仍有
随着城市化的加速,客运车站作为城市交通的重要组成,然而随着城市用地的越来越紧张,全国已有多个城市建造了多层立体客运车站。所谓多层立体客运车站就是摒弃“前站后场”式的单层发车、横向展开的客运模式,将停车场和发车点设置在建筑物内部的一种新型形式。这种新型形式的优势在于多层同时发车、功能层层叠加,同时能够结合基地的高差,合理安排停车位和发车位,可解决需求规模大和用地面积小的矛盾。此类结构形式对于改善旅客
二维纳米材料如石墨烯和二硫化钼,最近在生物医学应用领域引起了广泛关注。人们对二维纳米材料的生物安全性也日益关注。因此,加深对二维纳米材料和蛋白质相互作用机理的理解
过渡金属催化惰性碳氢键官能团化反应,是实现碳-碳与碳-杂键最高效最直接的方式,其具有绿色、原子经济性等优点,因此吸引了广大科研工作者的关注。近十几来,碳氢键官能团化反
本文考虑带跳随机系统的线性二次控制问题,控制系统为带跳的线性随机微分方程,代价泛函是二次的。我们研究了带跳线性二次控制问题的最大值原理、Riccati方程和动态规划原理