基于哈希函数的相似性检索研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:gzmanman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的飞速发展,大量文献资料的堆积,如何快速有效地获取自己需要的文档数据,已经成为了迫切需要解决的问题之一。对于现今海量、高维的文档数据,传统的索引和检索技术已不能满足用户快速的检索需求,于是相对于注重综合检索结果的普通文档检索技术,提出了注重速度的哈希法快速文档检索技术。快速相似性检索技术是针对大规模文档数据的检索效率问题而产生的技术,其牺牲了检索精度从而使得检索速度大幅度提高的特性在海量文档检索应用中展现了良好的应用价值。其通过求解高维空间映射到低维空间的流形问题从而降低文档的维数,并利用高效率的哈希技术加速检索的匹配过程,使得用户能够快速定位自己需求的文档。针对快速相似性检索技术在建立索引的过程中会耗费大量计算资源及未充分考虑文档信息等问题,本文沿用语义哈希的思想,结合谱哈希索引技术,利用Markov网络强化文档间关系来获得更好的高维特征降维后的内嵌子空间,并通过剪枝技术减少索引技术中耗费的时间和空间复杂度,从而使得高维特征索引和检索能够快速和有效得执行。
其他文献
本系统在“十一五”国家科技支撑计划项目“西部民族地区电子农务平台关键技术研究及应用”的08课题支持下完成。论文以宁夏南部山区固原市原州区为研究区域,设计并实现了基于
随着互联网规模的不断扩大和业务类型的不断丰富,当今的网络体系结构已不能适应用户业务和网络规模的快速发展的需求。因此,一些新的网络技术被提出,例如,针对当今IPv4的不足提
无线传感器网络综合了传感器、嵌入式、分布式计算和无线通信等,是一种全新的信息获取和处理技术。它以其自组织性、灵活性、低成本、微型性等特点,广泛地应用于环境监测、工业
近年来,随着宽带通信技术的飞速发展,语音通信在有线通信领域占用的带宽几乎已不成问题了。但是在移动通信、卫星通信等无线通讯领域中,仍需要降低语音编码速率以节省带宽,加快传
随着互联网络的快速发展,WEB应用服务的安全问题日益严重。当前,基于误用检测技术为主的入侵检测系统出现了误用规则日益增多、处理数据量不断增大的情况。以致现有的检测系统
随着经济社会的发展和人类生活方式的转变,人们的生活节奏不断加快,由此带来了一系列健康问题,比如睡眠不足、营养过剩、缺乏体育锻炼和较强的工作压力等。人们在追求更高的
近年来,随着互联网的快速发展和日益普及,出现了很多新应用,包括高带宽多媒体应用,如音频/视频网络广播,网络视频会议,股票市场行情发放,大规模协同计算,远程教育等,由此引发了急剧的
电容层析成像技术(Electrical Capacitance Tomography,ECT)是过程层析成像技术的一个分支,可应用于工业密闭管道的多相流检测及精密测试领域的计量和分析。ECT具有成本低、
自OWL语言成为语义Web的标准以来,基于描述逻辑(DL)的本体在语义Web中迅速增多。目前语义Web中包含大量自主开发的本体,且本体的规模和复杂性也日益增大,如何对多个相互独立但有关