基于CUDA平台的并行相似对搜索技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:tzhblyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似对搜索广泛应用于信息检索、数据挖掘、数据库等计算机科学领域,也是大量实际应用中的关键步骤,例如副本检测、协同过滤以及聚类等,因而得到深入研究。串行相似对搜索算法主要基于过滤策略减少查询对象的相似候选项。然而,随着相似性阈值减小,串行算法的性能严重降低。基于MapReduce或OpenMP的并行相似对搜索算法大多也采用过滤策略,因此也没有完全地解决这个问题。本文针对余弦相似度的相似对搜索问题进行了研究,提出了两种基于CUDA并行相似对搜索算法,主要工作如下:(1)基于CUDA架构设计了几种高维稀疏向量数据结构。本文提出了基于分段的前向表结构SFL(Segment-based Forward List),可以有效地实现内存合并访问;提出了倒排表结构CU-IL(CUDA-based Inverted List),避免了不必要的点积计算;结合上述两种数据结构,提出了一种混合型结构HSV(Hybrid Sparse Vector),可以在内存访问和点积运算之间取得一个折中。(2)提出并实现了一种新的基于CUDA架构的并行相似对搜索算法FCuAPSS。该算法基于前向表结构计算相似度,并使用共享内存优化算法性能。实验结果表明FCuAPSS取得了不错的加速效果,验证了共享内存优化方法的有效性。(3)为了克服FCuAPSS的缺点,提出并实现了一种混合结构的相似对搜索算法CuAPSS。CuAPSS结合向量对并行扫描和特征对并行扫描两种不同的方法,在向量的不同部分分别执行这两种方法。然后,本文提出针对参数p的调整方法,通过调整p,CuAPSS达到最优性能。实验结果表明CuAPSS取得了显著的加速效果,与CUDA库cuSPARSE相比CuAPSS取得14-85倍的加速比,与当前最优的并行算法相比CuAPSS能够达到1.5-23倍的加速比,而且在不同阈值下保持稳定的执行时间。
其他文献
本文介绍了火力发电厂凝结水泵采用一拖二变频控制的实现方案,详细介绍了凝结水泵变频运行时除氧器上水调节阀和变频器转速的控制逻辑,并对变频器控制参数进行了优化,实现了
首先对110kV智能化变电站的结构特点进行了简要介绍,然后详细分析了110kV智能化变电站建设中所用的一些关键技术.最后提出了如何对智能化变电站进行调试。
近年来,随着人民生活水平的提高和饮食结构的改变,脂肪肝的发病率在逐年升高。由于人们健康意识增强,注重健康体检以及检查手段的多样化,被发现的脂肪肝病人日益增多。早期发现,早
本文旨在概述热力发电厂监控系统如何科学配置和合理应用,并进一步阐述改进热力发电厂监控系统的意义,分析当前国内外发电厂监控系统运用现状,探讨如何提升热力发电厂监控系统的
介绍预应力钢绞线用AG80Cr热轧盘条的生产工艺。给出工艺控制要点:精炼时间不小于42 min;白渣保持时间不低于15 min;过热度控制在30℃以下;拉速2.1~2.3 m/min,拉速尽可能保持
本文对WCDMA网络技术的优势进行分析,并对WCDMA网络可以承载的网络应用及其市场前景进行了探讨。
我国会吸收成熟市场的经验,再考虑一些中国新兴资本市场特有的因素.来推出自己的创业板。让创业板成为融资者、投资者、监管者一同成长的资本平台
随着新医改的逐渐深入,新医改对医院政工干部的素质和工作能力提出了比以往更高的要求。对此,医院政工工作人员,要充分认清当前的新医改形势,积极开展政工干部素质培养工作。
为了解决城市发展中的人地矛盾,高层房屋建筑工程得以迅速发展。但是,由于高层房屋建筑层数较多,施工环境复杂,技术要求高等特点,在施工中存在着许多的风险,而且各种风险之间
随着医改政策的实施,医院思想政治工作已经成为一个重点,在新形势下如何加强医院思想政治工作已经成为当今社会研究的新课题。