一种基于主存Δ-tree的高维数据KNN连接算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:octaaug
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KNN连接作为数据挖掘的基元,可以用来大幅度提高相似搜索、数据分析和数据挖掘的速度.到目前为止,对KNN连接的研究主要在基于磁盘系统的背景下进行,假设数据库太大以至于不能装入主存.随着RAM越来越大,价格也越来越低廉,这种假设逐渐受到挑战.因此,有必要重新对基于主存的KNN连接进行研究.在高效主存索引的基础上,采用编码解码、自底向上、深度优先遍历和剪枝等技术提出了一种新的KNN连接算法Δ-tree-KNN-Join.该算法解决了KNN连接中确定搜索半径困难的问题,提高了连接效率.在真实数据和合成聚类数据上
其他文献
This paper describes in detail the composition, characteristics, the application of GPON mode and the networking scheme, and introduces the application of GPON
在无线传感器网络中,蚁群算法构建的路由容易出现能量洞,影响网络的寿命和整体性能.所以提出了BEACO算法.主要思想是将下一跳的选择抽象成为基于最短路径和最小费用流的组合
根据相关工程实践和研究,总结和分析了UEA防裂机理和实际功能,使用混凝土微膨胀剂的缺点较多,在使用过程中尽量少用或不用混凝土微膨胀剂,而通过加强施工管理和养护,并采用非早强
社会对FPGA人才的需求量巨大,国内的独立学院通信电子类专业相继开设了FPGA/CPLD技术的相关课程。文章就独立学院开设FPGA/CPLD技术课程的重要性及存在的包括实验平台建设、理论
提高效益关键在企业自身杨淑君强化企业管理,提高经济效益,是邓小平同志建设有中国特色社会主义理论中的一个重要思想。近年来,我们曲阜市酒厂以这一思想为指导,打了一场向管理要
蠕虫给Internet带来巨大威胁,给作为Internet覆盖网的P2P网络带来的威胁更大,这主要是由P2P网络本身的特点决定的(就是这些特点为用户带来巨大方便).考虑到威胁P2P网络的3种蠕虫中
针对医学图像配准鲁棒性强、准确性高和速度快的要求,提出了一种基于融合多种特征点信息的最小生成树医学图像配准算法.该算法首先提取3种特征点,Harris-Laplace,Laplacian of Gaussian和网格点;然后使用遗传算法去除特征点集的冗余,并通过对位映射构建无向完全图顶点集合;进而使用改进的Kruskal算法来构造最小生成树;最后使用得到的最小生成树估计Rényi熵.该算法较好地解
随着两尊巨无霸缓缓转动,我国目前最大的直径10.37米、长5.19米半自磨机和直径7.32米、长10.68米球磨机,近期在洛阳一次试车成功。
高维数据集合的整体性匹配是一种重要的查询方式.基于点对点的元素匹配方式具有极高的运算复杂度,难以在大规模数据集中应用.针对相关性较强的高维数据集合,提出一种基于空间
美国军方近期在曼谷宣布,经16000多名泰国成人志愿者的RV144三期临床试验表明,一种新型艾滋病疫苗在预防感染艾滋病病毒方面具有安全、温和的疗效。与注射无效对照剂的受试组相