基于随机森林的哈希检索算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户：zz121961437

【摘要】

：

从海量数据中进行近似数据的检索是数据挖掘领域许多应用的关键。尤其近年来,数据的规模出现爆炸式增长,数据检索需面对海量数据和“维度灾难”的叠加考验,这使得传统最近邻

【作者】

：

花强郭欣欣张峰董春茹

【机构】

：

河北大学河北省机器学习与计算智能重点实验室

【出处】

：

计算机科学与探索

【发表日期】

：

2019年7期

【关键词】

：

近似近邻检索(ANNS) 哈希编码随机森林顺序敏感的海明距离 approximate nearest neighbor search (ANNS) Hash

【基金项目】

：

河北省自然科学基金面上项目,Nos. F2018201115, F2018201096,河北省教育厅青年基金,No. QN2017019,河北省教育厅科学技术研究重点项目,No. ZD2019021.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

从海量数据中进行近似数据的检索是数据挖掘领域许多应用的关键。尤其近年来,数据的规模出现爆炸式增长,数据检索需面对海量数据和“维度灾难”的叠加考验,这使得传统最近邻算法效率降低,而近似最近邻算法发挥了越来越重要的作用。其中哈希算法以其在存储空间和计算时间上的优势受到了广泛关注。提出了一种基于随机森林的哈希算法。该算法通过构建随机森林,将原始空间的样本映射为海明空间的二进制哈希码,并在哈希空间上定义了顺序敏感的海明距离,以最大程度保持数据在原空间的近邻关系不变。由于随机森林中不同决策树所使用的特征空间和学习过

其他文献

区域性中心城市与教育事业发展的思考

教育是城市发展的支撑和基础，两者相互影响，共同促进，共同发展。在新世纪新阶段，把涪陵教育建设成为重庆市中部区域性教育中心，是建设区域性中心城市的重要内容，对于把涪陵打造成工

期刊

区域性中心城市教育事业中心城市建设城市发展经济发展涪陵重庆市大城市

DCST：主存空间高效的缓存敏感型T-树索引研究

已有主存索引通过指针消除和预取机制提升索引结构的缓存感知能力，减少缓存失效次数，但是并没有有效地利用现代计算机的CPU性能和内存空间。为了进一步提升索引结构对内存空间

期刊

压缩主存索引缓存敏感compression main-memory index cache consciousness

接触网测量中线阵摄像机标定的SVR方法

电力机车通过铁路沿线的接触网获得动力。接触网提供可靠的供电是火车安全运行的重要保证。目前,采用的接触式检测方法对设备的磨损较大。基于三维立体视觉技术,实现了一种非接触的检测方法,首次将回归方法应用于摄像机的标定。该方法使用了4台线阵摄像机,先通过支持向量回归机对采集的图像像素样本进行训练完成标定,建立空间点位置到4台线阵摄像机像素之间对应关系,然后利用得到的模型对接触网进行检测。所提出的线阵摄像机

期刊

接触网检测线阵摄像机标定技术支持向量回归机contact wire detectionlinear array cameracalibration

追求时尚之囧

本刊注:时尚的,基本都是肤浅的。比如衣服之于心灵。因此,对时尚的追逐,难免会陷于付钱买肤浅,作　　祟的无外乎虚荣。但恰恰企业求实,甚至比科学还要实;管理求稳,因为人性是永恒的。因此做企业管理,最　　要不得浮华与虚荣。王先生呼吁企业回归管理本真,实乃指出了当前企业界与咨询界的双重急所。　　　　电视剧《天道》和原著《遥远的救世主》我都是几年前一口气看完的。看了电视剧再去看原著,这几年还是惟一的一回。过

期刊

时尚企业管理企业回归企业界虚荣

非体外循环冠状动脉旁路移植术临床应用观察（附168例报告）

行非体外循环冠状动脉旁路移植术（OPCAB）168例。结果166例症状明显改善，随访3～43个月，均未再次发生心绞痛；围术期死亡2例，1例术后9d死于多器官功能衰竭，1例死于急性心肌梗死。认为OPC

期刊

冠状动脉粥样硬化性心脏病非体外循环冠状动脉旁路移植术

论道德、法律、自由、平等与构建和谐社会的关系

构建社会主义和谐社会，是中国共产党提出的一个崭新的命题，是—项重大的战略决策，集中反映了广大人民群众的根本利益和共同愿望。构建和谐社会需要各方面的努力，本文重点分析道德

期刊

和谐社会道德法律白由平等

奖惩分明，化解上市薪酬难题的良药

在股票期权变得无利可图的熊市时，如何不让上市公司的高管们再心安理得地拿走高薪?　　　　高管薪酬制度作为上市公司治理结构的重要环节，合理规范十分必要，一定要建立适合我国上市公司发展的、奖惩分明并体现利益相关者价值最大化的新型高管薪酬制度。　　　　短期性风险　　　　高管薪酬的根本目的在于激励和约束经营活动，从而降低两权分离导致的代理成本。而我国上市公司薪酬制度缺乏约束，缺乏利益相关者安排，机制不健全，

期刊

上市公司奖惩分明薪酬股票期熊市权变高薪高管

基于随机森林的哈希检索算法

其他学术论文