相似性搜索相关论文
数据相似性搜索是云计算中应用最为广泛的数据搜索方式,它为用户提供了一种高效、灵活和实用的计算服务。然而,在云计算环境下,数......
真实世界的数据通常与图形结构结合在一起,比如社交网络。这样具有异质性的网络,我们称之为异质信息网络。相似性度量是异质信息网......
能量型风电斜坡事件,是指短时间内由于极端天气的风速变化,导致风功率发生的大幅度波动。近年来,我国不断增长的风电装机容量和大......
在当前的全球生态环境和能源经济议题中,能源管理是关注的焦点。通过人为主动调控从而减少能源消耗的有效方式之一是NILM(Non-Intru......
数据挖掘是指从大量数据中提取隐含、事先未知、并且潜在有用知识的技术,是目前国际上数据库和信息决策领域最前沿的研究方向之一.......
本文的目标是研究生物信息数据仓库技术,并在此基础上建立一个统一的基因数据仓库平台,主要的工作包括: 1.在分析当前生物数据库特......
数据挖掘简单而言就是从大量数据中提取知识的过程。其中针对时间数据库、空间数据库、多媒体数据库等等面向特殊应用的数据库系统......
异构信息网络分析是近年来数据挖掘领域中非常热门而新颖的研究方向,受到越来越多专家学者的关注。现实世界中来自各种不同领域的系......
时间序列是一种重要的数据类型,在商业、医学、工程和科学等应用领域具有广泛应用。从生活实际中积累的时间序列数据库,记录了大量......
时间序列作为一种重要的复杂类型数据,它普遍存在于现实生活中,诸如气象、股市、金融、天文等领域。因此对时间序列的相似性研究也逐......
字符串相似性搜索在众多的领域具有广泛的应用,例如:数据清洗、数据集成、拼写检查、抄袭检测、生物序列分析等。到目前为止,有很......
学位
随着互联网的快速发展与普及,网络多媒体数据(包括:文档、图片、视频等)正在呈现爆炸式的增长,这给那些需要进行相似性搜索的应用带......
随着信息技术的迅猛发展和流行,针对信息和资源的搜索技术,逐渐在商业应用和科研领域成为必不可少的技术之一。如:垃圾邮件过滤、图片......
自从上世纪后期,数据挖掘就作为一种新兴且有效的信息提取手段,不断受到越来越多科学研究人员的重视和研究。图形挖掘作为数据挖掘......
心电图(Electrocardiogram,简称ECG)是反映心脏兴奋的电活动过程,是人类生命活动中一个明显的体现。心电图反映了人体心脏的工作状......
如今,我们生活在一个复杂多变的数据时代,这些数据正源源不断地产生于各个领域,并潜移默化的改变着我们的生活节奏和生活方式。在......
科学技术是极具传承性的事业,任何一个科技工作者要取得好的进展,都离不开前人或他人的经验和成果。近年来,随着计算机、生物、化......
随着人类步入大数据时代,人们的衣食住行都离不开信息与数据。相似性搜索是大数据研究的一个重要方向。数据的分析与处理往往离不......
相似性图像搜索问题是指在给定数据集中返回与查询点距离相近数据点的问题。最近邻(Nearest Neighbor,NN)搜索方法在数据点维度较......
信息网络中的数据挖掘被广泛的研究,从过去开始,信息网络挖掘中的一些研究主要针对由单类型对象和链接构成的同质信息网络而设计。......
视觉位置识别是计算机视觉领域最基本的课题之一,其任务是基于给定查询图像进行位置准确和有效地识别。长期以来,由于对于机器人自......
针对视觉位置识别中因检索全局图片而带来大量的时间消耗情况,以及不同地点的视觉图像存在相似和同一地点从不同视角看起来会不尽......
随着国际人类基因组计划的启动,生物序列数据库的数据呈爆炸性增长,生物序列数据库中的数据蕴含着大量的信息和知识,如何挖掘和利......
相对传统新药研发模式,药物重定位策略发现药物新用途具有显著的成本效益优势,能加快药物上市步伐,满足恶性肿瘤、罕见病、个性化......
数据检索中的相似性搜索是数据处理的基础问题之一,被广泛应用于机器学习、模式识别、图像检索等领域.本文针对哈希函数构建过程的......
传统的基于距离的离群数据挖掘方法计算量大,挖掘效率和精度较低.本文利用大多数据集的聚类性特征,采用p权值和剪枝技术,给出一种......
时间序列是一类重要的复杂数据,时间序列知识发现正成为知识发现的研究热点之一,时间序列的相似性搜索是时间序列知识发现的重要方......
针对数据挖掘领域中时间序列的相似性度量问题,提出了基于斜率偏离度量的浮动索引相似性搜索算法。在斜率偏离度量的基础上建立分......
在对我国证券市场交易数据的研究基础上,提出了一种新的面向金融时间序列的相似度量模型.此模型的数学定义清晰,易于计算机实现,能......
FastMap、SparseMap、BoostMap被认为是适用于任何度量空间的嵌入方法。然而之前的研究者高估了它们的适用性,它们在基于关键词的......
最近,在多模态数据中进行搜索已经引起了越来越多的关注,能够保持相似性的大规模多模态搜索也在如今的大数据时代尤为重要。文章简......
有许多图像检索系统能对图像数据库进行快速的相似性搜索,但利用这些图像搜索方法所得到的结果质量是相当有限的。本文中,首先引入......
利用相似性搜索和分子对接技术,从中药数据库中筛选出分子3935,得到3935与乙酰胆碱酯酶的最佳复合物结构.依据生物电子等排体原理......
针对E-learning平台中的课程相似性搜索问题,在SimRank模型基础上提出一种高效的课程相似性搜索方法(Course Sim),依据学生和课程之......
局部敏感哈希算法是一种很流行的高维相似性查找算法。通过总结多篇已发表论文,介绍了集中式环境下的局部敏感哈希算法及其实现,分......
分析了常用的时间序列相似性搜索的一般方法,提出了基于最小首差循环链码的快速搜索算法。其基本思想是对股票数据进行合理的符号化......
简要介绍了数据挖掘及其在电网安全中的应用.提出了一种基于数据挖掘的时间序列相似性查询方法.通过对事故症候相似性查询,建立电......
相似性搜索在股票交易行情、网络安全、传感器网络等众多领域应用广泛.由于这些领域中产生的数据具有无限的、连续的、快速的、实时......
在经典的时间序列相似分析方法基础上,论文讨论了一些有代表性的现代时间序列相似性分析方法。对其基本思想加以分析和提炼,总结了这......
用浮动搜索算法对时间序列进行特征选择得到低维特征参数,采用WSTB方法实现对高维时序的相似性搜索。首先用浮动搜常算法对高维时间......
为提高网络书店相似性搜索效率,降低时间和存储开销以适应大规模数据,提出一种基于P-Rank的相似性搜索优化算法ProductP-Rank。对......
相似性搜索(近邻搜索)是从一个大数据集合中找出与查询对象距离最近的数据对象集合,局部敏感哈希(LSH)及其变种是解决这个问题著名且有......
哈希技术被视为最有潜力的相似性搜索方法,其可以用于大规模多媒体数据搜索场合。为了解决在大规模图像情况下,数据检索效率低下的问......
药物重定位是指发现已上市药物的新适应症,是网络药理学的重要应用领域。药物重定位策略是目前已知的药物研发策略中风险与效益比最......
相似性搜索是从数据库中检索出同给定数据对象相似的数据对象,已有的基于R-tree的相似性搜索,当搜索空间的维的个数较小时效率较高......
在多媒体或复杂对象数据库中,相似性搜索是一种非常重要的操作,这些操作一般可以归结为度量空间的相似性查询.提出一种新的度量空间索......
鉴于快速存取记录器(QAR)数据是结构非常复杂和数据量大的时间序列数据,直接采用传统的符号聚合近似算法(SAX)对QAR数据进行描述、......