K-近邻相关论文
现实世界中收集的数据集通常是含有缺失的,为了在不完备数据集上构建有效的机器学习模型,需要对数据集进行清洗。为了确保较好的清洗......
信息技术的快速发展使各行各业产生了大量有用或无用的数据,因此数据的挖掘与分类变得日益重要起来。面对爆炸性增长的数据,人们需......
在多标签分类问题中,一个实例可能同时属于多个类别(或标签)。实际的电能质量扰动往往是复合扰动,多种扰动可能同时存在,所以电能质量......
人脸识别是模式识别、图像处理等学科的一大研究热点,是利用计算机分析人脸图像,从而提取出有效的识别信息,用来辨认身份的一门技术。......
认知科学的研究表明,感知信息对自然语言习得有重要的辅助作用。由于机器不能独立地把词汇和感知世界进行关联,因此出现了Grounded......
学位
个性化信息服务旨在解决按照用户的需求传递信息的问题。随着信息科学与技术的发展,信息已经渗透到人们生活的各个方面。移动电话的......
1975年,Shamos和Hoey利用计算机有效地计算了平面点集的Voronoi图,并发表了一篇著名的论文,计算几何从此诞生,成为计算机科学理论......
如何在浩若烟海而又纷繁芜杂的文本信息中获取最有效的信息是信息处理的一大任务。文本自动分类是实现这个任务的重要方法之一。在......
三维点云数据在影视游戏、逆向工程及文物保护与展示等各个行业的应用越来越广泛。囿于外界不可控变量、设备物理误差等因素,由测......
k-近邻(KNN)算法是一种简单而有效的分类算法。传统的KNN分类算法存在着参数k难以确定以及分类新数据时间耗费大的两个缺陷。kNN模......
文本分类技术可以用来帮助人们从海量的信息中获取有用信息,它已经得到了广泛地研究和应用。文本分类就是将一些未知的文本与预先......
现实世界中存在着大量无类标的数据,如医疗图像数据、网页数据、视频数据等。在大数据时代,这种情况更加突出。标注这些无类标的数......
基因芯片技术同时可以检测成千上万个基因的动态表达水平,这些表达值构成了基因表达谱数据。肿瘤的基因表达谱具有高维小样本的特......
可解释性是数据挖掘领域的研究热点,当数据处理结果具有可解释性时才能为决策者提供一种透明的指导作用。公理模糊集(Axiomatic Fu......
频谱感知是认知无线电的前提,具有重要的理论研究价值。在实际的感知过程中,认知用户按照一定规则分布在二维空间中,各个认知用户......
为了解决大量日志数据导致的有效标记和人工筛选等问题,文中提出了一种K-means和K近邻(KNN)的日志异常检测方法。利用GloVe方法对......
[目的]基于局部密度的LOF算法时间复杂度高,且容易将处于簇边缘的正常对象误判成异常对象,INFLO算法引进反向k-近邻解决LOF算法这......
压缩近邻(CNN:Condensed Nearest Neighbors)是Hart针对K-近邻(K-NN:K-Nearest Neighbors)提出的样例选择算法,目的是为了降低K-NN......
局部离群因子(LOF)是对过程数据的局部离群程度的定义,然而工业过程对数据异常检测的实时性要求高,要求出所有采样点的离群因子计......
对提出的基于马氏距离的点匹配方法进行了理论分析与实验验证,针对马氏距离及加权图转换匹配方法的不足,将马氏距离融入到加权图转换......
基于一级结构信息预测蛋白质热稳定性,对于利用计算机筛选热稳定性蛋白具有重要意义.本文采用κ-近邻算法从序列出发预测蛋白质的......
从序列出发预测水解酶亚家族类型具有重要意义.本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类......
针对传统协同过滤算法稀疏矩阵和推荐精度不高的问题,根据一种社会心理学模型提出了基于群体动力学的协同过滤算法。该算法综合考......
距离度量对K近邻(KNN)算法分类精度起着重要的作用。传统KNN算法通常采用欧氏距离,但该距离将所有特征的差别平等对待,忽略了数据的......
针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法。该算法首先计算样本密度和......
k-近质心近邻原则是 k-近邻原则的一种有效扩展,是有效的模式分类方法之一。 k-近质心近邻原则容易受到局外点的影响;同时,所有的 k-......
标记间的相关性在分类问题中具有重要作用,目前有研究将标记相关性引入多标记学习,通过分类器链的形式将标记结果引入属性空间,为......
为了解决传统分类器的过拟合现象,从而增强分类性能,提出了一种基于核空间中K-近邻算法的混合取样的不均衡数据集分类算法。该算法......
从序列出发预测某蛋白质是否为脂肪酶以及属于哪种脂肪酶具有重要的理论和应用价值。提出了基于Z标度和T标度的伪氨基酸组成方法提......
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想.本文通过对已有的基于多代表点的层次聚类算法特点的分......
不平衡数据严重影响了传统分类算法的性能,导致少数类的识别率降低。提出一种基于邻域特征的混合抽样技术,该技术根据样本邻域中的......
入侵检测是一种重要的网络安全技术.现有的无监督方法虽然能在未经标记的数据上找出异常,但时间复杂度相对较高,不适用于入侵检测......
提出了一种有效应用于失衡数据集的分类方法,其核心思想是从样本预处理和分类器改进两方面入手,为失衡数据集的分类问题提供全面的......
本文提出了基于支持向量机(SVM)和k-近邻(k-NN)相结合的一种分类方法,用于解决交集型伪歧义字段.首先将交集型伪歧义字段的歧义切......
k-近邻分类算法是机器学习分类算中一个重要的算法。其精度高具有广泛应用。但时间和空间复杂度高。本文着眼于此,根据香农熵理论,......
提出了一种网络信息文本分类模型的建立方法。根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析......
利用改进的SVM分类算法处理汉语语音识别结果文本的分类问题,针对语音识别文本的特点简化了文本分类的预处理过程,调整支持向量机的......
提出了一种快速搜索海量数据集K-近邻的空间球搜索算法。将数据点集进行空间栅格划分,假想存在空间球,并以当前测点为球心,半径分别取......
作为一种监控与跟踪车流和人类活动等的潜在技术,RFID(radio frequency identification)已经在数据库领域得到了很大关注。RFID监控对......
数据挖掘的两个高层目标是预测和描述,这个过程中分类算法的应用是非常广泛的。分类算法在机器学习领域中可以分为Lazy和Eager两种......
为了提高分类器的精度,对分类器的结构进行了改进,提出了一种基于贝叶斯和k-近邻组合分类器的模型,该分类方法结合了贝叶斯方法分......
利用伪氨基酸组成提取蛋白序列特征值,考察参数λ和w对识别效果的影响,以k-近邻作为基础分类器,用于预测水解酶的亚家族类型.结果......
针对Kalman预测跟踪和K-近邻数据关联算法的优缺点,研究一种基于Kalman预测和K-近邻的多目标跟踪方法。该方法首先利用Kalman滤波......
为减少支持向量机(SVM)的计算负担,提高运算效率,并保证分类精度,提出一种结合投影与近邻操作的支持向量快速筛选方法.该方法利用Fisher......
提出了一种网络信息文本分类模型的建立方法.根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分......
K-邻近算法作为一种比较简单,易于实现并且错误低的分类算法,广泛应用于网页分类、模式识别和数据挖掘等多个领域中.本文介绍了传......