文本分类算法相关论文
随着Internet的迅速发展,以Web形式呈现的电子文本的数据量成几何速度增长。如何高效的组织和管理这些数据,并全面、准确、快速地推......
本文研究内容基于国家自然科学基金项目“项目管理中项目关联分析与立项决策支持系统研究”,项目的相关性分析依据项目建议书的研究......
由于半结构数据具有结构复杂、不规范和易变等特点,研究人员普遍采用灵活的图或树形结构来设计半结构数据模型。在数据模型的基础上......
2008年以来,云计算在IT业被广泛关注。云计算被看作是分布式处理、并行处理以及网格计算发展的产物,其中云计算的关键是并发、分布......
随着计算机技术、数据库技术、网络技术的飞速发展和Internet的日益普及,在现实生活中,每一个领域都不断产生海量数据和信息,特别是海......
随着互联网技术的不断发展,INTERNET上的信息日益丰富,已经成为人们日常工作和生活中获取信息的重要来源。但是,由于INTERNET所固有的......
中文Web文档的自动分类主要还是以文本分类的算法思想为基础来进行的。但由于中文Web文档的数量巨大,内容多样,噪音繁多,很多比较......
Web2.0概念的出现使互联网新媒体发展进入了新阶段。博客作为Web2.0概念下的典型应用正在推动整个互联网业的发展。近几年来,作为......
随着互联网的高速发展,通用爬虫在浩瀚如海的网络世界里,对高效提取有效网页信息显得越来越力不从心。而主题爬虫是解决通用搜索引......
目前大量有用信息以文本形式存在,因此如何快速对大规模的文本分类成为亟待解决的问题。为应对这一问题,文本自动分类应用而生。文......
信息技术的飞速发展和互联网的广泛普及使得人们越来越容易地得到信息。然而,互联网的信息往往是包括各个行业的文本数据,为了高效地......
以网络为重要组成部分的计算机应用走到了一个空前繁荣的时代,各种新的应用环境、应用需求纷纷出现,在一些如搜索引擎、社交网络等大......
随着近几年通信业的迅猛发展,移动通信网业务己成为通信行业的支柱产业之一,如何保障移动通信网业务的正常运行,已成为各大通信运......
近年来,互联网技术迅猛发展,已经应用在我们日常生活中的各个领域。互联网技术也大量应用在农业领域,农业信息化开始出现在人们的......
在关联文本分类算法ARC-BC中,往往采用人工收集训练样本的方法,由于人工方法的主观不确定性使得收集到的训练样本的质量有差异,使得分......
随着互联网技术的飞速发展,网上的资源呈指数增长,人工处理这些海量信息代价非常高昂,因此如何高效地组织和管理这些资源成为近些......
计算机评阅客观题已基本实现,对于主观题,由于它的答题特点和复杂性,目前还没有一种考试系统能很好地完成其自动评阅。随着数据挖掘、......
随着计算机和互联网技术的迅猛发展,网络已经成为人们获取信息的不可或缺的重要来源。自互联网进入Web2.0时代以来,网民越来越习惯......
在以新浪微博近九万条微博作为语料库的为背景的算例下进行实验,结果表明在召回率相近的情况下,该算法在话题推送时比CPAR和SVM算法,......
针对基于内容的文本分类问题,提出了一种Agent与朴素贝叶斯分类(Naive Bayes)相融合的反馈分类模型和算法(Agent-NB).朴素贝叶斯分类是......
文本分类常采用的算法一般是基于向量比较的分类技术。文本中关键字较多,形成的特征向量维数相当高,因而会导致分类比较处理的运算量......
近年来,智能手机和基于Android操作系统的其他移动设备从简单的通讯工具变成信息处理和服务的综合平台。随着高科技犯罪案件和民事......
<正>在基层警务的日常情报分析中,除了结构化的数据库数据外,还有大量的案件叙述性文本描述数据,如案件卷宗、审讯笔录/口供、简要......
随着互联网的迅速发展,越来越多的信息资源以网络为媒介呈现在人们面前,而通过搜索引擎获取生活、生产所需的信息资料也开始成为人们......
随着Internet技术的发展,信息获取对于人们的工作生活越来越重要。目前,针对极度膨胀的信息资源,人们主要使用搜索引擎(Search eng......
本文着重对SVM和KNN分类法进行分析,并结合实际的文档集测试了SVM和KNN分类法的性能,给出了实验数据。......