中文文本分类相关论文
近年来,文本分类技术在机器学习和深度学习理论的支撑下进步斐然,各类深度神经网络分类模型在基于多种公开数据集的实验中展示出了......
文本分类作为自然语言处理的重要研究领域,在农业、商业、法律、社会科学等诸多领域发挥重要作用。中文文本分类主要分为短文本分......
互联网时代的文本类数据管理的关键在于高效的信息检索、深度的信息挖掘以及自然语言处理。文本情感分类作为这些技术的一个重要环......
现如今文本数量与日俱增,对文本进行正确的分类有助于理解文本内容以及开展后续的工作。文本分类有众多的应用前景,如垃圾邮件识别......
互联网技术发展迅速,网络文本信息激增。信息传播迅速而广泛,对社会有着重大的影响,因此高效地分析和处理文本信息变得尤为重要。......
受中国互联网技术发展和移动社交网络进步的推动,中文文本信息的数量正在迅速增长且蕴含着巨大的潜在价值,如何高速、准确的对中文......
随着信息时代的来临,电子文本信息迅速膨胀,如何有效地组织和管理这些信息,并准确、全面、快速地将用户所需要的信息从文本信息系......
信息科学高度发达的当今世界,每时每刻都会有大量的数据产生,在我们的周围充斥着各式数据信息,这些数据往往是高维的,高维数据难以被人......
近年来,随着通信设备和技术的发展,手机短信服务为人们提供了更多的信息,同时也为形形色色的不良信息提供了藏污纳垢的便捷场所。因此......
信息技术和网络技术的发展的同时也带来了信息海量增长,因此如何将信息有效的分类以便人们更加高效的利用信息是一项艰巨的任务。......
自动文本分类技术就是对大量的自然语言文本按照一定的主题类别进行自动分类,它是自然语言处理的一个十分重要的问题。文本分类任......
随着信息时代的到来和Internet的日益普及,电子文本迅速膨胀,如何在海量的文本中提取潜在的、有价值的知识和模型成为信息处理的一......
随着Internet的迅猛发展,电子文本信息迅速膨胀,文本分类系统作为处理和组织电子文本信息的一项重要技术,成为信息处理领域不可或缺的......
信息化的飞速发展使各种文本信息呈现爆炸式增长,这给人们的工作、学习和生活提供了极大便利,但淹没于大量无用、重复信息之中的有用......
随着通信技术和计算机技术的飞速发展,自动信息处理已成为人们获取大量信息不可缺少的工具文本分类作为自动信息处理的重要研究方......
随着国际互联网飞速发展,各种电子文本数据的数量激增,如何快速有效地获取、管理和使用这些文本数据,已经成为信息系统科学迫切需......
面对与日俱增的爆炸信息,人们获得有用知识显得越发困难,而有效的组织和管理能帮助人们便捷准确地找到所需知识,于是文本分类成为......
随着Internet的迅猛发展和日益普及,网络文本信息急剧增长,如何有效的组织和管理这些海量信息,并能够快速、准确、全面地获得用户所需......
随着信息技术的快速发展,信息海量增长,如何从大量数据中获取有用信息是人们急需解决的问题。信息多数是以文本的形式出现,而中文......
中文文本分类作为搜索引擎的关键基础技术,对于高效而充分地从互联网上巨量的中文文本信息中挖掘出高价值中文文本信息,以满足社会......
文本分类是目前自然语言处理领域最基础的任务之一,在信息检索、推荐系统等领域都有着广泛的研究和应用。传统的文本分类方法通过......
随着信息化时代的到来,电子文本数量呈现高速增长的趋势,中文文本分类技术的需求与日俱增。在文本分类的过程中,文本数据的半结构......
随着当今网络信息量的飞速增长,海量的网络文本数据也在呈现指数级增长,传统的人工分类方法显然已经不适用,文本分类技术应运而生。文......
传统的流形学习局部线性嵌入(locally linear embedding,u正)算法通过欧氏距离来选择邻域,如果数据集选自多个类别,这种距离度量方法无......
非功能需求描述系统质量相关的属性,是软件设计决策的重要依据和评估标准.与功能需求的描述相比,非功能需求描述通常比较分散,且往......
为摆脱中文自动分词过程中对庞大词库和复杂分词处理程序的依赖,提出了中文关键词信息的提取方法.该方法采用基于2-grams的短语标......
随着信息技术的不断发展,网络的快速普及,大量的文字信息开始以电子本文的形式存在,因此怎样实现信息的自动分类,特别是中文文本信......
针对互联网中中文文本数据量激增使得对其作分类运算的处理时间显著延长的问题,提出并实现了一种基于内存计算模型Spark的并行朴素......
提出了一种结合加权特征向量空间模型和径向基概率神经网络(RBPNN)的文本分类方法.该方法针对传统的文本特征提取方法的不足,根据文本......
采用一种无须分词的中文文本分类方法,以二元汉字串表示文本特征,与需要利用词典分词的分类模型相比,避免了分词的复杂计算;为提高......
针对基于神经网络的文本分类模型在训练过程中容易发生过拟合及忽略句子中的关键词的问题,提出了一种基于分层Attention机制的Bi-G......
提出一种基于模糊积分的多神经网络分类器融合文本分类方法,利用Sugeno模糊积分作为融合工具,将BP神经网络、RBF神经网络及采用K-m......
该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC.此算法将文档视作适词视作项,并针对文本事务的特性,提出利用词的类频......
随着互联网的发展,社交网络、电子商务等已经成为人们关注的焦点,对社交网络的文本进行情感倾向性分析和挖掘变得越来越重要。该文......
概率潜在语义模型使用统计的方法描述"文档—潜在语义—词"之间的概率分布关系,其实质是模拟了潜在的概率语义空间,并将文档和词映射......
文本分类是文本挖掘的一个重要内容,在很多领域都有广泛的应用。为了实现中文文本分类问题,先采用分词技术和TF-IDF算法得到每一篇......
用文本分类的方法找出中文评教信息的情感倾向,使学生主观评价里蕴含的信息得到有效利用,是对现有评教系统的必要补充.采用基于潜在语......
提出一种通过综合考虑网页的HTML结构信息以及网页间的链接关系,修改网页文本在向量空间模型表示中的权值,对网页进行分类的方法。......
正确定密是开展好保密管理各项工作的前提和基础,运用现代信息技术辅助人类专家开展定密工作,将有效提高定密工作的准确性和效率,......
为了提高中文文本分类的效率与精度,设计一种新型的分类器。该分类器采用基于语料库的正向扫描统计分词。在词频统计阶段,采取训练......
微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料......
对基于向量空间模型的文本分类所涉及的关键技术:特征选取、特征向量表示方法、特征向量的维数、文本分类的评价标准进行了分析和研......
针对从文集全局角度评价特征重要性的传统特征选择方法可能忽略某些重要分类特征的问题,提出两步特征选择方法.该方法首先过滤掉类......
针对k-近邻方法分类准确率较高、但分类效率较低的特性,提出了一种基于k-近邻方法的渐进式中文文本分类技术,利用文本的标题、摘要......
文本分类是文本挖掘的一个内容,在信息检索、邮件过滤及网页分类等领域有着广泛的应用价值.目前文本分类算法在特征表示上的信息仍然......
垃圾邮件开始泛滥于20世纪末期,具有成本低廉,传输便利,诱导性强等特点。某些商业组织利用此契机作为谋取利益的一种手段,肆意传播......
针对KNN文本分类方法中不考虑特征词关联的问题,提出一种改进方法.这种方法基于对体现词和类别间相关程度的CHI统计值分布的分析,......
介绍中文文本分类的流程及相关技术。在分析传统的文本特征选择不足的基础上,提出了基于粗糙集与集成学习结合的文本分类方法,通过......