停用词相关论文
随着互联网的普及和社会信息化的发展,使用检索系统的用户变得越来越多,文档的语言种类及内容也越来越多。由于蒙古文的独特性,相......
随着互联网的迅速发展,网络中产生了大量数据信息,其中很大一部分信息蕴含着人们的主观观点和意见,网络信息有效利用的问题日益突......
针对采用贝叶斯分类器算法进行商品描述分类时,出现大量混淆性词汇从而无法保证特征间独立的问题,提出了采用停用词优化的贝叶斯分......
语言单元的表示是机器学习的基础工作之一,其旨在便于计算机能够更好地理解自然语言的语言单元。词是文本最基本的语义单元,是理解......
本文利用三种特征选择方法、两种权重计算方法、五种停用词表以及支持向量机分类器对汽车语料的文本情感类别进行了研究.实验结果......
为提高信息处理效率,文本信息检索系统通常将停用词作为噪音过滤掉,影响了文本处理的效果.针对该问题,提出一种应用于维吾尔语的停......
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法......
期刊
摘 要:为了帮助电话人工客服座席提供不间断地、质量稳定的服务,有必要研发智能查号引擎。基于最长公共子序列算法和最长公共子元素......
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择NaiveBayes算法为分......
为提升客户服务的效率,快速分析和解决客户问题,并将客户述求和投诉充分转换为中国移动发展的动力和资源;提出了一种针对移动客服......
近年,随着电商发展,产生了海量评论数据。通过数据预处理,去空、去重和停用词,利用ROSTCM6软件中文分词,词频统计,对评论进行分类......
微博,即微博客,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过如WEB、WAP等各种客户端登录微博,并以最长140字(包......
一种无需语料库和复杂数学模型支持的抽取新词最简方法。通过扫描文献文字流,消除停用字词,切分单元子句,对子句枚举可能的候选词......
【目的】通过实验对比分析,比较不同停用词表对于不同类型的文本数据的作用效果,对停用词表的构建与使用提供参考意见。【方法】选......
<正>随着物质文化生活逐步丰富,人们的阅读需求越来越旺盛。目前国内外图书市场百花齐放,各种各样的图书琳琅满目。面对海量的图书......
随着国民经济信息化的不断发展以及Internet的普及应用,中文信息处理成为一种热门的研究领域。因此,对中文自动分词技术的要求也越......
本文利用三种特征选择方法、两种权重计算方法、五种停用词表以及支持向量机分类器对汽车语料的文本情感类别进行了研究。实验结果......
随着自然语言技术的发展,越来越多高校在英语作文的教学过程中使用科技化的手段提高教学效率,英语作文的自动评分技术应运而生。国......
针对以自然语言形式提出的查询请求,区分信息需求表述和信息内容两部分。基于近20万语句的查询语料库和背景语料人民日报对照,提出汉......
为提高信息处理效率,文本信息检索系统通常将停用词作为噪音过滤掉,影响了文本处理的效果。针对该问题,提出一种应用于维吾尔语的......
随着藏文信息技术的发展和进步,藏文字处理技术已经日趋成熟。其中UNICODE藏文编码国际标准的公布和OPENTYPE技术在藏文字体设计上......
<正>用户舆情信息包括文本、音频、图片等各种各样的形式,实际工作中我们应用较多的还是文本类的用户舆情。综合考虑数量、丰富性......
随着人工智能和自然语言处理的迅速发展,相似度计算已成为语义消歧、信息提取、信息检索、文本分类、自动问答、数据挖掘等基础应用......
在知识抽取的分词过程中,需要提前把停用词标引出来。停用词处理的关键在于停用词的认定、停用词表的获取与组织技术以及停用词匹......
考察了2种常用的基于统计方法的停用词选取方法,结合语言学知识,提出了一种统计和语言学结合的停用词选取的方法,以支持向量机作为......
在没有建立起完善的中文停用词表的情况下,运用程序流程控制剔除中文分词器切分出来的单个独立字、英文字符、数字和一系列数学符......
预处理是文本分类中的一个重要环节,预处理结果的好坏不仅关系到分类的准确度,而且关系到训练时间的长短和影响到分类的速度。采用......
随着近几年微博,电子商务网站兴起,用户及网络评论的数量呈爆炸性的增长。这些评论中包含对产品,热点事件等的评判和分析,对于商家的产......
信息检索技术和自然语言处理技术是解决软件工程问题中最广泛使用的方法。在这些技术中,一个关键的操作是停用词移除,其目的是通过......
在迅速增加的海量数据中,文本形式的数据占很大比重。文本分类作为最常见的文本挖掘技术,可在大量杂乱的文本数据中发现有价值的信......
<正>掌握技巧会使搜索结果更加精确。搜索引擎最基本的使用方法是在搜索框中输入要搜索信息的关键词,点击"搜索(Search)"得到搜索......