中文文本分类关键技术的研究

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:dubo2536
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是将一个待分类的集合映射到预先确定好的文本信息集合中去的过程。在国外,英文分类技术研究已经很成熟,由于中文构词比英文分类复杂,分类技术和理论还需进一步研究。研究中文文本分类在信息处理和用户对信息的获取方面至关重要。文本分类的过程比较复杂,主要研究文本分类中的文本预处理、文本表示、特征提取与加权和分类算法等关键技术。
其他文献
干板秧歌是山西长治县地区保存完好的地方小戏,因起源于该县西火一带,故又称“西火干板秧歌”。西火干板秧歌既自成一体,又兼收并蓄,“干打干唱”、独具风格。本文主要通过对
互联网的快速发展,数字数据的传输与使用更加方便快捷,给人们的生活带来便利,与此同时数字产品版权需要得到安全保护问题日显突出。为此,数字水印技术得到人们的高度重视与极
在生成图像的处理过程中,由于计算机生成图像与自然图像在物理生成机理方面存在着明显的差异性,因而也在一定程度上决定着其在图像噪声分布领域也存在着较为明显的差别。基于此,提出了图像噪声分析下关于计算机生成图像的检测算法,通过探索研究来进一步挖掘、提取计算机生成图像检测的新计算统计方法。