基于统计分词的中文文本分类系统

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:QQ747881021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文阐述了一个中文文本分类系统的设计和实现,对文本分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细介绍,将基于统计的二元分词方法应用于中文文本分类,并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,实现了在事先没有词表的情况下,通过统计构造单字及二字词词表,从而对文本进行分词,然后再进行文本的分类。
其他文献
利用CFD软件对地板辐射+置换通风(RF+DV)复合空调系统进行了数值模拟。研究结果表明:复合空调系统可以满足夏季人体热舒适要求。当新风相对湿度为58.7%~65.5%时,冷辐射地板附
<正>科技实力代表着贵州发展的现在,而科普素养则意味着贵州发展的未来。贵州坚持创新驱动新引擎、深入推进科技体制改革取得明显进步,一大批创新成果转化为生产力,并引领全
“沪港通”交易机制于2014年实行至今已4年有余,2018年4月证监会宣布将沪股通每日额度扩大四倍,调整为520亿元,资本市场开放程度堪称“史上之最”.同时会计信息透明度对我国
福禄考属植物自花、异花均可授粉,通常结实率极低,通过人工不定向杂交辅助授粉措施可提高种子结实率.利用杂种实生苗的观赏性状和抗性变异性较大的特性,经过长期栽培观察,从
利用Landsat5TM遥感影像对湖南省2011年的地表覆盖信息进行提取,计算出2011年湖南省的生物丰度归一化系数及各地州市的生物丰度指数,绘制2011年湖南省的生物丰度指数分县分布图
近年来,牛肉的市场需求量在逐渐增加,对高生产性能的肉牛的需求也在加大。肉牛的生产性能不仅受遗传因素的影响,还受到生活环境因素的影响。养殖厂是肉牛生活的主要场所,牛舍
克雷白杆菌属细菌(Klebsiella)多不直接致病,但在器官移植、应用激素、肿瘤,尤其是糖尿病患者,易被此类细菌感染。在免疫力低下的患者中,进行有创操作、手术和侵袭性医源性操
为了用实验数据拟合色散曲线,通过求解柯西公式系数的超定方程组最小二乘解来确定系数的值,并与Origin软件非线性最小二乘法拟合测量数据进行比较。结果表明,在实验误差范围
提出了一种基于Adaboost算法和人脸特征三角形的姿态参数估计方法。首先利用Adaboost算法训练人脸器官检测器,然后根据人脸器官的几何特征定位人脸特征点,利用获得的人脸特征