中文分词在邮件过滤系统中的应用

来源 :华南理工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:xuzhidanxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对邮件文本分词效果较差的特点,提出采用一种改进的最大匹配法来进行中文分词的方法.该方法对于普通的邮件文本和一些具有特定格式的邮件文本都可以进行有效的分词;文中还利用φ2统计法生成新词,对词典起到了动态更新的作用,提高了分词的精度和准确度.两种方法在邮件过滤系统中结合应用,使分词的误分率低于0.025.
其他文献
对野生黄纹竹进行驯化试验研究,结果表明,野生黄纹竹出笋规律呈偏正态分布,出笋期在3月底至6月底;成竹率较高,达94.02%,退笋率较低,为5.98%,退笋高度主要集中在10-30 cm段;笋
研究了磁场-溶剂协同作用对谷氨酸结晶过程的影响及磁场作用下谷氨酸过饱和溶液表面张力、电导率的变化,并对磁场促进谷氨酸结晶的作用机理进行了探讨,提出了一种利用磁场-溶剂