基于贝叶斯及多模式串模糊匹配算法的不良短消息甄别混合模型

来源 :第十一届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:xxxhht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手机短信息业务一方面给人们带来诸多便利,另一方面一些不法分子利用手机短信息进行违法犯罪活动也日益猖狂,如何防范和打击此类犯罪活动对执法机关来说都是一个新的挑战.本文针对不良短消息的识别和分类问题,提出了一个基于贝叶斯分类算法和改进的多模式串模糊匹配算法的不良短消息甄别混合模型,以实现对不良短消息的识别和分类.短消息文本经由朴素贝叶斯分类器进行是否不良的判断,对确认为不良的短消息的主题关键词再经过多模式串的模糊匹配进行不良类别的分类.实验表明该方法提高了不良短消息识别的准确率,具有良好的应用前景和实际效益.本文重点分析不良短消息识别和分类过程.
其他文献
本文利用1998—2009年的SPOT VGT-NDVI逐句数据集,采用最大合成法、均值法、一元线性回归分析法,对大巴山地区植被覆盖动态变化进行了时空分析,研究结果表明:①大巴山地区NDV
自古以来,丽江纳西族有“男人天堂,女人天下”的说法。“好男人琴棋书画烟酒茶,坏男人琴棋书画溜鹰狗”是丽江古城纳西人的广泛认知,“溜鹰走狗”是纳西男人一种嗜好。 Sinc
中国的研究人员报道:大量摄入含异黄酮饮食的绝经后妇女比摄入少的妇女骨密度(BMD)高,但在绝经前,异黄酮的摄入并不影响BMD。 香港大学的Annie W C Kung博士和他的同事们收
本文提出了一种针对对话语料的自动标签推荐方法——KeyEx.该方法首先基于加权TFIDF进行关键词抽取,加权因子融入对话者权重、句子重要程度和句子长度等因素;然后,通过频繁模
以福泉煤矿突出煤层掘进工作面为例,利用自主研制的钻屑量精准测定和防喷孔装置现场试验.试验结果表明:该装置能够有效地阻止钻孔煤粉随钻机供风飞扬,保证工作环境的清洁;利
历史经验告诉我们,在新股上市前后,精心研究套利方法和与之相关的个股板块是获取超额利润的不二法门。在中工国际和大同煤业即将上市之际,我们特别总结了五大掘新“杀手锏”,
瓦斯综合治理是一项衡量矿井综合技术水平的重要指标,也是矿井集约高效生产的前提和基础.矿井正处于新旧采区交替期,围绕着绿色和高效抽采,设计并规范了井下临时瓦斯抽放泵站
请下载后查看,本文暂不支持在线获取查看简介。一剂“妙”药@皮德!丹麦请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not suppo
期刊
交互式问答是国际问答技术领域新兴的热门研究方向.它结合自动问答与对话系统技术,可以处理系列相关问题,并能与用户进行对话式交互,但是目前在中文问答领域开展的相关研究还
1931年九一八事变爆发后,澳门的占领者葡萄牙采取了保持中立的立场。不仅如此,葡萄牙与居住着大量日本侨民的巴西的特殊关系也让日本有所忌惮。因此,当香港及马尼拉、新加坡等东南亚重镇一个个落入日本手中之时,澳门这个“东方蒙特卡罗”却奇迹般地免受战火的蹂躏,直到战争结束。不仅如此,远东孤岛之地位,也给澳门以畸形的繁华。  抗日战争造成大批难民为躲避战火涌入澳门,使澳门人口数量急剧上涨,到香港沦陷后的19