基于支持向量机的中文分词

来源 :现代计算机:下半月版 | 被引量 : 0次 | 上传用户:qxd986319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文信息处理的基础,也是很多中文应用首先要面对的问题。目前效果最好的分词模型是词位标注法,该方法需要使用一个分类器对每个汉字的位置进行判定。基于统计学习理论的支持向量机较好地解决小样本、非线性、高维数和局部极小点等实际问题,被公认为是优秀的机器学习方法和分类算法。实现一个基于支持向量机的中文分词系统,并在实验中取得较好的结果,证明支持向量机适用于中文分词时的词位标注问题。
其他文献
针对民族地区高等院校计算机教育的特点与面临的困难。提出相应的解决对策和改革方向。探讨如何构建现代人才素质需求与地方民族特色相结合的计算机教学体系,从而促进民族地区
分水岭算法由于其分割速度快、精确而受到很大的关注,但它存在过分割的问题。经过研究给出了改进算法,从两个方面来改进:(1)在算法执行前对输入图像进行滤波降噪处理;(2)在算法执行中结合动态合并准则直接对算法本身的形成的过分割区域进行抑制。实验结果表明,该方法能有效地处理过分割现象,是一种行之有效的方法。
工作流就是业务过程的部分或整体在计算机应用环境下的自动化,它主要解决的是使在多个参与者之间按照某种预定义的规则传递文档、信息或任务的过程自动进行,从而实现某个预期
根据全景图的生成流程,介绍全景图生成过程中所用到的各项技术。通过对全景图拼接技术的国内外现状及其应用领域的分析和研究,得出全景图拼接技术具有广阔的应用前景。