基于字符串核的免分词中文文本分类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：youngpansy

【摘要】

：

文本分类是获取文本信息的重要一步，现有的分类方法主要是基于统计理论和机器学习的，其中著名的有Bayes、KNN、SVM、神经网络等方法。实验证明这些方法对英文分类都表现出较好

【作者】

：

游智李战怀张阳

【机构】

：

西北工业大学计算机学院

【出处】

：

计算机工程与应用

【发表日期】

：

2006年26期

【关键词】

：

核函数 SVM 字符串核 kernel function SVM string kernel

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本分类是获取文本信息的重要一步，现有的分类方法主要是基于统计理论和机器学习的，其中著名的有Bayes、KNN、SVM、神经网络等方法。实验证明这些方法对英文分类都表现出较好的准确性和稳定性。对于中文文本分类，涉及对文本进行分词的工作。但是中文分词本身又是一件困难的事情∞。论文尝试一种基于字符串核函数的支持矢量机方法来避开分词对中文文本分类，实验表明此方法表现出较好的分类性能。

其他文献

浅谈重庆糯玉米丰产栽培

针对重庆地区特有气候和农户种植习惯,对鲜食糯玉米品种选择、播期安排和田间管理等方面作了介绍.

期刊

鲜食糯玉米优质高产栽培

一种可压缩的（r，n）门限秘密图像共享方案

提出了一种可压缩的（r，n）门限秘密图像共享方案，Shamir的门限方案是该方案的基础，它可以克服VSS方案的缺点．并能把影子图像压缩成原秘密图像大小的1/r；当所有像素灰度值小于250时，恢

期刊

秘密共享(rn)门限方案影子图像无质量损失恢复secret sharing （rn） threshold scheme shadow imag

基于Agent的多问题并行遗传谈判模型

Agent谈判增加了电子商务系统的主动性．一个有效的谈判模型是系统实现的关键。分析了已有Agent谈判模型的特点．设计的基于Agent的多问题并行谈判模型解决了已有谈判模型中存在

期刊

Agent谈判并行遗传算法电子谈判问题权重调整实数编码Agent negotiationparallel genetic algorithme-n

最小代价前向协议的研究

文章对无线传感器网络的最小代价前向协议进行了研究，在原有协议的基础上引入随机选择、报警机制．并且增加了具有相同代价的相邻节点集。用跳数作为代价分析了改进后的协议性能

期刊

无线传感器网络最小代价前向协议网络负荷Wireless Sensor Network（WSN）minimum cost forwarding proto

基于简化差别矩阵的完备属性约简算法

由于基于老差别矩阵的属性约简的定义与基于正区域的属性约简的定义是不一致的．给出一个简化差别矩阵和相应的属性约简的定义，并证明了该定义与基于正区域的属性约简的定义是一

期刊

粗糙集差别矩阵简化差别矩阵属性约简完备算法复杂度rough setdieernibility matrixsimple discernibili

六七式铁路舟桥器材改造技术

对六七式铁路舟桥的栈桥进行技术改造,对升降墩和栈桥梁进行创新设计,包括结构简化,减轻重量,加快栈桥修建和舟桥器材上下水、门桥拼组的速度,提高铁路舟桥的战术性能等。

期刊

铁路舟桥改造升降墩栈桥梁战术技术提升

新兴蔬菜南瓜苗及其栽培技术

随着生活水平的不断提高,对蔬菜的需求不断地发生变化,由以往追求数量和价廉,转变为追求质量、营养和保健效果.南瓜苗作为一种新兴的特种莱,因其独特的营养和保健作用而倍受

期刊

基于字符串核的免分词中文文本分类方法

其他学术论文