论文部分内容阅读
提出了基于support vector machines(SVMs)的汉语浅层分析方法,并且为描述整个层次短语结构定义了10种汉语组块类型.与其他机器学习方法相比,该方法能自动选择对浅层分析有用特征,并能选择出有效的特征组合,较以前的研究可反映识别方向、特征模板、核函数、多分类方法及其组合对基于SVMs的汉语浅层分析性能的影响.在开放语料Chinese TreeBank上,Precision、Recall和FB1平均达到了95.36%、97.30%和96.32%.