基于语义模式的半监督中文观点句识别研究

来源 :南京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:fronj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模和高质量的标注语料是进行监督算法分类器训练的重要前提,而进行大规模的语料标注是一项费时费力的工作,并且针对特定的领域还需要该领域专家的介入.提出一种基于语义模式的半监督中文观点句识别方法,可以通过小规模语料的训练识别出中文观点句.首先,通过语义模型提取算法从训练集当中识别出观点句语义模型和非观点句语义模型;然后,将两种模型转化为语义特征,并且加入词汇特征和词性特征两方面特征,通过BootStrapping对小规模标注语料进行训练,得到朴素贝叶斯分类器;接着,使用朴素贝叶斯分类器对大规模未标注的语料进
其他文献
企业要保证会计信息的真实准确,需要审计监督;企业要实施科学管理,使内部控制达到严密、完整和有效,同样需要审计监督和服务.内部审计已成为企业自我发展的需要,成为现代企业