基于术语长度和语法特征的统计领域术语抽取

来源 :哈尔滨工程大学学报 | 被引量 : 0次 | 上传用户:yzlang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对领域术语抽取中含字长度较大的术语被错误切分的问题,本文提出一种基于术语长度和语法特征的统计领域术语抽取方法。本方法在利用机器学习抽取候选术语时,加入基于术语长度和语法特征的约束规则;在使用统计方法确定候选术语的领域性时,充分考虑词长比这一概念的重要性,将其作为判断术语领域性的重要权值。实验表明,提出的方法能够正确抽取含字长度较大的领域术语,抽取结果的准确率和召回率相比以往的方法有所提高。
其他文献
现较为成熟的CFD仿真软件均为国外所有,国内缺乏相应的知识产权。为此,本文自主研发了一套仿真程序,对内燃机缸内三维工作过程进行数值模拟。本文建立了动态层网格模型和匹配的