论文部分内容阅读
针对目前手工构建本体耗时费力这一难题,以茶学领域知识为研究对象,提出了一种本体的概念自动提取方法。该方法利用中文分词技术对茶学语料进行切分,使用互信息技术从切分后的语料中得出候选概念(合成词)集合,通过判断候选概念和非合成词的领域相关性,自动提取出茶学领域本体概念。以该方法为基础开发了相应的原型系统,实验结果表明,该方法是有效的。