【摘 要】
:
语义关系识别是对文档进行处理识别出包含的语义关系的过程,是构建本体重要组成部分之一.在石油领域本体的构建过程中,由于石油领域的文档具有组合词多的特点,语义关系识别更
【机 构】
:
中国石油大学(华东)计算机与通信工程学院
【基金项目】
:
科技部创新方法工作专项(2015IM01030)~~
论文部分内容阅读
语义关系识别是对文档进行处理识别出包含的语义关系的过程,是构建本体重要组成部分之一.在石油领域本体的构建过程中,由于石油领域的文档具有组合词多的特点,语义关系识别更加困难.目前使用的语义识别算法主要是基于关联规则的识别算法,但此类算法没有领域针对性.通过分析石油文档的特点,提出一种基于改进词向量的石油文档语义关系识别算法,以连续词袋(Continuous Bag-Of-Words,CBOW)模型为基础,对石油专业术语进行扩展训练,引入负采样和二次采样技术提高训练准确率和效率,利用向量特征训练支持向量机(Support Vector Mechine,SVM)分类器进行语义关系识别.实验结果表明,该方法训练的词向量能够准确识别石油领域的语义关系,在石油领域具有明显的优势.
其他文献
选取2012年5月~2013年11月我院普外科收治的60例急性胃穿孔患者。随机分为修补组和切除组各30例。修补组患者接受单纯胃修补术,切除组患者实施胃大部分切除术。观察两组治疗
学习场域是指能为学生进行个性化学习提供科学、合理、易操作的显在场域,还指教师与学生、学生与学生,以及师生与学材之间的潜在场域。这两种场域相互依存、相互作用,共同指
采用不同晶型铁源探讨了其对磷酸锰铁锂正极材料电化学性能的影响。采用X射线衍射谱(XRD)、高分辨扫描电子显微镜(SEM)、透射电子显微镜(TEM)、拉曼光谱及电化学性能测试手段
针对目前电动汽车锂电池组中模组能量不均衡的难题,以电动汽车的三元锂电池组为研究对象,通过电感的方式建立模组间的主动均衡模型,以模组间SOC最大值与最小值的差值作为均衡
函数与方程的思想方法,几乎渗透到中学数学的各个领域,在解题中有着广泛的应用. 一、函数与方程是两个不同概念,但它们之间有着密切联系,一个函数若有解析表达式,那么这个表达式就可看作一个方程,这样,许多函数的问题可以用方程的方法来解决.也就是说,对于函数y=f(x),当y=0时,就转化为方程f(x)=0;反之,也可以把函数式y=f(x)看作二元方程y-f(x)=0,函数与方程这种相互转化的关系十分重