融合领域相关度与上下文信息的无监督窄域实体识别方法

来源 :北京工业大学学报 | 被引量 : 0次 | 上传用户:huanying19870604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对细分领域实体识别所面临的实体规模受限、语料样本相对缺乏的挑战,提出了一种融合领域相关度与上下文信息的、无监督的窄域实体识别方法.首先,融合词频及上下文信息,设计了术语-语料库相关性假设,并利用对数似然比计算假设的可能性,获得候选实体的领域区分度;在此基础上,基于候选实体的中心词在语料库中的相对领域占比,构建领域依存度函数,识别候选实体的领域倾向性;最后,绑定领域区分度和领域依存度,计算候选实体的领域相关度,选择领域相关度大于阈值的候选实体作为被识别的窄域实体.实验结果表明:该方法在减少识别过程人工干预
其他文献
针对青少年脊柱侧弯矫正问题,研制一款由3D打印制成的脊柱侧弯矫形器并做出舒适度评价.该方法依据色努矫形原理,建立脊柱侧弯矫形器三维模型,并考虑躯干约束对矫形器进行了有
国内民航门户民航资源网旗下机构“飞常准”日前发布了《中国内地2014年航班准点率报告》。报告表明,航班平均晚点时间最短的是北京,为73分钟。而去年内地乘客等待飞机起飞的时
报纸
《中共中央关于全面推进依法治国若干重大问题的决定》提出,改革要于法有据,但实践条件还不成熟、需要先行先试的,要按照法定程序作出授权。基于此,《立法法》第13条对在一定
针对现有预测模型无法在交通大数据中提取交通流序列的内部规律,且未能充分利用交通流的时空相关性以实现高精度预测的问题,提出了一种基于K-最近邻(K-nearest neighbor,KNN)
<正>人所共知,从事一份职业是每个成年人立足社会、保证生存、体现自身价值所必须的;性生活也是每个成年人在法律保护之下满足正常生理心理需求、延续后代、体现完美人生的必
为了准确获得滑靴底面水膜特性,综合考虑了滑靴的倾覆姿态与磨损形貌,分析了滑靴的受力/力矩情况,基于Matlab软件实现了滑靴副动压水膜的精确求解.结果表明:当柱塞腔压力一定