基于长距离依赖条件随机域的文本信息抽取

来源 :计算机应用与软件 | 被引量 : 4次 | 上传用户:theone2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息抽取中,同一token在文本中可能出现多次,且token多次出现的位置通常相隔很远,传统线性链CRF模型由于Markov假设不能表达长距离依赖关系于是将多次出现的同一token分开标注,丧失了全局信息。提出了长距离依赖条件随机域模型,该模型能结合多次出现的同一token各处的特征,对其进行联合标注。由于长距离依赖使得精确的标注算法不可计算,采用了TRP估计算法。实验表明该模型抽取性能优于线性链CRF模型,尤其是speaker域上的召回率有了很大的提高。
其他文献
在安全协议的形式化分析中,有两种完全不同的观点:模态逻辑和可证安全,两者各有优缺点。目前,将两者进行组合优化,建立统一的调和方法框架对安全协议进行分析是研究的热点和难点。通过对两种观点的研究,按照优势互补的原则将两者相调和,提出了一种新的形式化分析方法,该方法可提供更为完全的安全协议形式化分析。
结合党的十六大报告,本文就什么是社会主义政治文明、社会主义政治文明的基本特征、社会主义政治文明的内容、"三个文明"之间的关系等作了论述,并指明了"三个文明"协调发展对
在分析了传统Web服务架构的基础上,对基于Ajax技术的Web服务架构进行讨论,介绍了新架构下Web应用的优点,重点分析了Ajax架构的四类安全问题,即JS脚本类问题、注入类问题、跨域类问题和拒绝服务类问题。
基于临床指南的临床决策支持系统的价值已得到了普遍认同。提出一种基于拆分/组合策略的临床决策支持方法,给出了一种灵活的临床决策支持系统开发框架,并结合一个具体的实例
"九一八"事变之前,日本国内在对华政策上存在着分歧.1931年,日军发动"九一八"事变,中国国民政府实行不抵抗政策,美、苏等世界强国都对日本侵略行为妥协姑息.法西斯势力在日本
张爱玲是中国现代文学史上神话般的人物.她留给我们的不仅是传奇般的故事,而且是离奇故事背后对人生对命运的思考.张爱玲的小说除了苍凉,更多的是缺憾,在张爱玲的小说中找不
穴位注射是在相关穴位注射药物以治疗疾病的方法,由于其操作简单,疗效可靠,因而被广泛应用于临床各科.现据有关资料,将穴位注射在皮肤科的应用情况综述如下.
SPP—1A疼痛治疗仪临床疗痛观察深圳市红十字会医院付明举陕西中医学院附属医院韩蓉陕西中医学院韩育斌疼痛系临床常见病症之一,是病人的一种自我感觉,属中医“证候”范畴。疼痛临床