基于语义的文本事件信息抽取方法的研究与实现

被引量 : 0次 | 上传用户:kkkjnc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取和追踪是自然语言处理领域一个非常重要的研究方向,如何准确而高效地从大量繁杂无序的信息中提取到感兴趣的事件信息,一直是事件抽取研究领域的关键问题。一般而言,事件抽取就是从非结构化文档中抽取出用户感兴趣的事件,同时用结构化形式描述,供用户查询和进一步追踪分析等。事件抽取的研究对象会选取某一个固定领域或者新闻文本,这样更符合用户对于事件抽取的想象。并且事件抽取的形式也比较固定和单一,一般会采取基于模板匹配提取结构化文本或分析文本段落等进行分类的方法。本课题基于时空元素语义搜索引擎的研究背景,提出了一种基于语义的文本事件信息抽取方法,创新地通过应用多方面语义知识和统计方法,强调时、空元素对于事件追踪的定位功能,进行信息抽取和归并,最终实现对文本中事件的描述。该课题的处理文本类型多样,结构与行文风格复杂,如果采用传统的方法达不到理想的结果。而在实际应用中,这种情况非常常见。本文目标明确,方法有效且不繁琐,结合语义知识和统计学习,对处理复杂语料和大规模数据有着非常明显的优势。另外,在本文中涉及到多方面自然语言处理的相关概念和算法研究,可以说,通过本课题对自然语言处理的研究,尤其是对信息抽取的研究有了深刻的认识与感悟。
其他文献
通过采用田间小区试验与室内分析相结合的方法,对宁夏中宁构杞的施肥方法进行了研究。结果表明:水平施肥对构杞干果产量无显著影响;而施肥深度对构杞干果产量有显著影响,随施肥深
文章运用观察法、文献资料法和分析归纳法等研究方法,从跆拳道腿法的技术属性、动作结构等方面下手,结合跆拳道技术教学训练实践,运用迁移理论分析了跆拳道腿法技术之间产生
目的了解妇幼保健院优质护理服务质量现状及存在问题,持续改进护理质量。方法利用卫生部2011年"医疗质量万里行"活动收集的数据,采用定性与定量分析相结合的方法,对妇幼保健
目的探讨提高0~1岁肥胖、严重腹泻所至脱水及各种原因导致循环不良患儿,股动脉搏动不明显股静脉采血一次成功率的方法。方法将178例次行股静脉采血的上述患儿随机分为超声多
中介语石化是二语习得中的普遍现象也是外语写作教学中的一个难题。本文对国内外近30年关于语言石化现象成因的研究进行了综述,并在中介语理论的基础上,从词汇、语法、文化迁
工程造价管理是搞好工程建设的关键工作,它自始至终贯穿建设的全过程。项目建设实施阶段是对项目设计成果的执行及检验阶段。由于建筑产品生产的复杂化及构成元素的多样化,导
"功夫(武术)"与"熊猫"是中国文化的标示,同时也是中国文化在世界传播的形象大使。《功夫熊猫》中众多的武术元素与中国传统文化的视点,是中西文化的差异和吸引力所在,因此,首
以来自黑龙江、吉林和河北省的36个大豆品种为材料,研究了大豆品种与豆浆稳定性、蛋白质含量及蛋白质回收率的关系。结果表明:由供试大豆制作的豆浆,稳定系数变幅为0.576~0.7
研究了烧结烟气半干法脱硫灰复掺矿渣、钢渣,辅之外加剂,制备胶凝材料的可行性。结果表明,采用改性脱硫灰(GXTLH)、钢渣、矿渣及水泥熟料再混磨制备的复合胶凝材料,具有良好
目的:探讨早孕期测量颈项透明层(NT)值及中孕期测量颈后皮肤皱褶(NF)值对筛查染色体异常的意义及其相互关系。方法:对3 963名单胎孕妇分别于孕早期(11~14周)测量NT值,在孕中期