一种用于汉语信息抽取的词汇本体

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:mechanical123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在研究特定领域汉语命名实体和实体关系识别时,笔者建议了一种可用于上述任务的词汇体育本体模型.根据这个模型,本文设计和实现了这个本体.它被来自知网的词汇概念信息与笔者建议的语义限制方法半自动地组合.除了概念类层次体系的关系以外,概念类之间的非层次体系关系也通过语义限制被建立.对CHINERIS系统的测试结果展示了识别6种类型命名实体和14种类型实体关系总平均f-度量分别达到83.08%和70.46%.因此,这种用于汉语信息抽取的词汇领域本体模型是合理和有效的.
其他文献
本文研究的机器人视觉系统主要应用于国内的烟草物流企业卷烟辅材配盘系统。该系统能够实时、精确地完成在卷烟辅材配盘过程中目标盘纸的图像采集、图像处理、图像定位,计算出盘纸在平面上的偏移量,为机器人对盘纸的精确抓取提供视觉引导,从而成功地解决了烟草物流企业盘纸配盘由人工配盘向机器人自动化配盘发展过程中的难题。
本文提出了一种新的二维自适应小波变换,对更新算子和预测算子分别进行设计。更新部分,主要是基于Gemma Piella等人的工作,利用多决策重新设计更新算子,使所得低频信号更加保持原有信号的特点;预测部分,根据图像的局部梯度信息和给定的阈值自适应的选择预测方向和预测算子.与自适应更新小波和CDF53小波相比,本文所得分解图像熵更低,为零高频系数更多,更加满足某些图像压缩的需要。
以计算机为核心、计算机网络为传输媒介的视频传输系统越来越引人注目。本文介绍了传输协议RTP/RTCP、服务质量QoS、组播Multicast和用来视频解码回放的DirectShow技术。最后给出了在Internet环境下实现此系统的具体方法和流程。
随着图像传感器技术的发展,多传感器图像融合已成为图像理解、计算机视觉以及遥感领域中的一个研究热点,广泛应用于自动目标识别、智能机器人、遥感、医学图像处理和制造业等领域。像素级多传感器图像融合获取的原始信息量最多、检測性能最好、应用范围最广,是各级图像融合的基础.本文给出了像素级多传感器图像融合的概念。总结了常用的像素级多传感器图像融合方法,讨论了像素级多传感器图像融合的现状、应用与意义。
语料库的开发、应用和管理需要元数据作为交流平台.以便明确、显著地表达各个语料库在资源存储、组织和内容描述上的基本特征.本文介绍了元数据和两个广泛使用的元数据标准--都柏林核心集DC和文本编码提案TEI及其在语料库中的应用,并探讨元数据在汉语语科库中的应用问题.
一个公司通常拥有多个名称,比如中英文全称和缩略名称等.这为中文命名实体识别、信息抽取等带来了很多困难.为解决这些困难,本文提出一种利用Web信息建立公司名称知识库的方法,该方法基于链接分析的假设,利用网站主页的特点,自动搜集主页周围的各种公司名称,建成知识库,并在这个知识库基础上开展一系列的应用.实验表明本文方法建立的知识库可以应用于公司名称的归一,名称的扩展等各个方面,对于公司名称的识别特别是缩
模式推理,又称为推理,是一个有着重要研究价值的课题.在问答系统的研究中,模式推理作为一种新的研究途径,具有较高的应用价值,也因此受到较高的关注和研究.在问答系统领域,模式推理方法提出的较早,但是在国内,目前相关的研究并不多,所以,本文就致力于解决这个问题.本文首先介绍了模式推理的相关定义、研究现状;然后给出了模式推理的模型和机制;并给出了模式推理的一个基本性质及其证明.在此基础上,重点给出了模式推
面向限定领域的特定任务翻译服务,在有限资源的掌上电脑(PersonalDigitalAssistant,PDA)上实现快速语音翻译这一实际问题,本文提出了一种基于suffixarrays数据结构的快速翻译算法.在该算法的基础之上我们建立了旅游信息查询领域的汉英语音翻译模块,并在PDA平台上加以实现.初步的实验结果表明,该系统不仅具有较好的实时性和比较高的正确率,能正确处理一些语音识别产生的错误,而
日-维机器翻译输入的原文是日文语句,通过自动执行日-维翻译处理软件,输出的译文是维文语句.在日-维机器翻译系统中,词典占据极其重要的地位.机器翻译的各个过程,从自动分词,语法分析,语义分析到目标语的生成等都需要频繁地访问词典.词典的组织,既要考虑到分词,又要照顾到分析与生成,如何提高系统的速度等.
本文提出了利用语言学分析的知识作为最大熵语言模型的候选特征.该方法从经过分析得到的词、词性、基本短语类型、基本短语的中心词和基本短语中心词的词性之中选择一个适当的形式和当前的词形成特征来表示长距离的约束关系,从而将语法、语义、词汇这些语言学知识统一在最大熵框架下.不同于传统的应用方式,本文提出的手语同形词的扩展方法将改进的最大熵语言模型应用在手语识别的后处理中,有效地提高了手语识别的性能,比Tri