面向3D动画的手机短信信息抽取知识库维护系统的设计与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:yangxin_ctbri
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全过程计算机辅助动画自动生成技术是中科院陆汝钤教授于上世纪90年代提出的,该技术是一项全新的基于人工智能与计算机动画结合的研究领域。其目的是希望从自然语言书写的故事开始,直至最终动画的生成,每一步都在计算机的辅助下完成。手机3D动画自动生成技术就是将全过程计算机辅助动画自动生成技术在手机短信领域的一个应用,是一个崭新的课题。手机3D动画自动生成技术是中科院张松懋研究员于2008年审视了3G通信技术及相关应用背景后提出的,目的是将发送者的短信依据其本身内容,自动的生成与短信内容相应的3D动画并传送给接收方。其中间的处理过程非常复杂,大致可包括以下四个部分:信息抽取、情节定性规划、场景定量规划和网络渲染。本文的主要工作是信息抽取知识库维护系统的设计与实现,其中主要包括模板库维护和原子库维护两部分。本文的主要贡献包括以下几个方面:第一,设计并实现了信息抽取知识库的基本维护功能。目前,信息抽取知识库中有23个模板,380个相应的子模板,3079个原子信息,这些信息都存储在数据库中。知识库的基本维护功能包括模板和原子的添加、删除功能,今后无需直接对数据库进行操作,而只需按照界面提示进行操作即可,且通过中间的检查判断机制,可一定程度防止冗余数据的出现。第二,实现数据库新增原子的语义检查。本文基于现有《同义词词林》和《知网》实现了原子的语义判断,提高了信息抽取的质量。其中,《同义词词林》用于词语同义性判断,而《知网》作为补充,用于词语相似度判断。第三,设计并实现模板检查系统。模板检查包括模板一致性和完整性两部分的检查。其中,一致性检查包括模板中冗余、循环和冲突规则的检测;完整性检查包括遗漏规则和不可达子句的检测。因模板结构采用受限的EBNF的形式定义,模板结构可被看成一颗与或树的形式,故本文采用“数据库+规则”的形式来实现对模板与或树的检查。同时,通过对模板库的测试发现,有4个模板存在冗余现象;1个模板存在循环现象;5个模板存在冲突现象。信息抽取知识库维护系统初步实现了模板和原子的基本维护功能、数据库新增原子的语义检测以及模板检查的功能,对信息抽取知识库的维护具有一定的实用性。但知识库的维护系统仍需要从以下三个方面进一步改进:一、原子语义检测模块词典库的扩充及引入机器学习的方法;二、实现模板库维护与原子库维护的相互支持;三、检测模板中词义模糊的结点。
其他文献
在网络环境下,一些网页脚本、分布式查询等可能动态生成查询请求或程序。这类查询或程序通常难以提前对其进行静态编译,如XQuery、JavaScript、Python、MATLAB等,它们一般是
在今天的互联网中,随着用户接入网络的物理带宽的提高,大部分的互联网上的内容作为信息密集的形式存在(如视频、音频、文件流),互联网的飞速发展引发了网络数据内容的急剧膨胀。当
对于安全性要求较高的局域网环境,现有的病毒检测方法存在着一些缺陷。各反病毒软件厂商之间病毒库和反病毒技术不共享,而单个反病毒软件不足以应对各种各样的病毒,在检测新出现
随着互联网的发展,互联网同人们日常生活的联系越来越紧密。门户网站为人们提供了新的信息获取方式,搜索引擎改变了人们被动获取信息的模式,社交网络则通过虚拟的方式拉进了人与
随着互联网和移动互联网的快速发展,各种各样的资源被发布到网上,并且以爆炸式的速度在增长。为了能方便人们找到满足其个性化需求的资源,现有的很多应用提供了资源推荐系统提供
随着互联网技术的高速发展,Web应用的规模和复杂度也不断增加,人们对Web应用的开发周期也要求更短,分布式开发模式也变得普遍。Web应用开发框架层出不穷,为了更好地支持模块化和
由于能够有效的解决网络中单点发送、多点接收的问题,组播技术相对传统的单点广播大大的节约了网络带宽,减少了网络拥塞的可能性。IPv6技术除了对组播地址机制进行了极大丰富,在
在计算机图形学中,使用具有高真实感的材质,对于渲染出高质量的图像是至关重要的。通过测量得到的材质可以满足这一要求,但是由于测量装置复杂,对实验环境要求很高,需要耗费大量的
随着国家的进步和经济的发展,城市建设的发展水平在不断提高,人们对清洁能源的需求也与日俱增。我国的城市燃气企业在上世纪90年代初就开始致力于企业管理信息系统的开发与设计
迷彩伪装技术是军事作战中重要的保护手段,从19世纪英布战争开始,迷彩伪装技术在战争中的应用也越来越广泛。现代军事应用迷彩主要分为变形迷彩和数码迷彩。变形迷彩通过不规