面向动画自动生成的中文短信信息抽取的异态集成

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:cathy1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全过程计算机辅助动画自动生成技术由中科院陆汝钤院士于上世纪90年代提出,该技术是将故事以受限语言的方式输入计算机,并在计算机的辅助下完成从开始到动画最终生成的每一步。2008年,中科院张松懋研究员又提出在手机短信上应用动画自动生成技术的想法,设计并实现了手机3D动画自动生成系统,该系统旨在根据发送者的短信自动生成与短信内容相符的动画,并将结果发送给接收者。根据短信生成动画,首先要对短信内容进行信息抽取。该步骤能否提取关键信息,对系统能否生成符合短信内容的动画有直接的影响。系统目前主要采用基于规则的方法进行信息抽取,该方法正确率高,但覆盖面窄。为了弥补基于规则方法的不足,系统亦采用了机器学习的方法,针对系统动画可展现的内容,主要解决了信息抽取模块的两方面问题:短信情感分类和主题分类。这种方法虽然提高了覆盖面,却降低了正确率。经统计,从2014年3月至2014年5月,系统测试短信共计280条,其中短信情感分类正确的有109条,短信主题分类正确的有162条,两者的正确率分别为39%、58%,没有达到实用的目标。鉴于目前情感分类和主题分类均采用的是单分类器方法,所以考虑将多个分类器集成在一起来提高正确率。本文的主要工作包括以下两部分:第一,设计并实现了中文短信情感分类异态集成系统。该系统用于分析短信中的情感倾向并加以分类,为后续动画情节规划提供情感元素,主要分为两个步骤:一是主客观短信分类,以NB、SVM、KNN和C4.5作为基础分类器,选取不同的组合进行集成;二是主观短信的喜、怒、哀、惧多标记情感分类,以RAKEL、CC、MLKNN和BRKNN作为基础分类器,选取不同的组合进行集成。第二,设计并实现了中文短信主题分类异态集成系统。该系统用于分析短信所要表达的主题,以指导后续动画情节的规划,以NB、SVM、KNN和C4.5作为基础分类器,选取不同的组合进行集成。通过运用11种组合方式,进行了9600条短信的情感分类实验和17035条短信的主题分类实验。实验表明:相对于采用单一的分类器,异态集成在分类效果上有明显提高。其中情感分类中,由RAKEL、MLKNN和BRKNN集成的效果最好,正确率最高可达63%,相对于原来的版本提高了24个百分点;主题分类中,由SVM、KNN和C4.5集成的效果最好,正确率最高可达89%,相对于原来的版本提高了31个百分点。两部分都达到了实用的目标,并已应用到手机动画系统中。本文的工作使得手机动画系统能够同时使用基于规则和机器学习的方法,来互补地进行信息抽取。这两种互补的方法极大地提高了短信抽取的覆盖面和正确率,使得最终生成的动画更能符合短信内容。我们进一步的工作包括:在多标记分类实验的训练语料中增添更多的多标记语料、尝试更多的分类算法、采用更多的异态集成方法。
其他文献
随着系统设计的复杂性和集成度的大幅度提高,各种高速通信设备中的元器件越来越多,PCB密度越来越大,信号频率越来越高。时钟通常是电路中速度最快、能量最高、应用最广的系统,时
学位
本论文主要集中于时序逻辑理论研究,即表达能力和复杂性方面。   首先我们将带有循环计数的线性时序逻辑(LTL[C])在有限字上的刻画扩展到无限字上:我们定义了ω-半无星语言(
学位
随着制药企业信息化的发展,生产物流调度系统越来越成为企业生产管理的重点,日益受到企业以及研究人员的重视。如何对日趋复杂的生产物流调度系统进行建模与优化,达到深入认识制
学位
社区宽带综合业务网络融合了计算机网、电话网和电视网的业务。综合业务网络的核心设备是由实验室自行开发的以太网交换机,它建立起服务器与用户之间的连接,控制着整个网络中数
学位
随着信息技术的普及应用,互联网及物联网逐渐成为支持人们日常工作和生活不可或缺的平台。具有与人交互能力的人机自然交互模式吸引了越来越多的研究者,而智能的人机自然交互
目前传统的CAD造型方法操作非常复杂、抽象,交互方式不直观,与用户的设计思想严重脱节,使得大量的初学者和非专业人士望而却步。本文提出的基于笔的三维草图建模方法将三维建模
学位
方便灵活耐用的电子式门禁系统渐渐取代了机械方式的门锁,成为信息化社会的特点之一。基于键盘输入密码方式,基于刷卡方式(RFID卡、射频卡)等多种门禁设备已经得到应用,而以生物
学位
操作系统作为所有应用程序工作的平台,可以说操作系统的安全是软件系统安全的基础。为了实现生产应用安全,响应国家科技部攻关计划,在FreeBSD平台的基础上,我们研发了CAS-EARTH安
学位
目前客户关系管理系统(以下简称CRM系统)已经在企业界获得了广泛的应用和认同。但是,现有的传统型CRM系统也存在一些问题:需要企业在运行环境的软件硬件购置、应用开发和实施、
学位
RIA(Rich Internet Application)应用发展到今天,已经出现了若干技术。但每种技术都有其优缺点,而且随着其他新技术和新概念的涌现,RIA也要不断的向前发展。XML(Extensible Mark
学位