人机交互数据中的多粒度碎片化知识获取技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:svincent_su
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能的发展使得计算机能够理解用户的动作、语言等输入,人机交互向人与人间的自然交互发展。然而,自然交互需要系统对多源、多模态用户产生内容进行分析,提取有用的知识,以理解用户的真实意图。本文从粒计算角度出发,提出了以条件信息熵作为不确定性度量的流特征选择方法CIE-OSFS和基于标签粒化的多标签流特征选择方法ML-OSMI。两种流特征选择方法能够应对实时产生、特征空间动态增长的数据,如人机交互中的操作行为数据等,为从用户的操作等行为中获取知识提供了支撑。还提出了基于神经网络的多粒度特征自学习联合抽取方法JMC。该方法能够从自然语言输入中获取实体和实体间的关系等知识,帮助理解用户的真实意图。为帮助人机交互系统理解用户产生的数据提供了支持。本文主要工作如下:1.首先提出了基于不确定性度量的单标签流特征选择框架。该框架从粒计算理论出发,使用不确定性度量来度量特征的重要性。然后基于该框架实现了基于条件信息熵的流特征选择方法。为验证方法的有效性,与fast-OSFS、Alpha-investing和Grafting等流行的流特征选择方法进行了详细地对比,结果表明CIE-OSFS能够在保证准确性的前提下选择出更少的特征。2.提出了一种基于标签粒化的多标签流特征选择方法ML-OSMI。该方法首先将标签通过聚类的方式进行粒化并转化到更低维的空间,然后基于互信息重新定义了多标签场景下特征的相关性和冗余性来指导特征选择过程。实验结果表明ML-OSMI在传统多标签特征选择场景和流特征场景都是有效的。3.将多粒度特征的先验知识用于设计神经网络结构,自动地学习多粒度特征,提出了一种联合抽取方法JMC。为验证模型的有效性,本文在远程监督数据集NYT上进行了实验,分别在实体抽取,关系分类和联合抽取三个任务上与流行方法进行了对比。结果表明,JMC在三个任务上都取得了更优的结果。
其他文献
采用改变底组织,提高织物紧度的方法,克服开发超重磅真丝绒产品的困难。对STAEUBLI开口部分进行细致地测绘,结合实际,对传统开口参数做了较大修改。完整地阐述解析法凸轮设计的全
本篇文章,讲述一个在美留学一年的少年对中美食品安全的认识和了解。在强调食品安全重要性这一方面上,咱们国家实在是没得说,在全世界都是数一数二的,已达到令人望而生畏的地
<正>近日,商务部综合司和国际贸易经济合作研究院联合发布《中国对外贸易形势报告(2019年春季)》(以下简称《报告》)。《报告》回顾了2018年及2019年一季度中国外贸运行情况,
期刊
宝山区是上海仍保留有"三农"任务的近郊区,现有104个行政村,耕地保有量4.25万亩(占全市的1.5%),农业比重占区增加值0.1%,务农人员1400人,农村人口3.63万。农业总量小、比重低
基于深度学习的目标检测算法计算开销和参数体量巨大,难以部署在计算和存储资源有限的嵌入式平台或移动终端上。针对这一问题,本文以当前性能较好的轻量化目标分类网络Mobile
运用文献资料法、专家访谈法、案例分析法、逻辑分析法等方法,分析得出当前我国体育社会科学成果转化的现状、问题及成因,并探究成果转化路径。研究认为:思想观念约制、内容
<正>中华优秀传统文化是中华民族的文化基因,植根于中国人内心深处,潜移默化地影响着中国人的思维方式和行为方式。"我将无我,不负人民"这一论述,既反映中国传统伦理思想,又
通过建立2012年长株潭区域机动车尾气排放清单,分析了区域内机动车尾气排放特征,研究了排放的时空分配因子,并对清单进行了不确定性分析。结果表明:2012年长株潭区域道路机动
人类可食用的食物种类似乎无穷无尽,每个门类的生物中都有人类可食用的食物。和其他异养生物一样.人类的食物都来源于其他生物。异养生物能食用各种其他生物的根本原因在于地球
干旱是限制玉米生长发育与产量的一个主要环境因子。本研究在吉林省西部典型半干旱区洮南(年降雨量不足400mm左右)进行,以近年来该地区种植的28个玉米品种为试验材料,进行萌