标记分布学习及其应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:proshyrain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尽管多标记学习能够解决很多带有标记歧义性的问题,但是它却不能被很好地应用在不同相关标记相对于示例的重要程度不同的应用场景中。在本文中,我们提出了一种名为标记分布学习的新型的机器学习范式,它能很好地解决不同相关标记重要程度不同的问题。标记分布涉及到示例的一些特定数量的标记,在每个标记下都有一个描述度,它能够表示该标记相对于示例的重要程度。标记分布学习是一种更加一般的学习框架,无论是单标记学习还是多标记学习都可以看作它的一种特例。  本文的内容主要分为六个章节。在第一章中我们主要介绍了标记分布学习的概念,与单标记学习和多标记学习的区别与联系,标记分布学习的研究现状,最后给出了本文的研究目标和研究内容。第二章对标记分布学习的中涉及的一些概念作了更加形式化的定义。在第三章中,我们提出三类(每类包含两个,共六个)标记分布学习算法,并且选取了六种具有代表性的能够评价标记分布学习算法性能的度量标准。第四章中,我们介绍了基于标记分布学习的多模态年龄估计系统。第五章首先报告了在10个真实标记分布数据集上的实验结果,对比了不同的标记分布学习算法的性能,然后报告了基于标记分布学习的模态年龄估计的实验结果,从这两个实验中得出了一些有价值的结论。第六章,总结全文。  本文的主要贡献包括:一、形式化地定义了标记分布学习这一新型机器学习范式;二、从三个不同的角度提出了解决标记分布学习问题的算法;三、提出了六种衡量标记分布学习算法性能的评价标准;四、生成了第一批现实世界的标记分布学习数据集;五、设计了基于标记分布学习的多模态年龄估计系统。
其他文献
随着网络教学资源的急剧增加,传统基于关键字的教学资源检索由于缺少在语义层面上的处理和表示,这就造成了检索结果的不全面和不准确性等问题,不能满足用户对于网络资源检索的需
社会网络分析(SNA)是数据挖掘研究领域的一个热点,受到越来越多研究学者的关注,而社区挖掘是社会网络分析的一个主要研究方向。当前大部分的社区挖掘算法都假定网络中仅存在一
随着通讯技术的发展和Internet的普及,网络与人们的工作、生活联系越来越紧密,使用搜索引擎从网络中获取需要的信息已经成为了人们的一种习惯。但随着信息量的增大和行为方式的
网络技术的飞速发展,因特网呈现了许多新的趋势,人们对因特网也提出了新的要求。随着选播技术在因特网上的推广应用,用户数量是指数级增加的情况下,必须解决选播通信过程中的瓶颈
Ad Hoc无线网络是没有有线基础设施支持的移动网络,网络中的节点均由移动主机构成。Ad hoc网络中,每个移动终端兼备路由器和主机两种功能。因此,Ad hoc无线网络具有无中心、自组
网络并行计算是一种分布式处理系统,它利用现有高速网络互联的处理机、工作站的软硬件资源,实现以前只有专用且昂贵的大规模并行计算机系统才能完成的高性能计算。与专用的大型
目前,在Internet上广泛采用以集中数据存储和网络管理为核心的C/S模式,日益面临着资源的访问延迟、通信错误、服务器过载以及负载不平衡等一系列问题,严重引起了网络局部负荷过大
心血管疾病已经成为世界范围内威胁人类健康的头号杀手。影像科医师则需要借助一些成像工具对这些成像图像进行观察,对一些疑似病灶,如硬化或者狭窄进行判断和确认。虽然目前心
为加强泛珠三角区域合作信息交流,建立统一、快捷、方便的信息交流平台,根据“9+2”政府的共同意愿,由“9+2”日常工作办公室共同主办,南方新闻网承办,建立本区域枢纽式和门户式泛
自上个世纪90年代末到至尽,Internet的得到了飞速发展,网络已经成为人们获取信息的主要来源。如何使人们从成千上万的网站中快速方便的获取自己想要的资源和信息已经成为当前