【摘 要】
:
从多种数据中挖掘信息是机器学习的一个重要领域。更具体而言,我们关心的问题称为多模学习,其目标是将物体对象的多样数据信息整合为一种单一表示。尽管过去已经有很多的相关模
论文部分内容阅读
从多种数据中挖掘信息是机器学习的一个重要领域。更具体而言,我们关心的问题称为多模学习,其目标是将物体对象的多样数据信息整合为一种单一表示。尽管过去已经有很多的相关模型被提出来,用来挖掘不同源数据中的信息,但是他们却不能完成一些重要的任务,比如结构学习,维度确定,以及缺失数据的处理等。为了能够同时实现这些任务,我们提出了一个新的统计模型。相关的工作成功地发表在了相关的国际会议中,如CIKM。本论文系统地将这些工作结合了起来,作为作者工作的一个综合总结。 多模学习中最重要的工作是挖掘数据中隐空间的结构。CCA和其相关拓展的方法能够有效地挖掘数据间的共同成分。但是,这些方法往往忽视了各个模数据的独立成分,从而导致了信息的丢失。而最近的一些工作,将数据间的隐空间划分为了共同空间和独立空间,从而更有效地整合了数据。但是,这些模型往往会需要数据的详细信息,用来设定模型参数,这种要求对于实际应用来说过于苛刻。 我们将能够引入稀疏性的ARD先验设置在投影矩阵上,从而全面系统地解决了这些问题。这些先验设定,使得我们的模型能够将数据空间分成公共和私有的成分,并同时确定各自空间的维度。所以,也就不再需要数据的相关先验知识了。而且,我们的方法是建立统计学习框架中的,所以它能够自然地处理数据缺失的问题。在实验中,我们的方法不仅能够在人工数据中成功地挖掘出隐藏空间,而且在HumanEva数据几上达到已有方法的最好水平,更是在缺失数据处理中超过了已有方法。
其他文献
数字签名技术作为一项极其重要的保密技术,在数据通信的真实性、完整性以及匿名性等方面都起到了十分重要的作用,已成为计算机网络中不可缺少的一项安全措施,在军事、金融以及商
随着1992年物流配送中心试点工作的展开,我国物流业得到了迅猛的发展。物流业在高速发展的同时,存在的问题与发展瓶颈也日益突显出来,其中过高的运作成本是行业发展所面临的最主
近年来,随着计算机图形学技术的飞速发展,大量的三维模型被应用于动画、电影、3D游戏和广告等领域中,大量开放的三维模型数据库也已经出现。如何快速低成本让用户准确查找目
随着互联网的发展,搜索引擎已经成为互联网最重要的入口之一。在搜索引擎的组成部分中,网页排序是搜索引擎设计的核心问题,排序结果的准确性决定了搜索引擎的性能和用户体验。早
某省人力资源和社会保障部门继2011年运行浙大网新版核心平台一版后,又推出了“多险合一”的核心平台二版。养老保险是“多险合一”社会保险制度的重要组成部分。本文在严格遵守核心平台二版规范和试点城市业务需求的前提下,经过分析养老保险待遇业务的实际需求和业务流程,并结合系统集成和项目管理的先进思想,设计和实现了一个针对养老保险待遇业务的业务系统。首先,本文在讨论“多险合一”社会保险系统项目背景和对其开发
在过去的几年,移动设备的数量在飞速的增长,如智能手机、平板电脑等。在智能手机市场,安卓系统的市场份额是最高的。与此同时,针对移动设备的安全威胁也越来越多,由于安卓系
在电脑普及、信息爆炸的现代社会,网络已经成为主流咨询媒介。目前,高校大学生学习、生活、娱乐之类的咨询主要通过现场、电话咨询和网络咨询等方式,而涉及到的这些问题往往
信息技术的飞速发展使得无线传感器网络(Wireless Sensor Network)逐渐成为信息技术领域内一个新兴的研究方向。无线传感器网络有着功耗低,成本低,分布广泛,自组织等优势,另一方
在无线通信系统中,连接可靠性和数据高传输率是重要的性能指标。由于多径衰落、阴影和路径损耗等的干扰,信道质量在时间、频率和空间上将产生随机不确定性,导致无线通信质量
软件缺陷作为困扰用户及软件开发人员的难题,不仅增加软件组织的成本、危害了软件产品质量,还延缓了软件开发和发布的进度,因此及时地识别和纠正软件缺陷对软件工程实践来说至关