数据浓度的传播利用与研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:jeffyi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际工作场景中,数据的特征和标签往往会不同程度缺失,这种情况被称为数据具有不同的浓度。例如文本分类的数据中包含着大量未标记的文本,临床信息预测实验中包含很多缺失特征和标签的受试者。考虑到在实际应用中,未标记的示例也会包含数据分布的隐藏信息,低浓度数据的样本可以通过已有信息之间的内在联系和高度相关性来对其进行补充,因此对不同浓度数据包含的先验信息进行挖掘可以对实验结果进行有效的提高。本文的具体研究工作如下:(1)半监督学习使用大量的未标记示例和已标记示例,来进行模式识别工作。现有的基于图的半监督学习方法在本质上是属于模拟各种传播机制的标签传播方法。与现有的传播机制不同,尝试采用一种新的基于弹力的传播方法来实现半监督学习。基本思想是假设图中的每个节点以一定的弹性系数都接受其相邻节点的弹性力,并以另一个弹性系数将弹性力传递给相邻的节点。因此,两种类型的弹性力之间的差异可以度量每个节点的传播量。在此想法基础上,推导出图中所有节点的更新方程,并将这些方程表示为矩阵形式,进一步推导出其解析解。换句话说,该方法具有可靠的物理学基础。并从优化相应的目标函数角度出发,论证了该方法的基本原理,从而保证了该方法的收敛性。大量的实验结果验证了该方法在半监督学习中的有效性。(2)医学慢性病—阿尔茨海默病研究中示例数据丢失问题极其普遍。为了提高学习性能,首先采用矩阵分解的方式填充低浓度数据,其次为了充分利用低浓度数据中的特征和标签,本文从多个视角数据源和多个时间点对疾病状态预测进行联合建模。现有的预测慢性疾病在未来的时间点的表现状态的机器学习方法都是从单一任务和视角出发,没有充分考虑到慢性疾病发展过程中存在的双重异质性。特别是每个时间点中出现的预测任务,多个时间序列上任务也存在信息相关特性。这些任务的表现受到多个因素制约,从多个来源角度和时间点进行分析。对当下状况进行准确的判断预测,能够让患者积极主动地接受医学治疗。本文在考虑源的一致性和时间平滑性前提下建立了一种新颖在低浓度数据情况下的疾病预测模型。并且从理论上证明所提出的模型是一个线性模型,论证了该方法的基本原理,保证了该方法的收敛性。通过大量的实验验证之后,能够看到该模型在阿尔茨海默病临床分数预测中的有效性。
其他文献
所谓物体可供性(affordance)是指:目标物体结合其所具备的能力和所处的外界环境,展现出的潜在“操作可能性”(actionpossibilities)。由于这种“操作可能性”与环境和执行者
在人脸识别领域中,人脸识别算法的识别准确率与训练算法时提供训练样本的数量息息相关。当提供的研究样本极少时,许多传统人脸识别算法无法将识别率保持在理想水准内,因此,如
研究主要基于竞争神经网络模型.在相同的模型中,不同的参数会使得研究内容和方法完全不同,因此本文研究内容分为两个部分.在证明各自系统稳定性的前提下,分别针对控制协议和
随着(超)高层结构的不断涌现,对结构柱的承载力及变形能力提出了更高的要求,本文提出了一种新型组合柱,即内埋方形钢管空间钢构架混凝土短柱,在空间钢构架混凝土柱中内置方钢
随着科技的不断进步,大功率电牵引采煤机越来越得到广泛的应用,而随着功率的不断增大,相应的牵引功率也加大。采煤机牵引部是采煤机的行走机构,与电气控制箱组成采煤机的机身
我国农村能源消费增长迅速,商品能源消费构成中以煤炭为主,在农村居民部门,在热当量水平下煤炭占商品能源消费总量的45%。农村煤炭主要用于炊事和取暖,产生了大量室内和环境
随着工业生产装配中自动化程度的日益提升,对柔性体自主操作的需求越来越大。线状柔性体作为柔性体的重要组成部分,相较于面状柔性体和体状柔性体存在很多不同。线状柔性体存
将军二号矿南推过程中,煤层标高逐渐降低,上覆剥离层变厚,提高边坡角保障边坡安全稳定后会使得坑底境界收缩,煤炭资源回收量降低。为在保证边坡安全稳定的前提下提高煤炭资源回收量,同时保障运输道路,本文利用露天采矿学基本原理、时效边坡理论及优化理论,研究上覆岩层厚度逐渐变大条件下的边坡稳定性及稳定性保障方案,探索破碎站下坑的可行性以及在端帮运输道路中断情况下开拓运输系统布置及运距优化,结论如下:(1)根据
近几年,随着国内新型城镇化的不断推进,各地城市建设快速发展,而城市化的不断加深却带来了诸多生态环境问题,其中尤以水生态环境问题最为突出。雨污混流、城市内涝、资源型缺
随着钢板材料应用的范围越来越广,近年来也应用到了建筑结构的加固上,用钢板来进行加固的方式虽然采用性能相差较大的钢板与砖砌体进行组合,但通过对拉螺栓和粘结材料的连接