Data Provenance Based System for Classification and Linear Regression in Distributed Machine Learnin

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：otherwang

【摘要】

：

【作者】

：

Muhammad Jahanzeb Khan

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2020年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Nowadays,data provenance is widely use to increase the accuracy of the machine learning models and to accelerate the training model.However,these models face the difficulties in information heredity which make information satisfactorily,produce coherent information and data association.This problem could be solved by implementing the data provenance to overcome shortcomings and manage conglomeration issues.Most of the studies in the field of data provenance are focused on its implementation for specific cases.Furthermore,there is a little number of studies on a machine learning（ML）framework,where distinct emphasize on the accurate partition of coherent and physical activities plan to implement ML pipelines for provenance.This paper presents a novel approach to use data provenance which is also called data provenance for distributed machine learning systems for text analysis and linear regression（DPMLR）.To develop the comprehensive approach based on a collective set of functions for various algorithms and provide ability to run large scale graph analysis,we apply Stellar Graph as our primary ML structure.It provides the aggregate arrangement of capacities for different calculations to examine large scales graphs.DPMLR is less time consuming when developing the large model sizes in comparison with other platforms on normal sized computing clusters.To accelerate processing time of training model,we adapted the Stellar Graph to read data streams and executes the trainer on Apache Spark clusters for fast processing focused on distributed based system.The preliminary results on the complex data stream structure showed that the overall overhead is no more than 20%.Moreover,the query responding time is in the period of time from 1 to 12 seconds,depending on the complexity and volume of data streams.Finally,it shows opportunities to design an integrated system which performs dynamic scheduling and network bounded synchronization based on ML algorithm.

其他文献

基于TiO2光催化合成和降解反应机理的实验和数值模拟研究

近年来,光催化技术广泛应用于污染治理、有机合成等领域,由于缺少相关设计参数、合理的研究方法及有效的动力学数据,光催化反应器的开发较为困难,因此该技术尚未实现大规模工业化。本文利用实验和反应动力学及计算流体力学（Computational fluid dynamics,简称CFD）等模拟方法,基于TiO2光催化合成和降解反应机理,分别对流场和光辐射场因素对TiO2光催化反应体系及光催化反应器性能的影

学位

TiO<sub>2</sub>光催化反应动力学CFDATRP光辐射强度

汽车覆盖件冲压工艺分析与排布系统

汽车覆盖件冲压工艺设计与排布是覆盖件设计和制造中最为关键的一环,传统的汽车覆盖件冲压工艺设计与排布主要依赖于工程师的经验,导致模具的开发周期长、成本高。近年来,我国已发展成为世界第一汽车制造大国,车企每年推出的新车型近上百种,这些新车型很多是在保持汽车发动机和底盘基本不变的情况下,注重汽车外观的变化,因此给覆盖件的设计与制造提出了新的挑战。覆盖件设计与制造一直是我国汽车工业的短板之一,为了满足汽车

学位

汽车覆盖件冲压工艺离散与合并工具体干涉检查自动排布

基于硫脲的柔性介电材料的制备与性能研究

随着物联网和人工智能迅猛发展,电子器件也向集成化和高性能方向发展以满足实际应用的需求,这对电容器及其使用介质材料的能量存储和输出能力提出了挑战。介电常数和击穿强度决定了电容器的充电能量密度,而充放电效率会受到电导率和弛豫损耗的影响。聚合物因其较高的击穿强度、柔性、易加工性和高效能,相比于陶瓷材料有着巨大优势,但目前常用的介电聚合物因介电常数过低,储能密度难以提高,应用受到限制。以聚偏二氟乙烯为代表

学位

芳族硫脲聚合物电介质能量密度储能效率

超细镍粉的合成与磁性能分析

由于其较高的熔点、致密的结构、均匀的形貌以及优异的磁性性能,金属单晶微粒广泛用于航空领域,如飞机涡轮机、超音速飞机。镍粉用于涂层工业中的金属涂层,如公共卫生固定工具、汽车轮圈以及厨具等的镍涂层,也常用于镍铁高温超导磁合金中。本文阐述了两种不同的合成超细镍粉的溶剂热法首先,以水合肼作为还原剂和以丙二醇作为溶剂合成超细镍粉,并逐一研究了四种不同的阴阳离子表面活性剂对产物改性的影响。通过扫面电镜和氮吸脱

学位

磁性性能居里温度表面活性剂单晶结构溶剂热法

热塑性电力电缆半导电屏蔽材料的研究

热塑性绝缘电缆代表着电力电缆的发展方向,近年来获得了重视。然而,与热塑性电缆绝缘材料配合使用的热塑性半导电屏蔽材料的研究仍然很少。现阶段主流的热塑性电缆绝缘主要以聚丙烯（PP）为基体。为了与PP基绝缘相配合,我们开展了热塑性PP基半导电屏蔽材料制备、结构与性能研究。使用聚丙烯/聚烯烃弹性体共聚物（PP/POE）的混合物为基体,炭黑（CB）为主要导电填料,探索了采用一维、二维导电材料（如碳纳米管CN

学位

半导电屏蔽材料聚丙烯碳纳米管MXene空间电荷

重大件码头装卸作业的风险识别及安全评价

随着炼化厂、海洋平台、发电厂、码头、桥梁、海上风电场等大型工程的兴建,重大件货物的需求越来越多,其装卸和运输的重要性也越来越凸显。重大件货物重量大、体积大且形状不规则,很大一部分都采用水路运输的方式,而码头的装卸作业作为水路运输最重要的环节之一,需要给与足够的重视。由于重大件货物自身的特征及码头装卸环节的复杂性,安全事故不断发生,因此,重大件装卸作业的安全问题不容小觑。本文通过分析几种不同的重大件

学位

大件码头装卸工艺层次分析法风险识别安全评价

核电大锻件材料再结晶织构演变数值模拟方法研究

核电大锻件材料在热变形过程中由于局部大变形和高温长时间停留易导致形成织构大晶粒。然而,目前对核电用钢在复杂热变形过程中晶粒形核长大的择优取向和织构大晶粒的形成与演化机理之间的关联机制尚不明确。本课题以316LN不锈钢为研究对象,开发了能描述再结晶有效形核和晶粒拓扑变形机制的多级元胞自动机模型,并将其与晶体塑性模型相结合,构建并验证了能够考虑初始晶体学信息和晶粒内位错密度分布梯度的晶体塑性—多级元胞

学位

再结晶织构多级元胞空间拓扑变形元胞自动机晶体塑性

细化教学任务设计深入科学实验探究——以《练习使用显微镜》为例

随着新课程改革的不断推进,精准化教学成为教师课堂教学的重要标准。初中科学是一门以实验为基础的学科,实验教学是初中科学课堂教学的重要组成部分,是学生深化理解知识的重要途径。本文以"练习使用显微镜"为例,从借助网络平台、精准制订教学目标、合理设计教学活动、明确实验角色分工等几个方面,浅谈如何精准化开展初中科学实验教学,从而提升教师的教学效率和学生的学习效率。

期刊

精准教学显微镜实验教学

基于深度学习的板料挤压成形力预测研究

板料挤压作为板料体积成形中一类典型工艺,具有广泛的应用范围。成形力作为板料挤压工艺成形过程中的重要参数,是相应模具设计和压力机选择的重要依据,其预测研究具有重要的工程意义。板料挤压力的大小与众多参数之间存在复杂的非线性关系,目前,大部分计算模型从力学分析和成形机理出发,适当的简化材料模型和工艺模型实现成形力预测,但适用范围和计算精度有所局限。深度学习技术作为一种快速发展的人工智能技术,可以直接从大

学位

板料挤压成形力自编码器深度神经网络卷积神经网络

与社区矫正一起度过的流金岁月

2003年7月,社会上出现了这样一些人:他们犯罪被判了刑,却不用进监狱,只需在社会中接受针对性的管理、教育和改造。这种"高墙外的改造"就是社区矫正。我有幸在北京市社区矫正试点工作之初就参与其中,成为了社区矫正工作发展的亲历者、实践者。如今,我从事社区矫正工作已近二十年,一本本工作日记记录了我与社区矫正工作的相互陪伴、共同成长,在此撷取几段与读者分享。

期刊

Data Provenance Based System for Classification and Linear Regression in Distributed Machine Learnin

与本文相关的学术论文