Spark在社交网络数据处理中的应用研究

来源 :现代计算机:上下旬 | 被引量 : 0次 | 上传用户:asfdasdfasd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在进行社交网络分析研究时,通常需要对海量社交关系数据进行清洗、处理和分析,传统的单机环境不能高效地用于解决该类问题。通过使用分布式计算框架Spark来处理该类问题,可以构建社交网络并计算社交网络结构,如连通性分析、网络度分析和平均路径长度等。利用Scala语言使用Spark中的RDD编程,完成对社交网络数据的处理。
其他文献
近几年来,我国对于人们生活的环境特别的关注,主要是因为现在国家的经济发展速度在不断加快,一些大型的企业工厂存在严重的环境污染状况,我们应尽量的减少污染,保护环境。本
随着计算机技术的发展,油气储运管道的设计、运行和管理技术更趋于成熟。但由于石油气的储运工艺较之液体石油要复杂一些,其中涉及到一些危险性较大的高压或低温工艺过程,加
文章首先阐述了小学语文作文教学存在的问题,然后给出多媒体环境下小学语文作文教学改进策略,包括利用多媒体转变作文教学方式;利用多媒体开展实践教学;利用多媒体开展教学观
随着计算机技术的飞速发展,传统的计算机基础课程学习方法逐渐落后,计算思维作为一种新兴的解决问题的思维方式,以其为导向的《大学计算机基础》模块化教学研究备受关注。为
随着高校的校园规模越来越大,而且高校校园通常对外开放,这就导致许多的外来车辆进入高校校园,导致高校校园的交通问题出现安全隐患,主要的问题就是校园之中的车辆较多、校园
以大米、百合干为原料,研制发酵型乳酸饮料,运用正交试验确定其最佳工艺条件为:大米∶百合干=4∶1,乳酸菌接种量为4%,发酵时间为72 h.产品具有风味俱佳、酸甜适口、营养保健
在网络技术、数字技术的推动下,媒介融合成为美国出版业发展的必然趋势。当前,美国出版业的媒介融合实践存在于三大层面:一是以组织融合为取向的出版企业集团化,包括出版企业
高效的语文课堂是我们每一位语文教师所追求的,怎样在一节有限的课堂内,最大限度地完成教学任务,达成教学目标,使学生更好地学到知识,掌握学习方法,提高自身能力,取得教学成
目的评价特立帕肽与阿仑膦酸盐对比治疗骨质疏松症有效性和安全性的差异。方法荟萃分析。采用Cochrane系统评价的方法,检索Medline(1966~2011年)、EMbase(1966~2010年)、Cochra
建设工程施工测量一般包含:施工控制网测量,地形测量、建筑物施工放样、开挖填筑工程测量、金属结构与机电设备安装测量、地下工程测量、变形监测、竣工测量等测量工作,形成