【摘 要】
:
随着处理的数据量呈爆炸式地增长,如何衡量这些数据的重要性非常关键。PageRank算法被视为解决此类问题的核心算法之一。PageRank值的获取已经成为许多应用中的核心环节,例如搜索引擎、生物制药、推荐系统。以上应用场景中需要对所有数据的PageRank值进行计算。而在另外一些场景中只对部分顶点的PageRank值感兴趣,例如语义相关性分析、邮件过滤、论文检索。本文对需要全局所有顶点的PageRa
论文部分内容阅读
随着处理的数据量呈爆炸式地增长,如何衡量这些数据的重要性非常关键。PageRank算法被视为解决此类问题的核心算法之一。PageRank值的获取已经成为许多应用中的核心环节,例如搜索引擎、生物制药、推荐系统。以上应用场景中需要对所有数据的PageRank值进行计算。而在另外一些场景中只对部分顶点的PageRank值感兴趣,例如语义相关性分析、邮件过滤、论文检索。本文对需要全局所有顶点的PageRank值进行计算的问题称PageRank问题,只需要对部分目标顶点的PageRank值进行计算的问题定义为Local PageRank问题。如何高效地对这两类问题进行求解的有着重要的现实意义。本文基于GPGPU环境下探讨如何提高对这两类问题的求解效率。GPU可以提供了比CPU强大许多的浮点计算能力,已经被广泛利用到了高性能计算的各个领域。其中在PageRank问题的求解优化中,本文提出PSCR计算方法应用在GPGPU环境下高效进行PageRank计算。PSCR将图中各顶点按照顶点的出度和入度划分成若干个顶点集合并分别处理。对于包含中入度和高入度的顶点的顶点集合利用静态并行和动态并行进行多线程处理,解决单顶点计算量过大的瓶颈。对于包含了低入度的顶点的顶点集合利用顶点计算合并的方式,利用单线程处理若干顶点的方式,解决低入度顶点之间计算负载不均的问题。此外我们将悬停顶点进行合并独立计算有效地减少了计算开销和数据传递的开销。实验结果证明这一系列优化有效地提高了PageRank问题的计算效率,与现有的方法相比计算效率有明显的提升。在对Local PageRank问题的研究过程,本文首先将其转化为求解线性方程组单个分量求解的问题,然后引入蒙特卡罗方法对其进行求解,并分析了蒙特卡罗方法在求解Local PageRank问题中的相关性质。随后在具体的算法实现过程中,本文结合算法本身的特性和GPGPU的体系结构提出了一系列优化策略,包括了方差感知策略、顶点重排策略、Shared Memory策略、均匀概率策略。其中方差感知策略的算法根据相关性质和例子分析提出的利用随机游走的方差变化率动态的判断该顶点所需要的计算资源,以解决各顶点之间计算负载不均的问题;在实现中让每个线程块独立计算避免同步带来的开销。顶点重排策略解决了悬停点造成的存储空间消耗大和随机游走计算复杂度高的问题。Shared Memory策略利用低差异序列为确定性序列的特性,利用Shared Memory存储低差异序列,减少对Global Memory的数据访问开销。均匀概率策略用于图频繁变化的场景中进行快速判断不同顶点之间的重要性排名问题。实验结果表明本文的优化策略对于Local PageRank问题的求解效率在相应场景下有显著地提高。
其他文献
面对"互联网+"带来的教与学的新发展和新变革,提出以一流为导向,与时俱进的创新型教学团队建设为主体,内容和形式丰富的教学资源建设为依托,多样化且相融合的教学模式和过程性评价体系建设为主线的建设策略,打造契合专业人才培养目标,教学基础好、教学理念和方法先进、效果显著、具有示范引领作用的无机化学一流课程。
人类胚胎干细胞(human embryonic stem cells, hESCs)来源于植入前人类囊胚的内细胞团(inner cell mass, ICM),是一种具有多向分化潜能和无限自我复制能力的特定细胞类型,为临床细胞替代治疗和人类胚胎发育机制研究等提供了理想的材料。目前,制约hESCs研究的一个重要的因素就是hESCs培养体系,目前普遍采用的是饲养细胞培养体系,饲养细胞培养体系由于其需要
卡特希望中国读者"能看到美国人与中国人的相同之处:我们与土地相连,在艰难中成长",最重要的是,"我们都有勤劳的美德和帮助他人的愿望,我们分享着共同的命运"。"和美国一样,中国正日趋城市化。随着时间的推移,农民的数量将会减少,但这并不意味着他们的价值会流失。"吉米·卡特,这位从农场走出来的美国第39任总统,在他的回忆录《黎明前一小时——我的童年回忆》中,对中国读者嘱托道"我希望
在高校的管理体系中,除了日常的教育学习活动管理,学生的公寓住宿管理也是高校管理的重要环节之一。近年来,我国教育部门也加强了对高校学生住宿管理的关注和重视,对公寓管理模式提出了更高的要求尤其是"人脸识别"系统建立后,公寓管理模式发生了改变,各高校应不断适应时代发展,充分利用大数据开展公寓管理。
本文首先扼要而系统地阐述了基于非平衡态格林函数方法与密度泛函理论的第一性原理计算方法和分子器件的研究进展,以此为基础,对三并苯环分子、碳链和硅烷链体系的电子输运性质进行了计算机模拟与理论分析。着重研究了分子与电极之间的耦合、有机分子表面的吸附、侧基团效应、原子的取代以及分子间的相互作用对体系电子输运性质的影响,提出了一些构建功能分子整流器件的设想。首次构建了三并苯环分子连接在两电极之间构成的原型分
偏微分方程在科学和工程技术中有着广泛的应用,许多实际问题的数学模型都可以用偏微分方程来描述,但很多偏微分方程无法求出解析解,只能用各种方法求出其数值解。格子Boltzmann方法是上世纪八十年代末提出的一种新兴的计算流体力学方法,近年来被许多学者用来求解各类偏微分方程。通过选择合适的格子速度模型和平衡态分布函数,格子Boltzmann模型可以恢复到相应的宏观方程。格子Boltzmann方法是把连续
本文以新媒体的视角,就目前高校图书馆勤工俭学工作中所存在的问题,探讨了新媒体对大学生参与图书馆勤工俭学工作所带来的影响,提出了在新媒体环境下做好高校图书馆勤工俭学工作的新措施。
在我国社会经济的发展过程中,乡镇财政在全国财政体系中处于基础的地位之上,乡镇经济的发展与乡镇财政管理效果有一定的关系。乡镇政府财政报告质量的因素中,会计核算和财政管理是两个重要的组成部分,针对目前乡镇财政管理和会计核算工作中存在的问题,应探讨有针对性的解决策略,以提高财政管理和会计核算效果,促进乡镇经济的更好更快发展。
当21世纪的脚步踏入第二个十年之际,凝结着赵季平先生数十年创作精华的《赵季平音乐作品选集》(以下简称《选集》)也即将于2020年底付梓出版。这部《选集》含十八首(部)佳作,涵盖了赵季平先生自上世纪80年代以来的各类音乐,其中既有中国老百姓耳熟能详、传唱不衰的影视配乐,亦有在中国当代专业作曲发展史上堪称里程碑的大型作品。笔者认为,从某种意义上看,
南通理工学院以提升学生能力为重点,积极探索应用型人才培养之路南通理工学院顺应国家深化教育教学改革、立足应用型人才培养要求,以提升学生应用能力为重点,通过实施"以学生发展为中心"的"项目强化班培养计划",集成优质资源,吸纳社会(企业)优势资源,为学生个性化发展搭建舞台。学校以南通及周边区域经济社会发展需求为导向,在培养应用型人才方面进行了积极探索。与企业合作建班,按企业需求培养。学校通过与企业