基于Spark的粒子群算法并行编程及其在水库调度中的应用

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:arieswys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
黑河流域水资源数据量庞大,数据关系复杂,应用常规技术进行优化调度难度较大。本文针对黑河流域当前存在的水资源调度问题,应用大数据处理与进化计算技术,基于大数据计算框架Spark与并行化的粒子群算法,研究开发了黑河流域水库群多目标优化调度系统。在研究开发过程中,作者分析了黑河流域水资源优化调度系统多个目标的特点,将多个目标转化成单个目标,得到该问题的求解模型。接着研究了并行算法编程模型、用于优化问题求解的粒子群算法及其并行化策略,以及基于Spark大数据计算框架的粒子群算法并行化方法。在理论与技术研究的基础上,以Hadoop2.7.1、Sparkl.5.2、Spark on Yarn软件为基础,搭建了大数据支持平台;在该平台的分布式文件系统HDFS中存储了获取的黑河流域水资源数据。接着在Ubuntu Linux操作系统环境、Spark平台下,应用Scala语言开发了基于粒子群算法的水库群多目标优化调度并行程序,实现了可处理水库调度大数据、可高速运行调度优化程序的水库群多目标优化调度系统。本调度系统的数据载入、程序运行、结果查询等操作都是在Ubuntu Linux操作系统与Spark平台、界面下进行,对于不熟悉Spark运行机制的普通使用者来说,使用困难极大。为了解决此问题,我们还开发了一个水库群多目标优化调度系统应用平台,实现了大数据的上传、下载、删除、查询,以及需要Spark大数据平台处理的应用程序任务的提交运行和SQL查询等功能。本课题的研究开发工作,将为水资源优化调度系统的高效运行起到积极的促进作用,对于基于Spark平台的大数据并行编程的发展与应用也有很好的参考价值。
其他文献
目前,我国的物流企业正处于一个高速发展的时期,发展物流产业的目标是提高物流效率,降低物流成本,从而最大程度满足客户需求。这使得物流行业朝着信息化、网络化、智能化、标准化
列车的方便、快捷无疑为我们的生活带来许多便利,但同样列车的安全、运输效率也越来越受到人们的重视,列车性能的改进成为该领域的核心内容。我国在考虑自身的实际情况和未来发
随着嵌入式技术,数字图像处理技术,网络通信技术和视频压缩技术的快速发展,嵌入式视频监控系统正朝着网络监控和智能监控的方向发展。在智能视频监控方面,无论是国内还是国外
当前,云计算正在受到越来越多的关注,开源云平台如Eucalyptus、OpenStack等主要提供IaaS层上的服务,即基础设施即服务,用户向云平台购买一定量的虚拟机,将自己的任务提交到购买的
合成孔径雷达(SyntheticAperture Radar, SAR)凭借其独特的优势在军事、国民经济领域中有着广泛的应用。然而事实上SAR系统的信息获取技术明显超前于信息处理技术,使得SAR图像数
随着计算机技术及互联网技术的快速发展,越来越多的隐私信息在网络中传输,由此产生一系列信息安全问题,如:非法窃取、监听、传播数据信息等。图像是信息传递的一种重要方式,
自二十世纪九十年代以来,多Agent系统逐渐成为人们研究的热点,对许多科学技术的发展产生了深远的影响。多Agent系统比较适用于复杂的分布式计算,且能有效地避免大规模分布式站点
公共交通网络是现代城市交通网络中最重要的基础设施之一。在大中城市,公共交通系统扮演着尤为重要的角色,特别是在“低碳生活,绿色出行”概念越来越受市民认可的今天,公共交通更
功耗已经成为设计各种计算机设备必须考虑的首要问题。移动嵌入式设备,如智能手机、平板电脑等,不仅电池电量有限,而且电池密度发展缓慢。更低的功耗意味着更长的使用时间和更好
支持向量机(SVM)是解决分类问题的一项机器学习核心技术。然而,实际工程中由于数据采集不及时,数据样本不全面,数据不连续导致训练样本很难覆盖全部样本空间,对外往往表现出