论文部分内容阅读
当前云计算在工业界取得了巨大的成功,越来越多的公司和个人用户通过互联网使用云计算服务,这也加速了云计算的发展。随着云用户需求越来越复杂,云用户难以直接从服务提供商处购买合适的实例资源,因此云市场中产生了云资源代理商,代理商通过向服务提供商购买云资源并将其转租给用户赚取利润。但是,由于预算有限,云市场中的云资源代理商能够从云资源提供商处购买的资源也是有限的,并且在云计算市场中,云用户对资源的需求是随机的。因此,为了在有限的时间内获取更多的收益,云资源代理商需要将有限的资源分配给更有“价值”的用户。基于此,本文对云计算市场中云资源代理商的资源分配策略进行分析,主要研究云资源代理商在无竞争环境下以及竞争激烈环境下的资源分配策略。本文主要研究工作如下:(1)给出本文所研究问题的基本设定,首先建立云用户的随机需求模型,即考虑每个阶段进入市场的云用户的数量是动态变化,并且每个云用户的资源需求是动态变化的。然后,在竞争环境中,建立云用户对多个云资源代理商的选择模型。最后给出了云资源代理商的期望收益的计算方法。(2)接着在无竞争的云计算市场环境中分析云资源代理商如何分配资源。本文将每个阶段提交资源请求的云用户看作一个整体,提出一种Q-DP算法来解决无竞争环境中云资源代理商的资源分配问题。首先,本文将每个阶段云资源代理商为整体云用户分配资源的过程建模为一个马尔科夫决策过程,并使用强化学习算法——Q-learning来生成云资源代理商在每个阶段的分配策略,决定应该分配多少实例资源给本阶段提交请求的所有云用户。然后,本文使用动态规划算法来决定应该具体满足哪些云用户的需求。本文进一步通过实验,对Q-DP算法中使用的资源分配策略与其它典型的资源分配策略进行了对比分析,结果表明,Q-DP算法中使用的资源分配策略在资源极为有限的环境下可以为云资源代理商提供更多的收益。(3)最后在两个云资源代理商竞争的云计算市场环境中分析代理商如何资源分配。本文将两个云资源代理商间竞争的过程建模为一个马尔科夫博弈,使用Minimax-Q learning算法产生了多种云资源代理商在竞争环境下的资源分配策略(包括竞争环境中的定价策略),并对这些策略进行分析。实验发现,采用Minimax-Q learning算法生成的策略进行定价有助于提高云资源代理商的长期收益,并且在次基础上,结合Minimax-Q learning算法和Q-learning算法生成的资源分配策略也能够提高云资源代理商的长期收益。本文的研究结果对云计算市场中云资源代理商的资源分配有一定的参考价值。