论文部分内容阅读
随着信息通讯技术的发展与云计算的普及,以平板电脑,智能手机为代表的组织型云端设备逐渐成为人们生活的必需品。区别于传统计算设备,由功能相同、结构相似的云端设备构成的组织型云端系统在应用管理、数据备份、系统管理、安全管理、生态管理、寿命管理等方面都具有独特的、类似于生物组织的结构特征,这使得适用于云端设备的可靠性保障方法与传统计算系统有显著的不同。软件老化问题是影响系统可靠性的重要因素。基于云端设备的操作系统更迭频繁、节能技术发展迅速、用户使用习惯多样等现状,云端设备已逐渐成长为长运行(long-running)系统,随之加剧的软件老化现象亟待解决。软件抗衰技术是免疫软件老化的主要方法。针对组织型云端系统组织结构特征,以及云端设备的资源有限、负载周期不明显、软件和系统更新频繁等问题,本文提出了组织型云端抗衰系统体系结构,通过应用融合云端系统组织结构的模型和算法,解决抗衰系统调度中软件老化判定、抗衰阈值确定、抗衰数据存储传输三方面的问题,并通过实证与定量分析的方法,验证了算法和模型的可行性与有效性。本文的主要工作和贡献如下: 1、在组织型云端抗衰系统的模型设计方面:本文以保证并进一步提高抗衰系统的用户体验为前提,在分析现有的单细胞型抗衰模型的基础上,提出了融合组织型结构的云端抗衰系统模型,改进抗衰系统的可用性、准确性,并在此基础上设计抗衰系统的体系结构,在抗衰系统中,根据云端抗衰的实际需求选择相应的抗衰策略,以达到提高系统的可靠性的目标。 2、在软件老化状态判定方面:软件抗衰的调度问题是解决软件老化的第一步,而软件老化判定模型从总体上决定着抗衰的时机,因此,该模型的确定是解决抗衰调度问题的首要步骤。本文通过分析传统软件老化判定模型的优缺点,结合云端设备自身的特点,提出了云端设备中约束元的概念,并将约束元应用于软件老化判定模型中,通过对系统经过约束元的频度和次数的研究,预估云端设备软件老化的状态。最终达到在资源有限、用户操作无规律的云端设备上,利用较少的资源,预估云端设备系统当前可能发生失效的概率的目的,并进一步利用抗衰操作,有效降低了失效后可能带来的严重后果。 3、在抗衰阈值确定方面:抗衰阈值问题直接决定着抗衰时机的有效性。本文通过分析传统抗衰阈值模型的优缺点,提出结合群体感知概念,在以系统环境复杂、开发周期短、软件更新频繁为特点的组织型云端设备上,利用云端设备软硬件环境的相似性,减少单一设备中收集的抗衰数据量,并通过感知权值,计算不同分组的抗衰数据对当前设备的影响,得出该设备相对精确的抗衰阈值。最终达到在较少影响用户体验的前提下,有效完成抗衰任务,保障云端系统的可靠性的目标。 4、在抗衰数据存储传输方面:为了评估和优化抗衰模型,需要保存和传递抗衰数据。云端设备存储资源的有限性与享有云服务的能力,使得抗衰数据的存储、传输需要更高效的方法与之对应。本文通过分析日志型存储的特点与传统的云存储传输服务模式,针对抗衰模型中的抗衰数据提出了一种新型的存储传输模式,针对云端设备的本地存储资源,网络通讯等方面进行了专门的优化,更可靠地保存和传输了云端设备的抗衰数据,为抗衰模型提供更准确、完整的数据信息。使得云端系统软件抗衰模型得到更高效地利用,保障了服务的可靠性。 最后,本文基于组织型云端抗衰系统架构,在Android平台上实现了一个云端抗衰系统,验证了该系统架构和相关的算法在实际云端环境中提高系统可靠性的可行性。