云环境下基于蚁群算法的动态容错技术研究

点击数:976 | 发布时间:2024-12-30 | 来源:www.qqltoy.com

    0 引言

    云计算是一个热点研究方向,很多企业都相继开发源于己的云端系统进行运算与研究。然而,只须是计算机就会发生错误[1]。在云计算中因为资源的高度动态性和异构性,使云计算平台较传统计算平台出错几率更高[2]。为降低发生错误所导致的损失,需要容错机制保证系统在问题状况下也能持续运行[3]。容错包含问题测试或辨别、问题预测和问题恢复3个方案。问题测试或辨别一般用于测试问题种类,然后用比较合适的策略进行问题诊断。问题预测侧重于依据历史数据预测问题发生的概率,并应用适合的调度方案减少问题概率。问题恢复常用技术有作业复制和检查点[4]。作业复制的优点是无需重新计算,由于每一个作业都会同时分配给不同资源的多个副本,假如其中一个失败,其它作业副本仍然可以处置[5]。但,这种技术不是非常有效,由于作业的副本单独实行或许会占用作业队列。检查点是另一种技术,它需要将运行任务的状况存储在一个已概念的检查点上。假如作业实行失败,则从最后一次保存的状况重新启动任务实行而不是从头开始,如此可很大地节省任务实行时间。

    针对云计算容错技术,国内外学者进行了相应研究,提出了很多算法:文献[6]提出了周期任务模型的容错调度算法,但该模型需要所有任务的周期一模一样,文献[7] 研究了动态实时调度算法与速率单调算法。文献[8]讨论带固定优先级实时调度算法,这类算法均没考虑系统的容错问题。文献[9]针对目前计算机系统计算和存储资源丰富但并行文件系统写带宽提升相对滞后的特征,提出了基于内存缓存的异步检查点容错技术。文献[10]提出了一种主备份的容错调度方案用于对宿主机的错误容忍,其用主从宿主机结构,需要设置多个宿主机作为备份宿主机,对宿主机资源浪费比较紧急。文献[11]提出了增强型蚁群优化算法(Enhanced Ant colony Optimization, EACO),依据任务和资源数目引入动态蒸发速率确定信息素蒸发速率,确保每一个资源处置的任务数目不少时蒸发率非常小,不然蒸发率会非常高,实验结果表明控制蒸发率可有效平衡所有资源的负载。文献[12]提出了基于信赖的蚁群优化调度算法(Trust-based Ant colony Optimization,TACO),旨在尽可能降低作业完成时间,平衡所有可用资源的工作量,同时引入面向资源的信赖机制处置资源问题问题。文献[13]通过ACS算法和有向无环图(DAG)办法相结合,提出了一种新的云计算问题管理算法,该算法可提供有效的资源分配但没恢复操作。文献[14]提出基于遗传算法(Genetic Algorithm,GA)的混合蚁群优化算法,以克服元启发式算法不受控制的性质,但会减少云计算分配性能。文献[15]提出在云计算中用检查点的容错蚁群优化算法(Fault Tolerance ACO,FTACO),有效借助云计算中的动态资源解决问题和负载平衡问题。文献[16]提出了用蚁群优化算法进行云计算的容错作业调度以满足服务水平需要,该服务用资源失败率和基于检查点的回滾恢复方案。在任务实行期间,问题索引管理器将不断与检查点处置程序交互以记录资源问题率,每发生一次问题,都将应用回滚恢复技术以节省实行时间,该算法降低了任务总实行时间,提升了吞吐量和平均周转时间。 1 系统建模

    蚁群优化算法是一种生物启发式算法,为求解优化问题和设计元启发式算法提供一个自适应定义[17]。蚁群优化算法在处置调度和负载均衡时很有效,且在查找最好路径过程中出现问题时可构建替代路径,图1为蚁群在查找最好路径期间出现问题最后找到替代路径的例证[18]。

    步骤如下:①通过蚁群1打造最佳资源a的路径路线;②资源a实行任务失败,重新调用提交步骤;③通过蚁群1打造替代资源b的新路径,并完成任务的提交和处置;④从不同来源的蚁群2选择由前一个蚁群1架构的最佳路径分配下一个任务。

  • THE END

    声明:本站部分内容均来自互联网,如不慎侵害的您的权益,请告知,我们将尽快删除。

专业院校

返回顶部

Copyright©2018-2024 中国人力资源网(https://www.dgzhou.com/)
All Rights Reserverd ICP备18037099号-1

  • 中国人力资源网微博

  • 中国人力资源网

首页

财经

建筑

医疗