专题栏目:ARVRMR虚拟现实

仿真网格负载均衡是什么意思?

仿真网格中计算结点的负载可以从两个层面进行管理一方面,在仿真初始化阶段,应该合理地将各个仿真任务分配到网格中的计算结点,避免出现过载的情况而影响仿真的正常推进,这是仿真网格调度算法所关注的问题,前面已经对网格调度算法进行了介绍。在基于网格的大规模分布式仿真中,涉及大量的计算资源,仿真运行可能也要持续较长时间。由于不同结点上运行的盟员的不确定性和不可预见性,结点负载会产生较大的变化,同时由于人为因素或者故障,结点资源的可用性也无法保障。因此,有必要实现分布式结点之间的负载均衡,以提高资源利用率,保证当某个计算结点负载过重或者不可用时使仿真推进能继续进行。负载均衡的常用方法包括调度新加入的盟员到负载较轻的结点上运行和迁移重负载结点上正在运行的盟员到轻负载结点上继续运行。为新加入盟员或者迁出盟员选择合适的目标结点是负载均衡的一个重要方面,一般运用网格提供的任务调度器来实现,也有的系统根据自身的特点开发调度器,如 CrossGrid生物医学应用的 Broker Service调度器。盟员迁移可在一定程度上弥补HLA中计算资源和数据资源的紧耦合的缺陷,许多学者提出了各自的盟员迁移方法。

迁移盟员最基本的方法是利用HLA的标准接口 Federation Save和 Federation Re store。在盟员迁移开始前,先利用 Federation Save保存全联盟盟员的状态和RTI的状态。当迁移盟员退出联盟并在目标结点上重新加入联盟后,使用 Federation Restore恢复联盟。该方法使用标准的HLA接口,简便易行。但是,每个盟员迁移都要全联盟范围内的盟员暂停,开销较大。

保存整个HLA的内Katarzyna Zajac等利用 Federation Save和 Federation Restore 保存整个HLA的内部数据,并开发了Migration Library(L)支持用户数据的保存,保存后的用户数据则通过 Globus的 GridFTP服务进行传输。

广义上讲,对等计算(Peer-to-Peer- Computing)是网格计算的一种形式。 Eklof等在基于JXTA平台的对等网络计算环境下对盟员迁移进行了研究。整个联盟运用一个 HLA Manager盟员控制盟员的迁移,员的状态以ASCI文件的形式保存。由于HLA Manager盟员仅支持保守时间管理策略,该方法要求联盟中的所有盟员必须既是时间受限的又是时间控制的,应用范围具有一定的局限性。

2001年, Luthi,J.等在网络工作站(Network of Workstations,now)上实现了资源共享系统( Resource Sharing System,RSS),通过迁移盟员的方法平衡各工作站上的负载。

RSS系统由 Manager一个管理迁移,为了尽量减少对HLA盟员的改动,引入了一个 CommFed盟员作为HLA盟员与 Manager之间通信代理 Client可以控制该工作站加入或者退出仿真系统,第三方的TP服务器用来传输迁移盟员的状态数据RSS系统虽然是在NOW上实现的盟员的迁移,但是对基于网格的分布交互仿真盟员迁移具有重要参考价值。RSS的一个不足之处是用第三方的FTP服务器传输迁移数据,开销较大。

Wentong Cai等在LMS上实现了网格范围内的盟员迁移。其思路是在每个盟员中集成一个 LMSHandler负责盟员的暂停和保存,将盟员状态保存在一个中间文件中并利用 Globus提供的FTP服务将其上传至第三方FTP服务器,目标结点从FTP服务器下载状态信息后从暂停处恢复迁移盟员的执行。由于该方法使用了FTP服务器来中转状态文件,带来较大的时间开销。

为了避免盟员迁移时全联盟状态信息的保存和第三方FTP服务器中转状态文件带来的开销, Wentong Cai等对基于LMS的盟员迁移进行了研究,在每个盟员上集成消息计数器,迁移盟员在退出联盟前将其消息计数器跟与之有交互的盟员的消息计数器相比较以确定是否会发生消息丢失,同时将迁移盟员在目标结点重启,加入联盟的过程与该盟员的仿真运行过程相重合以缩短迁移时间,而状态信息以点对点的方式在源结点与目标结点之间传输。该方法迁移盟员对非迁移盟员是透明的,不需要全联盟的保存,也不需要第三方FTP服务器的支持,然而盟员需要进行一定的修改,重用已有的HLA盟员存在问题。

答案来源:黄海 《虚拟现实技术》

发表评论

相关文章