技术中心
 
 

利用工具解决虚拟机监测难题

   日期:2007-08-16     来源:CNW.com.cn    作者:管理员    

——用NetVigil模块跟踪VMware和Microsoft虚拟服务器

    服务器虚拟化正在成为引人瞩目的话题,这个话题随着x86虚拟化领域的领头羊VMware的IPO日期临近而变得更加热闹。那么,对于虚拟机来说,如何才能够得到很好的管理和监测呢?

    “整体”应用平台监测的圣杯被Network General公司所夺得。该公司向其NetVigil监测产品添加了使IT人员能够了解两种流行的虚拟化产品――VMware的ESX 和Microsoft Virtual Server――的内部工作情况的模块。

    随着虚拟机以惊人的速度进入企业各个角落――业界分析师预测这个市场的规模明年将接近300亿美元――IT为管理虚拟化资源以及传统物理资源忙得不亦乐乎。直到不久前,监测虚拟服务器环境中hypervisor层的能力一直难以得到。NetVigil现在接入虚拟服务消息过程来采集运行在它们上的托管的操作系统和应用的信息以及物理和网络数据点。

    NetVigil将产品定位于需要全面掌握应用行为的IT管理员:从响应能力到基础虚拟机性能和一般由范围更广的NetVigil网络监测功能报告的网络情况。

    NetVigil模块还可以挂上虚拟机流行的快速rehosting和资源调节功能,为IT人员提供他们何时应当重新分配业务应用资源来取得最佳性能的信息。

    在测试虚拟机监测功能时,我们发现需要做很多的准备和配置工作才能得到有用的数据。然而,一旦安成这些工作,我们就离不开其易于辨别的监测界面了,这个界面提供了运行在我们系统上的所有主要应用的整体视图。

    NetVigil的业务端是一个管理控制台。这个管理控制台作为一个模块化的信息框,提供应用过程和平台组的管理员级视图。这些信息框用于显示不同的应用功能,如Web服务器或电子邮件服务器。

    让NetVigil发挥作用,需要管理工作和一定的网络、服务器、虚拟服务器、操作系统和应用参数的知识,只有这样才能让它把信息整合到逻辑的、细微分类的信息框中。幸运的是,NetVigil可以生成非常清晰的业务对象视图,然后随时准备发出报警和有关业务对象条件的易于理解的报告。

    虽然NetVigil依靠它无法控制的输入数据――它接入微软的Windows Management Instrumentation (WMI)获取Microsoft Virtual Server信息和SNMP提供的VMware数据――但它使系统管理员可以掌握虚拟系统健康状况的有用的、全面的信息。与多数基础测试相比,它能够更好地临时或有规律地定期评估系统健康,如简单的ping测试(还活着吗?)和HTTP网页加载(服务器正常运行并及时提供网页吗?)。此外,管理员还可以设置虚拟机系统性能临界值,如果超过这个临界值则触发报警。

    发动你的引擎

    Network General将NetVigil诊断与系统健康测试划分为两个基本类,这两个基本类由数据移动和网络协议分析――Network General的传统核心优势――和组件分析提供动力。后者来自NetVigil名为自解释数据采集引擎(DGE)和业务可见性引擎(BE)的标准组件,这些组件提供系统信息(如硬件数据);操作系统统计数据(如使用的硬盘空间和CPU使用情况)以及总体系统性能参数(如通过NetVigil测试序列结果得到的Web服务器的时延)。

    把这些数据组合在一起,构成业务应用视图。额外的VMware和Microsoft Virtual Server监测功能使系统管理员可以重新分配资源来优化应用平台的资源使用和效率。例如,如果服务器上的Web资源出现讨厌的高使用率,VMware的Virtual Center Server可被用来重新分配一台服务器主机上的资源,让需要额外CPU资源的服务器受益。

    BVE组件不是完全的即插即用基础设施监测器,但略加调整,它们可以成为用于运行在虚拟化主机平台上的应用的有用的诊断、决策支持、报警系统。

    NetVigil DGE是核心许可组件(用户拥有的DGE越多,费用就越高)。DGE安装在Linux(Red Hat、Fedora Core)、Solaris或Windows服务器上。我们发现NetVigil DGE不支持64位Linux,而且尽管看起来似乎安装正确,但产生奇怪的错误。DGE收集每个分立的虚拟机的信息,使它可与其它虚拟服务器分开查看,然后与其它信息关联在一起构成业务视图。DGE显示数据流以及每台虚拟机的数据流百分比、平均值和标准差估计。与VMware SNMP管理信息库(MIB)数据集相比,在我们的评估中,WMI数据提供有关Microsoft Virtual Server的更多的数据点。

    我们能够监测VMware支持的虚拟机(48个)以及24个以上的Windows 2003 Enterprise Server Microsoft虚拟机。在我们的所有测试中,甚至NetVigil在高负载条件下,我们没有发现DGE主机――运行在3.0GHz 32位 AMD Athlon CPU上的Windows 2003 Standard Edition Server――上出现延迟。

    可以被监测的设备必须具有静态IP地址;由于设备的地址可能变化,因此DHCP不能为NetVigil提供轮询设备的能力。如果设备采用了防常见探测技术的措施,可能必须手工输入设备。

    经过几个安装步骤后,NetVigil执行对指定网络地址探测,了解设备是否在网上。然后应用管理员定义的、基于权限的角色,使IT人员和有关人员(如CFO)可以查看系统性能和可用性报告。这还创建一个可能发生的不同事件的报警被指派者类。当大量的内存被用于某个Web应用时最好不要去麻烦CEO,而这对Web管理员非常重要,角色定义把信息分类提供给相应的用户。

    DGE探测器侦听和测试网络上的设备。我们把DGE配置为侦听VMware SNMP陷阱、定期运行对运行在MVS上的Internet Information Server和运行在VMware上的Apache服务器的测试。我们还把DGE探测器设置为监视目标虚拟机上的FTP文件。

    我们通过随机杀掉虚拟机测试了临界值和设置,让CPU以最大速度运行和广泛用多种临界值测试来考虑CPU。NetVigil正确地提供出错信息和向我们的电子邮件收件箱发送报警信息。

缺点

我们在测试NetVigil发现了一些奇怪的事情。一段时间不使用GUI后,GUI会关闭,这样做有益于安全。但是奇怪的是控制台口令被缓存在登录屏幕上,从而抵消了屏幕保护的有益的效果。

用户界面很容易把使用者搞得头晕眼花。尽管设备和设备可以建立关联,但用户界面会很容易试图把太多的信息塞到控制台的视窗中。NetVigil的确能够钻取和监测某一台测试服务器――双CPU四内核IBM x3650服务器――的CPU使用情况。但它总是试图用信息填满用户界面。

总体印象

配置和调整NetVigil需要花费大量的时间(由于有关配置的资料不是非常清楚,我们给Network General的技术支持人员打了好几次富有成效的电话),但回报是与监测虚拟机的有着特殊联系的非常清晰的控制台和报警系统。

 
  
  
  
  
 
更多>同类技术
• 嵌入式软PLC虚拟机在电气测试中应用 • 虚拟机床加工系统研究
• 虚拟机床技术
 
全年征稿 / 资讯合作