vSphere HA virtual machine failed to failover

tarafından 3 Haziran 2015 tarihinde VMware, VMware vCenter kategorisine yazıldı.

Merhaba,

Bu yazımda sizlere vSphere HA ile ilgili görebileceğiniz bir alarm’dan bahsetmek istiyorum. vSphere Cluster’ında HA’i enable ettiğimizde Host Isolation Response seçeneği Leave powered on durumda ise ve host network’den herhangi bir sebepden dolayı izole oldu ise aşağıdaki hata ile karşılaşabilirsiniz.

vSphere HA virtual machine failed to failover

HA’i enable ettiğinizde Cluster’ınızda bulunan host’lardan birtanesi master diğerleride slave olarak belirlenir. Bu konu ile ilgili daha önce bir yazı yazmıştın onu aşağıdaki link’den inceleyebilirsiniz. Cluster’ınızda bulunan host’lardan biri network’den izole olabilir. Böyle bir durumda virtual machine’ler çalışmaya devam eder bu HA senaryosunun oluşacağı anlamına gelmez. Yani bu alarm’ı gördüğünüzde HA fail oldu çalışmayı durdurdu gibi bir anlam çıkarmamalısınız. Bu alarm oluştuğunda, bir veya birden fazla virtual machine vSphere HA tarafından power on olamadığı yani fail olduğu anlamını çıkarmalısınız. Host Isolation Response seçeneği Leave Powered On olduğu için Power on halde olan bir virtual machine zaten tekrar power on edilmez. Dolayısıyla böyle bir durumda herhangi bir işlem yapılmaz ve bu alarm üretilir.

http://www.tayfundeger.com/vsphere-ha-master-ve-slave-host.html

http://www.tayfundeger.com/testing-vsphere-ha.html

host-isolation-response

Bu alarm’ın oluşmasının olası nedenleri:

Host hala çalışıyor ancak network’den disconnect durumda ve Cluster üzerinde host isolation response seçeneği Leave powered on olarak seçilmiş durumda ise;

  • Bir host network’den izole olduğunda cluster’da bulunan diğer host’lar bu host’un network’den izole olduğunu veya crash olduğunu bilmezler. Sadece master’ın bundan bilgisi olur. Eğer Cluster’da Leave powered on seçeneği işaretli ise ve host network’den izole olduğu ise virtual machine’ler açık bırakılır. Yani host üzerinde bulunan virtual machine’lerde herhangi bir power aksiyonu gerçekleştirilmez. Bu işlem gerçekleştirilmedi için ve power on task’i fail olduğu için bu alarm trigger edilir.

Host hala çalışıyor ancak network’den disconnect durumda ve Cluster üzerinde host isolation response seçeneği Shut down veya Power off olarak seçili durumda ise;

  • Cluster üzerindeki host isolation response seçeneği Shut down veya Power off seçili ise, host’un networkden izole olması durumda bu host üzerinde bulunan virtual machine’ler shut down veya power off komutları gönderilecektir. Eğer virtual machine başarıyla kapatılmadı ise alarm trigger edilecektir.

Bu hatayı gördüğünüzde ilk olarak virtual machine’lerinizin uptime’ini kontrol edebilirsiniz. Eğer virtual machine’lerin uptime’larında herhangi bir sorun yok ise muhtemelen ESXi host’unuz network’den izole olmuştur ve virtual machine’ler tekrar power on edilmeye çalışılmıştır. Virtual machine’ler zaten power on durumda olduğu için Power on task’ı fail edecek ve bu alarm oluşacaktır.

Umarım faydalı olmuştur.

İyi çalışmalar.

Bu yazı blog üzerinde Tayfun DEĞER tarafından paylaşılmıştır. 2009 yılında açılan blog kısa zaman içerisinde büyük bir izleyici kitlesine sahip olmuştur.Tayfun DEĞER danışmanlık ve eğitimler vermektedir. vExpert 2013-2015, VCP5, VCP5-DT, VCP-Cloud ve MCSE sertifikalarına sahiptir.Twitter 'dan @tayfundeger veya RSS ile sitedeki değişiklikleri takip edebilirsiniz.