VMware vSphere HA makale serisine Host Failure Detection konusu ile devam ediyoruz. Eğer önceki makaleyi okumadıysanız, aşağıdaki ilk makaleden başlamanızı öneririm.
VMware vSphere HA, clusterda yer alan hostları izlediği gibi sanal makine ve sanal makinelerde çalışan uygulamaları da izleyebilir. VM ve Application monitoring kısmında false-positive durumlar ile karşılaşmamak adına bu seçenekleri iyi anlamak için detaylara göz atalım.
vSphere HA VM Monitoring
HA Clusterda VM monitoring özelliği aktif hale getirdiğimizde, sanal makinenin sağlığından emin olmak için OS seviyesinde heartbeat (vmware tools ile) ve disk/network io aktiviteleri izlenmeye başlar.
VMware tools’un heartbeat göndermeyi durdurması istenmeyen restart işlemlerine sebebiyet verebileceğinden, disk ve network tarafında io aktivitesi de kontrol edilmektedir. Heartbeat gönderme işlemi vmware tools tarafından yapıldığından, sanal makinelerde vmware tools yüklü olması gerekir.
Varsayılan olarak vSphere HA, 120 saniye boyunca heartbeat göndermeyen ve herhangi bir IO aktivitesi gözlemlenmeyen sanal makineyi resetler. Bu değeri gelişmiş ayarlardan das.iostatsinterval değeri güncellenerek özelleştirilebilirsiniz.
Burada sanal makinenin reset döngüsüne girmesi gibi bir problem oluşma ihtimali var. VM Monitoring ayarlarından hassasiyeti ayarlanabilir ve reset sayısını limitleyerek bu problemin önüne geçilebilir.
Önemli :
Maximum reset VM her kapanıp açıldığında ya da vMotion ile başka host üzerine taşındığında sıfırlanacaktır.

vSphere HA Application Monitoring
Application monitoring de VM monitoring ile aynı mantıkta çalışmaktadır. Burada uygulamanıza uygun SDK paketine ihtiyacınız var. Sonrasında uygulamanız için uygun olan heartbeat gönderimini sağlayarak hata durumunda VM’in resetlenmesini sağlayabilirsiniz.
VMware’in neredeyse tüm ürünleri için, application monitoring doğradan desteklendiğinden herhangi bir ek aksiyona gerek yok.
Application monitoring özelliğini kullanabilmek için VM Monitoring’in de aktif olması gerekir.
vSphere HA’in VM Component Monitoring konusu ile devam edeceğimiz bir sonraki makaleye aşağıdaki linkten ulaşabilirsiniz.