VMware vSphere HA #5 VM Component Protection (VMCP)

VMware vSphere HA makale serisine Host Failure Detection konusu ile devam ediyoruz. Eğer önceki makaleyi okumadıysanız, aşağıdaki ilk makaleden başlamanızı öneririm.

VMware vSphere HA özelinde bence en önemli konulardan biri VM Component Protection. Bu konu doğrudan datastore erişimleri ile alakalı, veri bütünlüğüne de etkisi olabildiğinden bu konunun iyi anlaşılması gerektiği kanaatindeyim.

vSphere HA VM Component Protection (VMCP)

VMCP host ve datastorelar arasındaki erişimleri kontrol eden opsiyonel mekanızmadır. Bu vSphere HA üzerinden kapatılıp açılabilen bir özellik olduğundan opsiyonel olarak belirttim. Opsiyonel olsa da ben mutlaka kullanılmasını tavsiye ederim. VMCP host üzerindeki datastore ya da datastorelarda erişim problemi olması durumda bu durumdan etkilenen sanal makineleri datastore erişim problemi olmayan diğer hostlar üzerinde yeniden başlatılmasını sağlar.

vSphere HA VMCP APD PDL

VMCP datastore erişim sorunlarını iki şekilde ele alır;

APD (All Paths Down)

All paths down datastore’a hiç bir pathten erişim sağlanamadığı ya da io da hesaplanamayan bir gecikme olması durumunu işaret eder. Bu durum genelde iSCSI ya da NFS için ip network, FC için SAN fabricler üzerindeki sorunlar sebebiyle ortaya çıkar. VMware APD durumunu recover edilebilir olarak değerlendirir. Yani APD eventi tetiklendiğinde sanal makineler restart edilmeden de problem düzelebilir.

Ama bu durum genelde APD eventi tetiklendiğinde ne kadar sürdüğüne bağlı olarak değişebiliyor. APD eventi tetiklendiğinde datastore erişimi olmadığından sanal makine veri okuma yazma operasyonlarını gerçekleştiremez. Bu durum özellikle OS disklerinin bulunduğu datastorelarda uzun sürdüğünde windowslar bsod, linuxlar için psod ekranları kaçınılmaz oluyor. OS harici disklerde yaşanan problemlerde ise servis ve uygulamalarda çökmeler yaşanacaktır.

PDL (Permanent Device Lost)

Permanent Device Lost durumu da storage ünitesinin erişim olmadığını raporlamasını işaret eder. Bu durum genelde storage ünitesi üzerinden volume/host mappinglerinin kaldırılması gibi sebepler ile ortaya çıkar. Bu durum ortaya çıktığında sanal makineler yeniden başlatılmadan çalışmaya devam etmeyecektir.

Buraya kadar olan kısım net ise, APD ve PDL durumlarında etkilenen sanal makineler için hangi aksiyon alacağını belirleyebilirsiniz.

VMCP Recovery Workflow

VMCP Recovery Workflow

VMCP Recovery Timeline

Önemli Noktalar

Bu ayarı tamamen devre dışı bırakabilirsiniz ama en azından Issue Events olarak bırakmanızı öneririm. Olası problemlerde farkındalık sağlayacaktır.

Eğer poweroff-restart seçeneklerini tercih ederseniz host monitoring ve vm restart priority ayarlarının devredışı olmaması gerekir. Issue events ayarı için bu gereksinim söz konusu değil.

Ayrıca bu mekanızmanın düzgün çalışabilmesi için her bir storage ünitesi üzerinden en az 2 datastore kullanıyor olmalısınız. Her ne kadar VMware best-practice’i olsa da hatırlatmakta fayda var. Eğer tek datastore kullanırsanız ve storage üniteniz LUNZ kullanmıyorsa APD ve PDL ayrımı mümkün olmayacaktır.

vSphere HA’in Datastore Heartbeating konusu ile devam edeceğimiz bir sonraki makaleye aşağıdaki linkten ulaşabilirsiniz.

İLGİNİZİ ÇEKEBİLİR

VMware Explore 2022

Pandemi tedbirleri sebebiyle 2020 ve 2021 yılında online olarak gerçekleştirilen VMworld etkinliği bu yıl VMware ...

VMware vSphere HA #4 VM – Application Monitoring

VMware vSphere HA makale serisine Host Failure Detection konusu ile devam ediyoruz. Eğer önceki makaleyi ...

VMware vSphere HA #3 Host Isolation Response

VMware vSphere HA makale serisine Host Failure Detection konusu ile devam ediyoruz. Eğer önceki makaleyi ...

VMware vSphere HA #2 Failure Detection – Proactive HA

VMware vSphere HA makale serisine Host Failure Detection konusu ile devam ediyoruz. Eğer önceki makaleyi ...

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

This site uses Akismet to reduce spam. Learn how your comment data is processed.

error: İçerik Korumalıdır !!