VMware vSphere HA #5 VM Component Protection (VMCP)

VMware vSphere HA makale serisine Host Failure Detection konusu ile devam ediyoruz. Eğer önceki makaleyi okumadıysanız, aşağıdaki ilk makaleden başlamanızı öneririm.

VMware vSphere HA özelinde bence en önemli konulardan biri VM Component Protection. Bu konu doğrudan datastore erişimleri ile alakalı, veri bütünlüğüne de etkisi olabildiğinden bu konunun iyi anlaşılması gerektiği kanaatindeyim.

vSphere HA VM Component Protection (VMCP)

VMCP host ve datastorelar arasındaki erişimleri kontrol eden opsiyonel mekanızmadır. Bu vSphere HA üzerinden kapatılıp açılabilen bir özellik olduğundan opsiyonel olarak belirttim. Opsiyonel olsa da ben mutlaka kullanılmasını tavsiye ederim. VMCP host üzerindeki datastore ya da datastorelarda erişim problemi olması durumda bu durumdan etkilenen sanal makineleri datastore erişim problemi olmayan diğer hostlar üzerinde yeniden başlatılmasını sağlar.

vSphere HA VMCP APD PDL

VMCP datastore erişim sorunlarını iki şekilde ele alır;

APD (All Paths Down)

All paths down datastore’a hiç bir pathten erişim sağlanamadığı ya da io da hesaplanamayan bir gecikme olması durumunu işaret eder. Bu durum genelde iSCSI ya da NFS için ip network, FC için SAN fabricler üzerindeki sorunlar sebebiyle ortaya çıkar. VMware APD durumunu recover edilebilir olarak değerlendirir. Yani APD eventi tetiklendiğinde sanal makineler restart edilmeden de problem düzelebilir.

Ama bu durum genelde APD eventi tetiklendiğinde ne kadar sürdüğüne bağlı olarak değişebiliyor. APD eventi tetiklendiğinde datastore erişimi olmadığından sanal makine veri okuma yazma operasyonlarını gerçekleştiremez. Bu durum özellikle OS disklerinin bulunduğu datastorelarda uzun sürdüğünde windowslar bsod, linuxlar için psod ekranları kaçınılmaz oluyor. OS harici disklerde yaşanan problemlerde ise servis ve uygulamalarda çökmeler yaşanacaktır.

PDL (Permanent Device Lost)

Permanent Device Lost durumu da storage ünitesinin erişim olmadığını raporlamasını işaret eder. Bu durum genelde storage ünitesi üzerinden volume/host mappinglerinin kaldırılması gibi sebepler ile ortaya çıkar. Bu durum ortaya çıktığında sanal makineler yeniden başlatılmadan çalışmaya devam etmeyecektir.

Buraya kadar olan kısım net ise, APD ve PDL durumlarında etkilenen sanal makineler için hangi aksiyon alacağını belirleyebilirsiniz.

VMCP Recovery Workflow

VMCP Recovery Workflow

VMCP Recovery Timeline

Önemli Noktalar

Bu ayarı tamamen devre dışı bırakabilirsiniz ama en azından Issue Events olarak bırakmanızı öneririm. Olası problemlerde farkındalık sağlayacaktır.

Eğer poweroff-restart seçeneklerini tercih ederseniz host monitoring ve vm restart priority ayarlarının devredışı olmaması gerekir. Issue events ayarı için bu gereksinim söz konusu değil.

Ayrıca bu mekanızmanın düzgün çalışabilmesi için her bir storage ünitesi üzerinden en az 2 datastore kullanıyor olmalısınız. Her ne kadar VMware best-practice’i olsa da hatırlatmakta fayda var. Eğer tek datastore kullanırsanız ve storage üniteniz LUNZ kullanmıyorsa APD ve PDL ayrımı mümkün olmayacaktır.

vSphere HA’in Datastore Heartbeating konusu ile devam edeceğimiz bir sonraki makaleye aşağıdaki linkten ulaşabilirsiniz.

İLGİNİZİ ÇEKEBİLİR

VMware Explore 2023

VMware Explore 2023, kurumsal uygulamalar, bulut mimarisi, altyapı, EUC, network ve güvenlik ile ilgilenenler de ...

VMware Power Actions 1.0

VMware Power Actions uzun zamandır takip ediyordum ve sonunda 1.0 sürümünün yayınlandığını görmek beni gerçekten ...

VMware Tanzu – Storage

Bir önceki yazımda kubernetes platformları storage konseptleri hakkında temel bilgiler paylaşmıştım. Bu yazımda da Tanzu ...

Kubernetes Platformları – Storage

Bu makalemde kubernetes platformlarında kullanılan depolama çözümleri ile ilgili temel bilgi ktarmaya çalışacağım. VMware Tanzu ...

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Bu site, istenmeyenleri azaltmak için Akismet kullanıyor. Yorum verilerinizin nasıl işlendiği hakkında daha fazla bilgi edinin.

error: İçerik Korumalıdır !!