NSX 6.2 Communication Healthcheck

tarafından 25 Aralık 2015 tarihinde VMware, VMware NSX kategorisine yazıldı.

Merhaba,

NSX 6.2 ile birlikte Communication Channel Health adında  güzel bir feature geldi. Bu feature sayesinde NSX Manager ve Controller’lar (Cluster veya ESXi host) arasında yaşanan iletişim sorununu troubleshoot edebileceğiz.

NSX 6.2 kullanan kullanıcılar artık NSX Manager ile control plane agent (netcpa) ve firewall agent’ı arasındaki iletişimi kontrol edebilecekler. Eğer bu iletişim kopar ise NSX Manager recover için sync işlemi gerçekleştirecektir.

  • NSX Manager to Firewall agent: Her 3 dakikada bir heartbeat gönderilir. Eğer 2 defa cevap gelmez ise sync işlemi başlatılır.
  • NSX Manager to Control Plane Agent: Her 2 dakikada bir heartbeat gönderilir. Eğer 2 defa cevap gelmez ise sync işlemi başlatılır.
  • Host to controller: Her 30 saniyede bir heartbeat gönderilir. Eğer 2 defa cevap gelmez ise sync işlemi başlatılır.

Aşağıdaki diagram’ı bir VMware sunumundan aldım. Burada NSX‘in ESXi host’lar ile olan ilişkisini görebilirsiniz.

nsx-diagram

NSX tarafından yönetilen tüm host’larda ve cluster’larda VSFWD  isimli Firewall Agent ve NETCPA isimli Network Control Plane agent’i çalışır. Öncelikle Communication Channel Health feature’i için vSphere Web Client ‘a bağlanıyoruz. Networking & Security plug in > Installation > Host Preparation bölümüne giriş yapıyoruz.

nsx1

NSX Manager’i seçtikden sonra Actions tab’ından Communications Channel Health ‘i seçiyoruz.

2

Yukarıdaki ekrandan da görüldüğü gibi ESXi host’lar üzerindeki agent’ların hepsi şuanda çalışıyor. Senaryo gereği ESXi host üzerindeki netCP agent service’ini yani buda control plane agent’i, stop edeceğim. Bu durumda yukarıdaki status’da değişecektir.

[root@esxi01:/var/log] /etc/init.d/netcpad status
netCP agent service is running
[root@esxi01:/var/log] /etc/init.d/netcpad stop
watchdog-netcpa: Terminating watchdog process with PID 35036
Memory reservation released for netcpa
netCP agent service is stopped

nsxcontrol

Yukarıdaki komutlar ile netCP agent service’ini stop duruma getirdim. Şimdi Communication Channel Health’i tekrar kontrol ettiğimizde, NSX Manager to Control plane agent’in down durumda olduğunu göreceğiz. Tabi burada unutmamanız gereken bir nokta var. Heatbeat 120 saniyede bir gerçekleştiği için bu status’un değişmesi ortalama 4 dakikayı alacaktır.

NSX Manager to Control Plane Agent down durumda olduğu için Control Plane Agent to Controller’da buna bağlı olarak Unknown durumda olacaktır.

Ben yukarıda basit birşekilde Communication Channel Health hakkında bilgi verdim ve yine bunu basit bir şekilde simule ettim.

Umarım faydalı olmuştur.

İyi çalışmalar.

Bu yazı blog üzerinde Tayfun DEĞER tarafından paylaşılmıştır. 2009 yılında açılan blog kısa zaman içerisinde büyük bir izleyici kitlesine sahip olmuştur.Tayfun DEĞER danışmanlık ve eğitimler vermektedir. vExpert 2013-2015, VCP5, VCP5-DT, VCP-Cloud ve MCSE sertifikalarına sahiptir.Twitter 'dan @tayfundeger veya RSS ile sitedeki değişiklikleri takip edebilirsiniz.