作者: Colin Jao 饒康立 – VMware資深技術顧問,主要負責VMware NSX產品線,目前致力於網路虛擬化、分散式安全防護技術與新應用遞送方案的介紹與推廣。

目前NSX-T Data Center的運作方式仍著重在單一資料中心之內的網路虛擬化與微分段方案。但當我們將企業的核心業務轉移到NSX的環境內,勢必需要討論下面的問題:如果主資料中心出現狀況,我們要如何在災備中心內回復業務?NSX-T所建置出來的邏輯交換器、T0/T1路由器、微分段策略、負載平衡器、NAT等等,能否無縫、或是在短時間內就可重建在災備中心內,用戶可再透過SRM等方案來遷移底層的虛機呢?

 

對應一個在重要的生產環境提供服務的方案,答案當然必須是可以的。本系列內的三篇網誌要簡要與大家討論NSX-T的基礎災備策略,包含自動化回復以及手動回復的架構及條件。而同樣的方案大家也可擴充為Active-Active雙中心的配置方式。

 

本系列開始前我需要先與各位說明。在本系列內說明的災備策略討論,可以使用在 NSX-T Data Center 2.5 / 3.0 版本均可。但目前VMware對應NSX-T有新架構叫做NSX Federation,可以在多個Site、不同的NSX叢集間,進行NSX網路與安全配置的同步。但由於目前NSX Federation仍在Technical Preview階段,要實際運用到生產環境時程應該在2020年底到2021年初。我們在後續技術成熟後,會再與各位就Federation的架構作進一步介紹。

 

在討論不同災備機制時,接下來的文章,我們需要與大家就下列幾個面向,討論NSX-T Data Center的回復過程:

 

  • 控制層的NSX Management Cluster的還原。所有NSX內的配置都是儲存於NSX Management Cluster內。所有管理者與雲平台的控制指令,都是連往控制層進行要求。主中心失效時,控制層的Management Cluster並需能在災備中心內重新運作

 

  • 運算層的NSX Edge (VM or Bare-Metal) 的切換。NSX Edge上有提供實體接取、以及具備不同上層網路功能的Tier-0 / Tier-1路由器,提供與實體網路間的介接、以及上層的NAT / 南北向防火牆 / 負載平衡器等服務。這些路由器及上層的服務必須要由主中心切換至災備中心。

 

  • 運算層的vSphere Cluster。這邊是我們真實放置虛機或是容器的資源池。這些vSphere Cluster上有安裝NSX-T的元件,提供虛機/容器間的網路連線、微分段防護等功能。

在上圖內是後續相關討論的說明,虛線左側為主中心,NSX-T的Management Cluster均位於主中心運作。右側則為災備中心。乘載網路實體接取與上層服務功能的NSX-T Edge (VM or Bare-Metal) 需要在兩個中心均有配置。同樣的,實際乘載虛機的vSphere資源也需要在兩側均有配置。兩個中心各自有本身的vCenter,也都有SRM的構件配置

 

上圖內,正常狀況時所有運算虛機都是在主中心運作,網路進出南北向也均在主中心。但在災備演練或實際要進行切換時,透過SRM可將運算虛機的備份機器於災備中心啟用。但在後面我們也會和大家說明Active-Active的架構。

 

在接下來兩篇,我們會分別就NSX-T配置於災備中心以自動化回復、以及利用手動回復的兩種不同架構分別與各位進行討論,然後在最後一篇則針對這些架構常被詢問的問題進行回應。