作者: Colin Jao 饒康立 – VMware資深技術顧問,主要負責VMware NSX產品線,目前致力於網路虛擬化、分散式安全防護技術與新應用遞送方案的介紹與推廣。

接續前面對於微分段方案規劃時常碰到的問題討論。目前在台灣已經有許多大型客戶在生產環境長時間運作NSX微分段,並且在後續專案中規劃於災備中心運作時,分散式防火牆的相關同步與重啟機制。這也是近年我們與多個經銷夥伴及客戶在後期專案規劃時的討論重點。本篇網誌內也就著重於會議內常進行的多中心部署議題進行說明。

在雙中心或DR架構內運作純微分段功能時,NSX運作MultisiteFederation哪種機制較佳?

VMware有相當多資源討論 NSX Multisite / Federation 的架構與差異,一個非常好的文件是 NSX-T Multi-Location Design Guide (https://communities.vmware.com/t5/VMware-NSX-Documents/NSX-T-Multi-Location-Design-Guide-Federation-Multisite/ta-p/2810327?attachment-id=113252),我之前在網誌169~172討論過Multisite架構,215~222討論過 Federation架構,也歡迎大家參考。下圖是一個很簡略,在運作純微分段機制時,跨站點使用 NSX Federation 與 NSX Multisite的機制比較:

很快速地說重點:

  • 我們的客戶使用微分段機制時,以NSX Tag來標示虛機,做動態群組配置是極度常用的做法。在Multisite架構內,上述機制完全沒有問題;而在Federation機制內,需要透過複雜的API手段才能進行同步,很不方便
  • 以純微分段場景來說,絕大部分客戶都是購買NSX Advanced 或是NSX Firewall授權。但Federation需要NSX Enterprise Plus授權才能運作,且NSX Manager需要多台資源耗用量極大,相比之下成本相當高

由於上述的原因,因此目前在台灣多個客戶的實作上,多站點的微分段架構都是採用NSX Multisite機制。

NSX Multisite機制下,如果站點失效造成NSX Manager失效,回復時間會需要多長?

基本上在客戶討論到雙中心或多中心架構時,會因為實際上的環境有各式各樣的狀況。這裡我們簡單地分為四種環境,並快速說明各環境內,單站點失效時NSX Manager的回復時間:

  • 情境一:超奢侈版,客戶可以部署虛擬化環境在『三個』以上的資料中心,且這三個資料中心間有LAN等級 (Latency 5ms 以內) 的網路連接。
  • 情境二:奢侈版,客戶可以部署虛擬化環境在『兩個』以上的資料中心,且這兩個資料中心間有LAN等級 (Latency 5ms 以內) 的網路連接,並且網路頻寬足夠可運作vSphere Stretch Cluster (一般需要 10 gbps以上頻寬)。
  • 情境三:高貴版,客戶可以部署虛擬化環境在『兩個』以上的資料中心,這兩個資料中心間由於物理限制無法達到LAN等級 (Latency 5ms 以內) 的網路連接,或是頻寬不足以運作vSphere Stretch Cluster,但能夠做到管理網路跨Site二層打通。
  • 情境四:平實版,客戶可以部署虛擬化環境在『兩個』以上的資料中心,這兩個資料中心間管理網路僅能跨三層以路由方式互通。

在下面的表格我們說明各種情境的NSX Manager回復時間:

  • 在情境一環境內,NSX Manager可以三台各自部署於不同的站點,單一站點失效不會造成NSX Management Cluster的整體影響。
  • 情境二環境內,若NSX Management Cluster所在的站點失效,此時透過vSphere Stretch Cluster的機制,三台Manager可以在剩下的站點自動HA回復重新啟動,由站點失效開始約15分鐘可恢復。
  • 情境三環境內,管理者可以SRM於災備站點手動啟用NSX Manager虛機的回復(在同樣的管理網段內,相同IP地址)。由管理者手動開始SRM回復作業開始起算,約20分鐘可恢復。
  • 情境四環境內,管理者可以手動於災備站點重新建立新的NSX Management Cluster(以不同的IP地址),並以之前的Backup組態倒回。整個流程約一小時。

依據多中心的條件,可以取得不同的NSX Management Cluster回復等級與時間。以我所知在台灣,情境二到情境四的方式各自都有不同的客戶採用。

本篇內這兩個題目通常是我與客戶進行NSX多中心環境部署架構討論會議時,一開頭就專注說明的議題。長篇大論的簡單整理:

  • 絕大部分的微分段場景內,客戶雙中心或災備環境都適用 NSX Multisite架構,不需要採用到Federation架構。
  • 客戶需要告知我們實際雙中心允許的狀況與條件,來選擇不同的NSX Management Cluster回復方式。

下一篇網誌仍然圍繞在微分段場景的NSX雙中心 / 災備設計討論,我會和大家繼續討論在不同架構下的回復運作流程。