其他 虛擬雲網路

網路虛擬化NSX 技術文章系列一百九十九: VMware HCX:方案介紹(四)

作者: Colin Jao 饒康立 – VMware資深技術顧問,主要負責VMware NSX產品線,目前致力於網路虛擬化、分散式安全防護技術與新應用遞送方案的介紹與推廣。

前篇網誌內我們討論了採用Cold Migration或是vMotion的移轉方式,這兩種方式有個大弱點:即使管理者同時選擇多個虛機要進行轉移,同時間只能有一個進行作業。此時進行虛機移轉的時間肯定就大幅拉長了,而這並非我們採用VMware HCX時想要達成的效益。所以接下來我們來討論真正一般系統管理者採用HCX時會想要用的方式:Bulk Migration與Replication Assisted vMotion。

Bulk Migration

與前面討論的機制不同,Bulk Migration底層是採用vSphere Replication的技術(再加上廣域網路加速與加密)。管理者一次選擇了多個正在運作的虛機,在不影響虛機作業的狀況下,底層啟用Replication將虛機抄寫到另一端。當抄寫完成,可以進入虛機切換的作業,此時HCX會把來源端的原始虛機給關閉,而同時將已抄寫到目的端的虛機開啟。並且,管理者可以選擇是要馬上進行轉移,或是在選定的維護時間來進行轉移。

這邊我想要直接抓圖給大家看並進行說明。下面是展示情境,這邊因為配置的關係,我們要利用Bulk Migration的機制,將數個虛機由右邊的vSphere環境反向送到左邊的環境內。

在右邊的vCenter介面內,可以看到web-02-1621 / web-06-1621這兩個虛機,目前是正常開機運作狀態。

在下圖的HCX介面內,選擇了要一次移轉這兩個虛機,兩個虛機都是開機狀況,且移轉方式選定了要採用Bulk Migration。

Bulk Migration的過程包含了前期的Replication作業,以及後期的將目的端複製出的虛機開啟,來源端的虛機關閉。後期的動作因為會有虛機本身的開機關機,虛機的服務會中斷。此時管理者可能會想要選擇一段維護時間,僅有在這段時間內可以做虛機開關機的移轉作業。下圖內,我們選擇3:30~3:45這段時間可以進行切換作業。

因為作業內允許目的端的虛機開關機,因此除了把指定虛機複製到目的端外,管理者還可以進行一些其他想要做的客製與升級作業。下圖內可以看到,管理者可以選定對於移轉過去的虛機,MAC Address要不要保留,HW Version與VMTools要不要升版,以及其他類似vCenter內進行Customization Spec的作業。且不僅止於此,對於每個虛機甚至可以進一步設定,在轉移到目的端環境時,要不要進行IP Address / Default GW等等的修改。

當管理者完成相關設定,就可以開始這一次批次作業了。下面這張圖要請大家注意看的是,當有多個虛機進行Bulk Migration時,這些虛機是『同時』進行需求的複製移轉作業,端看各個虛機的大小以及底層網路頻寬,決定這樣的移轉作業快慢。但重點在於,並不是序列進行 (Serialization),一台做完再做另一台。多個虛機是平行處理的。

預設值是當一個虛機複製到目的端完成,就可以開始進行下一階段switchover的作業。但如同前面討論,此時的動作會造成虛機服務中斷。因此管理者若有設定一段維護時間,複製完的虛機就會暫停,等待維護時間到達,如下圖。

當時間已經到達維護時間,此時就開始進行switchover切換動作。

在進行switchover這個動作時,HCX於Bulk Migration會進行的作業包括了:

  • 把來源端的虛機關機
  • 把目的端的虛機開機
  • 依據管理者需求,將目的端虛機進行必要的客製化作業,像我們前面談到的改IP地址,改虛機HW版本,升級VMtools,重新產生SID (Windows) 這些作業。依據需要進行的程序,可能會有一次到多次的重開機
  • HCX確認目的地虛機依據指示正常開啟。如果有出現任何問題(比如說目的端資源不夠,虛機開不起來這些),此時HCX會重新將來源端的虛機開起來。

下圖內是作業完成後,在左邊的vSphere內可以看到,兩個虛機已經在這邊運作了。當然此時在右邊的環境,就沒有這兩個機器了。

從前面的描述,大家應該可以看到Bulk Migration具有下列的好處,我再重新整理如下:

  • 可以一次進行大量虛機批次移轉。虛機複製作業為多台平行進行,加速移轉時間
  • 可以指定維護時間,虛機在一般時間可以正常提供服務,但此時已經開始進行底層的儲存複製作業。當維護時間到了,底層的copy也都完成,此時再來進行接下來的切換作業。因為在維護時間內,切換時雖然會終止服務,影響也較小
  • 可以在過程中進行VM的升級以及網路地址與作業系統的參數修改

很不錯,非常好吧!但畢竟有一個問題就是在切換時,同個虛機從來源端關閉,目的端開啟,中間的時候會有幾分鐘服務中斷。有沒有更完美的作法呢?有的,這個機制叫做Replication Assisted vMotion (RAV)。我們在下一篇和大家討論。

相关文章

评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.