vRealize Operations 能夠幫助用戶實現智慧運維,優化資料中心的運行性能是智慧運維的一個重要方面,從而使運行關鍵業務應用的虛機始終運行在最優狀態。

 

vRealize Operations 性能優化的工作原理

基於 vSphere 的虛擬化平臺可能對伺服器上運行的虛機進行靈活地調度,可以根據運維和業務需要把一個虛機從一台伺服器動態遷移到另一台伺服器,或者是從一個集群遷移到另一個集群。vSphere 的 vMotion 技術保證了在遷移過程中虛機的正常運行,而不用擔心應用服務的中斷。 vRealize Operations 正是利用了底層作業系統的這種能力來對虛機工作負載進行調度,避免在一台伺服器上運行過多的虛機,因為資源競爭而導致應用性能下降,並且實現對於伺服器的均衡使用。

vRealize Operations 中的虛機調度能力稱之為“Workload Placement (工作負載放置)”,它是利用 vSphere 的 DRS (Distributed Resource Scheduler) 功能來實現虛機遷移的。DRS 是 vSphere 的一個重要功能,用於在 vSphere 集群內部保持負載均衡,通俗地講就是如果有伺服器過於繁忙的話,就把它上面運行的部分虛機遷移到其他比較空閒的伺服器上去,從而使整個集群內的伺服器都運行在一個工作負載和資源消耗比較均衡的狀態。DRS 對於虛機的調度局限于集群內部,Workload Placement 則是更高一級的調度功能,它可以跨集群來遷移虛機,實現多個集群之間的負載均衡。

 

自動駕駛式的運維體驗

vRealize Operations 引入了“自動駕駛 (Self-driving)”的運維理念,它能夠做到基於業務和運維意圖來以最小的代價實現持續和自動的閉環性能優化。實現這種無人干預運維模式的關鍵是工作負載優化,在計算集群中合理調度工作負載以確保它們始終能夠得到需要的資源,這種調度演算法的依據就是管理員預先設定的意圖 (Intent)。意圖指明了業務和運維上的目標,例如保證關鍵業務應用的性能、盡可能地降低運營成本、保證一定的運營服務等級SLA等等。管理員只需要指定了運維意圖,剩下的工作就可以交給 vRealize Operations 來自動完成,就像是設定一下汽車的駕駛模式,行車電腦就會自動地調整發動機和其他零部件的運行模式來實現車主的駕駛意圖。

 

管理員通過什麼方式來把運維或業務意圖傳遞給 vRealize Operations 呢?vRealize Operations 中提供了各種負載調度的策略來供管理員選擇。

 

運維意圖 (Operational Intent)

運維意圖是根據資源消耗來對工作負載進行優化,達到使虛機的性能最優、充分利用資源、靈活應對突發事件等目的。

 

1. 工作負載優化 (Workload Optimization)

vRealize Operations 提供了以下幾種預定的負載調度策略來供管理員選擇:

  • Balance (均衡):盡可能地把虛機分佈在每一台伺服器上,讓每一台伺服器都均衡地承擔工作負載,這種策略的好處是每台伺服器上的資源都比較寬裕,一般情況下不容易造成資源申請的競爭,從而保證每個虛機的性能。要注意的是,這種策略可能會導致虛機比較頻繁的遷移,所以它適用於工作負載比較穩定的場景。
  • Consolidate (整合):盡可能把虛機集中到某一組伺服器上去運行,這可以幫助節省伺服器資源和電力消耗,負作用是容易造成資源競爭而導致性能下降,這是跟 Balance 相反的一種策略。
  • Moderate (中性):介於 Balance 和 Consolidate 之間的一種策略,在負載均衡和集中之間保持一個平衡,僅在發生資源競爭的情況下才進行遷移,把虛機從過於繁忙的伺服器或集群中遷移出來。這是 vRealize Operations 的缺省調度策略。

 

2. 集群預留空間 (Cluster Headroom)

管理員可以指定一個 0% ~ 50% 之間的比率來在一個集群內部保留一定的資源 (包括 CPU、記憶體、存儲),當有突發的資源請求發生時,例如在某一時段應用的工作負載突然增加而導致 CPU 和記憶體用量大增,我們還是能夠滿足這種資源請求,從而保證應用的性能。集群預留空間能夠保證虛機對於資源的突發訪問需求,但是它也保留了一部分資源,這部分資源不參加平時的負載調度,有一點“浪費”,對整個集群的資源整體優化有一定的負面影響。

 

業務意圖 (Business Intent)

管理員也可以從業務界度出發來設置虛機的調度策略,從而達到節省成本、提高運維品質的目的。

 

例1:降低商務軟體許可成本

有一些商務軟體如 Microsoft Windows 集群和 Oracle 資料庫集群,它們的收費是基於集群的。在這種情況下,vRealize Operations 就可以通過優化工作負載,把運行同一商務軟體的虛機調度到同一 vSphere 集群中運行,從而減少企業在軟體許可方面的成本。

 

例2:實現分層的服務等級 SLA

為了同時滿足關鍵應用高服務等級和控制成本的需要,可以在資料中心中實現分層的服務等級:

  • 金牌服務:對應于關鍵應用,採用高配置的伺服器硬體,如高性能CPU、高速SSD等;
  • 銀牌服務:對應一般的應用,採用較便宜的低端伺服器和低成本的硬碟。

vRealize Operations 可以把關鍵應用虛機放在金牌集群中以獲得更好的運行性能和可靠性,而把一般的應用虛機放在銀牌集群中運行以節省成本。

 

例3:滿足合規需求 (Compliance)

支付卡行業 (PCI – Pay Card Industry) 的合規標準要求支付相關的應用必須運行在 PCI 合規的伺服器上,我們可以設置這一合規性策略,通過 vRealize Operations 的自動調度功能來滿足合規要求。

 

業務意圖是通過 vCenter 中的標籤 (tag) 機制來實現的,vCenter 可以在所管理的物件 (集群、伺服器、虛機等) 上打標籤,通過標籤來標注這些物件的額外屬性。標籤的形式為 key : value ,下面是一些標籤的例子:

  • OS: Windows, Linux, Oracle — 標注集群、伺服器上將只運行這一類別的虛機或應用,虛機上的標籤則代表虛機中作業系統或應用的類別;
  • SLA Tiering: Gold, Silver — 標注集群、伺服器所能提供的服務等級,虛機上的標籤表示要求的服務等級。

vRealize Operations 會根據虛機和集群或伺服器上的標籤來進行調度,把虛機放對在具有相同標籤的集群或伺服器上運行,例如:Oracle 虛機只放在標記為 Oracle 的集群或伺服器上運行,從而把所有的 Oracle 虛機都集中到同一組伺服器上,以此來降低 Oracle 的許可證授權費用。

 

自動駕駛式運維的好處

總結一下,vRealize Operations 的自動駕駛式運維給資料中心帶來了以下的好處:

  • 充分利用伺服器硬體資源,儘量做到物盡其用,盡可能降低每一台虛機所佔用的硬體資源成本。
  • 避免讓伺服器過於繁忙,總是有一定的空閒資源,當突發需求來臨時能夠滿足資源訪問需求,為突發事件或業務高峰做好準備。
  • 用盡可能少的伺服器運行盡可能多的虛機,實現最大化利用率。
  • 通過集中工作負載來把伺服器空閒出來改作他用,或是關機以節省電能。
  • 提供分等級級的服務,以最小的代價實現最大的性能優化。
  • 把同一類型的虛機整合到一個集群中,從而節省軟體許可證費用。
  • 把關鍵應用放在性能最優的伺服器上運行,保證關鍵業務應用的性能。

 

下面給大家看一個利用 vRealize Operations 來進行工作負載優化的演示視頻。

 

 

延伸閱讀

加速滿足業務需求是企業進行數位化轉型的驅動力,IT應該提供一個數位化的基礎架構來支撐現代企業應用的運行。VMware 和 Intel 通力協作,跨資料中心和公有雲提供一致的基礎架構和運維體驗,支持應用的快速交付運行,以滿足業務創新和市場競爭的需要,為企業構建了一條數位化轉型之路。VMware 和 Intel 的解決方案,以緊密集成的計算、網路和存儲虛擬化技術為基礎來構建軟體定義的超融合架構,基於業界的標準和 Intel 的技術來為用戶提供自動駕駛式的運維和管理體驗。這種創新方案交付了一致的運維模式,可以在任何基於 Intel 平臺的雲環境上運行任何的應用。