posted

0 Comments

保證資料中心有足夠的計算資源來支撐業務正常運營,是 IT 運維團隊的最基本職責。所以,對於系統管理員來說,他必須時刻掌握伺服器計算資源的使用狀況,並且對資源的使用情況做出一個預估,對未來可能出現的資源短缺現象及時做好預案計畫。vRealize Operations 就是系統容量評估和規劃的好助手,它能夠幫助管理員及時瞭解計算資源的使用狀況,並且在以下幾個方面提高 IT 運維的水準:

  • 確保資料中心的計算性能保持在承諾的服務等級;
  • 提高資源的利用率,並且降低總體採購和運營成本;
  • 通過假設分析 (what-if) 來對未來的資源使用情況進行預估,從而及早做好擴容的準備。

 

採用 vRealize Operations 進行容量優化的第一步就是分析一下資料中心中各種資源的使用現狀。vRealize Operations 是以 vSphere 集群為單位來進行容量統計的,下圖就是對 Production_North 集群記憶體使用狀況的一個統計和預估,當前日期是4月10日,這個日期之前的曲線是對過去一段時間記憶體使用情況的一個統計,這個日期之後的色塊區域表示的是對將來記憶體使用情況的一個預估。這張圖也告訴我們按照目前記憶體消耗的趨勢,再過18天記憶體資源就會耗盡。同樣的,vRealize Operations 也可以對 CPU 和存儲 (Disk) 資源狀況進行同樣的分析。

vRealize Operations 對資源進行分析有 Allocation (按分配) 和 Demand (按需求) 兩種模式,這是兩種不同的統計方法。舉一個例子,集群中總共有 100GB 可用記憶體空間,共有10個虛機在運行,每個虛機都配置了 10GB 虛擬記憶體,這樣按分配模式統計的話正好把所有的記憶體空間都耗盡。但實際上記憶體是按需分配的,虛機啟動時可能只用到了 5GB 記憶體,隨著運行的繼續虛機所佔用的記憶體才會越來越大,按照需求模式來統計的話,當前的記憶體資源還可以支撐一段時間。業務場景決定了採用哪 種統計模式,如果集群中運行的是關鍵業務應用,需要保證這些應用的性能,必須保證資源的供應,這種情況下適合採用 Allocation 模式來統計資源。而對於雲服務提供者,則希望充分利用現有的計算資源,所以會選擇 Demand 模式來統計資源,這反映的是資源的實際使用情況。

 

管理員的運維意圖是通過以下這些參數來定義的 (如下圖所示)。

  • Criticality Threshold (嚴重性閥值):警告閥值 (Warning Threshold) 定義了當資源還剩下多少天時通知管理員,預估發生資源短缺的資料中心在 vRealize Operations 管理介面中被標記為黃色或紅色。
  • Risk Level (風險等級):對於資源預估有兩條曲線 ,上面一條曲線採用保守 (Conservative) 的方式來預估,按照資源預計使用的最大量來預估,這種策略保證對於資源的需求可以得到滿足。這面這條曲線採用相對激進 (Aggressive) 的方式來預估,即按照資源使用量的平均值 (Mean) 來進行預估,這種策略對應的風險高一些,但是推遲了資源耗盡的預估時間,有助於節省硬體投資。在實際應用中,保守預估方式一般用於生產環境,激進方式一般用於開發測試環境。
  • Allocation Model (分配模式):雲服務提供者在低等級的服務中都會採用超配模式 (Over-Commit) ,例如下圖中把 CPU 分配模式設定為 4:1,意味著每4顆 vCPU 對應一顆物理 CPU 內核,因為不可能所有的虛機都在同一時間要求 CPU 資源,所以在工作負載較低的情況下 CPU 超配完全能夠滿足計算需求。當然這種超配模式也對應著服務等級 SLA,對於高服務等級的場景,就有必要把 CPU 分配模式設定為 1:1。記憶體和存儲也是類似的。

 

針對資源短缺的情況,可以採用以下的解決方案:

  • 回收資源:針對已經被分配的資源進行分析,看看有哪些是不再繼續被使用的,回收這些資源來挖掘現有的潛力。
  • 增加容量:購買新的伺服器來增加計算資源;除了購買硬體之外,把部分的工作負載遷移到其他集群或資料中心也是一種解決辦法。

 

下面給大家看一個利用 vRealize Operations 的容量優化功能來分析資源使用狀況的演示視頻:

 

 

 

延伸閱讀

加速滿足業務需求是企業進行數位化轉型的驅動力,IT應該提供一個數位化的基礎架構來支撐現代企業應用的運行。VMware 和 Intel 通力協作,跨資料中心和公有雲提供一致的基礎架構和運維體驗,支持應用的快速交付運行,以滿足業務創新和市場競爭的需要,為企業構建了一條數位化轉型之路。VMware 和 Intel 的解決方案,以緊密集成的計算、網路和存儲虛擬化技術為基礎來構建軟體定義的超融合架構,基於業界的標準和 Intel 的技術來為用戶提供自動駕駛式的運維和管理體驗。這種創新方案交付了一致的運維模式,可以在任何基於 Intel 平臺的雲環境上運行任何的應用。