作者: Colin Jao 饒康立 – VMware資深技術顧問,主要負責VMware NSX產品線,目前致力於網路虛擬化暨分散式安全防護技術方案的介紹與推廣。

上篇網誌內我們簡介了vRealize Network Insight功能,以及與vRealize Operations / vRealize Log Insight的產品定位差異。這篇網誌內我希望用一些實際在維運上會發生的問題舉例,讓大家能看到Network Insight的能力。雖然產品名稱叫做”Network” Insight,大家會發現,用來管理vSphere資源池,同樣威力十足。

Network Insight第一個最重要的賣點就是”Google-Like”的搜尋介面,所有你想要分析、搜尋的狀態與參數都能夠在這個介面進行搜尋。用所謂的google-like可能並不精準,Network Insight仍然有其搜尋的語法,但是在過程當中管理者會看到各個能夠填入的參數及名稱,這讓在使用時的困難度大幅降低。

多說無益,來看看一個例子。

“Network Insight Network Insight,儲存空間不夠了,能不能找出所有具有三個以上快照的虛機,讓我們可以做快照清理?”

在Network Insight介面內最上面永遠是搜尋列,在裡面我們就能輸入要查詢的參數。在上圖內,可以看出我們一邊打字,Network Insight就會顯示出有哪些可搜尋的參數,或是可以搜尋的物件。上圖內,當我們打show vm where sn時,Network Insight就將所有sn開頭的參數都列出來了,我們要找的是快照數目,所以就可以選擇Num Snapshots。很直覺的,我們的問題就是”show vm where num snapshots >= 3″,如下圖,按下Enter就能搜尋

嗯所有快照多於三個的虛機都被列出來啦~疑那個HR-Web-01是什麼機器呢,為什麼有三個快照?此時我們想要知道關於這個虛機的相關資訊,一個是直接點擊名稱看此虛機的資訊頁面,或是直接在右邊點擊”+”號,和這個虛機相關的重要資訊就都顯示出來了,這個虛機IP多少,在哪台vSphere Host上,使用哪個Datastore,規格如何,直接都能夠列出來,像是下圖:

在Network Insight內,所有只要不是黑色或灰色的字都是超連結,管理者都可以直接點擊來查詢相關的資訊,無需在不同的Dashboard或是管理頁面間切換搜尋。上圖內我們看到了HR-Web-01這個虛機的相關基礎資料,但如果我想直接看到這個虛機的完整資訊,就直接點擊HR-Web-01名稱的超鏈結。如果想要看到其所接取的邏輯交換器 Demo-Web-SW的資訊,同樣也可以去點擊對應的鏈結即可,此時和這個物件所有相關的資訊都會在同一個頁面內以圖表或是簡明的文字直接列出。

比如說,在上圖內我們點擊了HR-Web-01的藍色鏈結來查詢這個虛機的詳細資訊。為了讓大家感受到Network Insight提供了多少東西,我把每個欄位都解釋一下:

首先是時間軸Timeline。管理者可以在自己選定的時間內看到這個物件(HR-Web-01)裡面有沒有任何的事件(灰色)或是告警(紅色)。如果有,可以直接點擊,顯示對應的事件或告警的內容

接著和這個虛機相關的資訊持續地提供,像是下圖內的

  • Key Information:這個虛機有哪些告警與變更。多少個快照數目、多少個與其他系統間的網路流,NSX分散式防火牆規則有哪些。再次強調,每一個不是黑色的字都是超鏈結,都可以點進去看
  • Key Metrics:這個虛機的CPU / Memory / Disk延遲與IOPS平均值與趨勢
  • Topology:用圖示的方式繪出現在這個虛機是位於哪個Host,哪個資源池,使用哪個Datastore、由哪個vCenter / NSX Manager管理、接到哪個邏輯交換器上,好清楚啊

再接下來,

  • VM Properties:這個虛機的規格像是有多少CPU / Memory,作業系統哪種,IP地址多少,Default Gateway指向哪裡…
  • Security Properties:這個虛機屬於NSX內的哪個安全群組 (Security Group),以及是否有附掛哪個安全標籤 (Security Tag)
  • Path to Internet:用動畫的方式顯示這個虛機如果要連到Internet,中間會經過哪些虛擬及實體網路

Performance: VM and its neighbors VM:把在同樣的Host / 同樣的Datastore / 同樣的L2網段上的其他虛機的效能分佈圖畫出來。如果你正在看的這台虛機目前效能有問題,這邊就可能可以看出是哪些其他的鄰居在牽拖啦

當然還沒完,

  • Performance比較圖:如同上面,如果我們要研究這個虛機如果效能不好到底是誰牽拖,可以直接拉出同Host / 同網段內的所有虛機,把大家的網路頻寬、IOPS、Latency / CPU 與記憶體的使用率這一堆資料都依時間排列出來,到底效能不好是誰害的一覽無遺~
  • VM Neighbors:虛機的鄰居有誰?可依據Host / 網路 / Datastore列出
  • Network Usage of Ports in Path to TOR:這個虛機的網路使用量,以及同時間內的主機實體Port網路流量

VM Metrics:與這個VM相關的所有Metrics值,頻寬大小、有沒有封包掉、Latency、IOPS、使用空間、快照空間…等的時間成長圖

  • Events:與這個VM相關的所有事件或告警,像是虛機有沒有vMotion、是不是更換了網路介面、有沒有新增快照…等等
  • 還有好多啊,其他的就請大家自行看圖說故事~

我們上面列的只是單一一個虛機的資訊頁面。同樣地,vRealize Network Insight可以統整一台vSphere Host、一個Datastore、一個vlan or vxlan、或是一個安全群組的所有資訊到同一個頁面內。限於篇幅,我就不把一個個圖印出來介紹了,不然可能還要再一萬字才行。但我的經驗是,碰到Network Insight的管理者與工程師包括我自己在內,真的很容易對這個系統入迷,你會第一次看到自己所管理的環境這麼清晰、直覺地顯示在前面,要尋找的資料極為簡易地透過搜尋與連結就能搜尋出來。

回到文章開頭,我們用Network Insight很快地找出了有多個快照的虛機。如果正在看網誌的各位有一組能安裝Network Insight的vSphere環境,或是可以連到VMware Hands-on-lab環境內的HOL-1729-SDC-1-Introduction to vRealize Network Insight,建議都花時間玩一下。我在這邊挑戰幾個vSphere環境維運時常碰到的問題,大家應該會發現,用vRealize Network Insight來找答案,真的是不費吹灰之力喔

  • 在環境內有哪些vSphere Host的記憶體使用率已經超過了75%,而且上面有超過30個虛機的呢?(所以,我們可以手動把這些虛機飄移到其他台去)
  • 有哪些Datastore上的read / write latency已經超過了10 ms呢?
  • 可不可以把使用datastore-X,而且IOPS超過20的虛機全部列出來?
  • 有哪些邏輯交換器(vxlan)連一個虛機都沒有接在上面的呢?
  • 可否把快照兩個以上,而且快照使用空間超過5 GB的所有虛機列出來?
  • 目前在vlan 602上有哪些虛機的作業系統是Windows Server 2003?

真的超好玩的啊!