こんにちは。VMwareの高田です。

今回と次回は、INTEROP Tokyo 2015のVMwareブースで展示しましたネットワーク仮想化のための運用管理について、ご紹介します。

まず、現状のITで考えられる運用管理の課題として、どんなものがありますか?

  1. ダウンタイムの発生とパフォーマンスの低下
    問題の原因追求を加速し、サービス品質の向上
  2. コストと予算の削減
    IT資源の最適な使用率と運用の効率化が要求されている
  3. サイロ化された運用で統合的に管理することが難しい
    物理、仮想、ストレージ、ネットワーク、アプリケーション等にわたって統合的なソリューションで運用を一本化

などが一般的に考えられます。近年は、物理や仮想環境に限らず、またプライベートクラウドやハイブリッドクラウドに限らず、アプリケーションに限らず、このような課題を解決する手段が求められているかと思います。

VMwareのネットワーク仮想化、NSX を運用するにあたっても同じで、特に求められる運用の要件としては従来のネットワーク同様、

  1. モニタリング
    可用性、パフォーマンス、キャパシティ
  2. トラブルシューティング
    トポロジーの可視化(物理と仮想の両方)、フローとパケットレベルの分析、より高度なトラブルシューティング
  3. ロギング/監査
    ログ分析、イベントの収集、監査とコンプライアンスチェック

があります。これらを満たすために、まずVMware vSphereとNSXが提供する機能を利用できます。

例えば、vSphereとしては、

vSphere Web Clientでのネットワークのパフォーマンス統計 
ネットワークの監視と仮想マシントラフィックを監視するために分散スイッチで行うNetFlow/IPFIX
分散ポートのトラフィックを他の分散ポートまたは特定にアップリンクやIPにミラーリングするパケットキャプチャ
・SNMP
を使用した通知と要求の受信
・pktcap-uwユーティリティによるvSphere標準スイッチや分散スイッチのポートを通過するネットワークパケットの監視
・分散スイッチ設定のバックアップとリストア
ESXiの各種コマンドラインインターフェース

の機能を利用でき、NSX(以降、NSX-vSphereを想定して説明します)は、

論理スイッチの健全性確認のためのコネクティビティのモニタリング
仮想マシンのトラフィックフローをvNICレベルで可視化するフローモニタリング
Edgeゲートウェイ上のサービスのスループットや接続統計情報
NSXが提供するRESTful APIによるデータセンタ、ポートグループ、仮想マシン、vNIC単位でのフロー統計データの収集
NSXコンポーネントの各種コマンドラインインターフェース

などが用意されています。
具体的な方法については、NSXの運用ガイドをご参照ください。

さらに、トラブルシューティングやログ分析、視認性を向上させるために、VMwareでは、vRealize Operations(旧称:vCenter Operations Management Suite)と vRealize Log Insight(旧称:vCenter Log Insight)でのNSX向け対応を行っています。次は、それらをNSXのためにどのように利用できるかをご説明します。

NSXのためにvRealize Operationsを利用する

vRealize Operationsは、インフラストラクチャやビジネス クリティカルなアプリケーションのパフォーマンス、キャパシティ、健全性を把握し、トラブルシューティングや包括的な視認性を提供する製品です。VMware vSphere環境はもちろん、パートナーの製品やソリューション、アプリケーションなどのための「管理パック」というものを適用することで専用のダッシュボードを提供しています。NSX用にも管理パックを用意しており、vRealize Operations バージョン6.0以降とNSX-vSphere 6.0.4以降の組み合わせでは、NSX-vSphere 管理パック 2.0が利用でき、NSX単体では困難な、NSX環境全体の健全性やオブジェクトのトポロジやオブジェクトパス、トラブルシューティング方法などがひと目でわかる、メインビュー、トポロジ、オブジェクトパス、トラブルシューティング、の4つが利用できます。

まず、NSX-vSphere メイン ダッシュボードについて説明します。メインダッシュボードはNSXのネットワークオブジェクトの健全性や全体概要を提供します。

vROps_NSXv_Main

① [NSX-vSphere 環境] では、現在vRealize Operationsでモニタリングしている環境のリストで、複数ある場合は対象のものを選択します。
② [NSX-vSphere の主要コンポーネント] は、選択した環境のNSXに関連する主要なコンポーネントを、[健全性] [ワークロード]
[アノマリ] [障害] [リスク] [残り時間] [残りキャパシティ] [ストレス] をバッチから選択して、色によって確認できます。
③ [オブジェクト] は、NSXオブジェクトの [健全性] [リスク] [効率] を数値と共に一覧で表示します。
④ [オープンアラート] は、NSXマネージャー等からのアラートをクリティカルレベルと共に表示します。
⑤ [トラフィック別の上位論理ネットワーク (KBps) ] は、論理スイッチのトラフィック量をトップ5の使用率が高い順に表示します。
⑥ [トランスポート層] は、[トランスポートノードの健全性] [トランスポートノードのワークロード] [トランスポートノードのネットワークワークロード] [vSphere分散スイッチ] 別にヒートマップで表示します。
⑦ [トラフィック別の上位仮想マシン (KBps) ] は、仮想マシンのトラフィック量をトップ5の使用率が高い順に表示します。

次は、NSX-vSphere トポロジ ダッシュボードについて説明します。トポロジ ダッシュボードは、NSX環境で展開されたオブジェクトのトポロジを可視化するために使用します。

vROps_NSXv_Topo

① [NSX-vSphere 環境] では、メインダッシュボード同様にvRealize Operations管理下の1つまたは複数から対象の環境を選択します。
② [オブジェクト] で、トポロジを確認したい対象のオブジェクトを選択します。
③ [論理トポロジ] は、選択したオブジェクトと関連するオブジェクトの論理トポロジを表示します。
④ [物理トポロジ] は、論理トポロジが接続されている物理インフラのトポロジを表示します。
⑤ [優先度の高い問題] は、物理トポロジと論理トポロジで選択したオブジェクトのアラートを表示します。
⑥ [メトリック] は、物理トポロジと論理トポロジで選択したオブジェクトのメトリックを表示します。

次は、NSX-vSphere オブジェクトパス ダッシュボードについて説明します。トポロジダッシュボードは、NSX環境で展開されたオブジェクトのトポロジを可視化するために使用します。

vROps_NSXv_object_path

① [NSX-vSphere環境] では、メインダッシュボード同様にvRealize Operations管理下の1つまたは複数から対象の環境を選択します。
② [オブジェクト] で、対象の環境内のオブジェクトリストを表示し、パスを確認したい対象のオブジェクトを2つ選択します。
③ [論理パス] は、選択したオブジェクトが接続する論理ネットワークの論理パスを表示します。
④ [物理パス] は、選択したオブジェクトが接続する物理インフラの物理パスを表示します。

最後は、NSX-vSphere のトラブルシューティング ダッシュボードについて説明します。トラブルシューティング ダッシュボードは、NSX環境でのトラブルシューティングをサポートするために使用します。

vROps_NSXv_toubleshooting

① [NSX-vSphere 環境] は、メインダッシュボード同様にvRealize Operations管理下の1つまたは複数から対象の環境を選択します。
② [NSX-vSphere 論理スイッチ] は、選択した環境のNSXで構成された論理スイッチのリストを表示し、[健全性] [リスク] [効率] を数値と共に一覧で表示します。
③ [データ収集結果] は、選択したオブジェクトに関するアクションの結果を表示します。

このように、仮想化によるネットワークの要素やトラブルシューティングのための情報を、わかりやすく表示できることで、運用管理の工数軽減につながることをご理解いただけたかと思います。vRealize Operationsのその他の使い方は、Japan Cloud Infrastructure Blog (日本語) を、またvRealize Operationsの管理パックについてはVMware Solution Exchangeをご参照ください。

次回は、ネットワーク仮想化の運用管理の続きです。