クラウド運用・管理 パートナー

vROps 8.0はオンプレミスからクラウドまで Part 7

Part7:Workbench によるトラブルシューティング
日本ヒューレット・パッカード株式会社の中川明美です。今回は、vRealize Operations (vROps) 8.0 から提供された「Workbench」によるトラブルシューティングをご紹介します。


「アラート」「メトリック」「イベント」に、新たに「潜在的な証拠」を加え、トラブルシューティングに必要な情報を1つのダッシュボードに収めたものが「Workbench」です。
-Back Number-
#1:vROps バージョン 8.0でできること①
#2:vROps バージョン 8.0でできること②
#3:ユーザーインターフェースの変更いろいろ
#4:スーパーメトリックもウィザードを強化
#5:アプリケーションの管理①
#6:アプリケーションの管理②
#7:Workbenchによるトラブルシューティング
#8:vROps 8.0のvSANダッシュボード/SDDCコンプライアンス
◆トラブルシューティング「Workbench」ホームページ◆
「Workbench」ホームページは、「ホーム」または「クイックスタート」メニューの「トラブルシューティング」から表示します。
ホームページには、「検索バー」「アクティブなトラブルシューティング」「最近の検索」があり、「アクティブなトラブルシューティング」には、現在のログインでアクティブなセッションが表示されます。次回  vROps にログインした時に、以前「アクティブなトラブルシューティング」に表示されていたセッションは、「最近の検索」に表示されます。
ホームページに表示される日時は対象オブジェクトの Workbench を起動した日時です。いずれかをクリックすると、「Workbench のトラブルシューティング」が表示されます。

◆Workbench によるトラブルシューティング◆
「Workbench」トラブルシューティングは、「潜在的な証拠」「アラート」「メトリック」「イベント」のタブで構成されます。
「潜在的な証拠」では、「イベント」「プロパティの変更」「アノマリのメトリック」が表示されます。
▼イベント
通常の動作から逸脱したメトリックのイベントと、選択したスコープおよび時間内に発生した主要イベントが表示されます。
▼プロパティの変更
選択したスコープおよび時間内に発生した重要な構成変更が表示されます。
▼アノマリのメトリック
選択したスコープおよび時間内に大幅に変化したメトリックを表示します。

上図で、「潜在的な証拠」の時間の範囲は「19/11/06 10:40 – 19/11/06 13:10」と表示されています。ここでは ESXi ホストで異常を検知した日時です。メモリのプロパティ変更時 (2019/11/06 10:57:26) の情報と、10:40~13:10 の間に起きたアノマリのメトリック (大幅に変化したメトリック) が表示されています。この時間に、vRealize Application Remote Collector をインストールしたため、メモリとディスクに大幅な変化があったと検知されたようです。
「プロパティの変更」や「アノマリのメトリック」内の「メトリックにチャートを追加」(緑色の枠内のピンのアイコン)をクリックすると、該当のメトリックが「メトリック」タブ内に表示されます。下図は、過去30 日間のデータに変更し、表示しています。11/6 に「ランタイム|メモリキャパシティ」は約 52GB まで増え、その後 11/15 12:27 までに 43GB まで下降し、11/15 13:52 で52GB に上昇しています。その後はデータがありません(この状態が維持されています)。この環境では、11/6 にインストールし、11/15 からこのブログを書くために vROps に接続を開始しました。今回の「潜在的な証拠」で表示されているデータは、原因が明らかですから、トラブルに発展することはなさそうです。このように未知の問題を調査する場合に「潜在的な証拠」は有効です。

◆「潜在的な証拠」画面の変更◆
Part2 でもご紹介しましたが、「時間範囲」や「スコープ」を変更することができます。「潜在的な証拠」のスコープや時間等に加えた変更は、ログアウト時に保存されません。
▼時間の範囲
デフォルトの時間範囲は 2 時間半です。最大過去7日間まで時間範囲を選択できます。

▼選択されたスコープ
「レベル1」から「レベル4」まで変更すると、データセンターおよび vCenter Server まで選択できる範囲を拡張できます。広い範囲で分析したい場合に便利ですね。

▼ポップアウト
「アノマリのメトリック」で「ポップアウト(緑色枠内)」アイコンをクリックすると、詳細画面が表示され、メトリックの画面同様の操作が行えます。

◆オブジェクトから Workbench の起動◆
運用時は、「ホーム」メニューから Workbench を起動するというよりは、オブジェクトのアラートを見つけた際、画面右上の「トラブルシューティング」から起動する方が活用できそうです。
オブジェクトの画面から Workbench を起動し、既知の問題または未知の問題を調査するのがスムーズな方法だと思います。

◆「Hardware sensor health state degraded. Sensor information」アラート◆
表示されているアラートが気になり、調べたところ次のKBを見つけることができました。
Excessive Hardware health alarms being triggered for “Sensor -1 type” on ESXi hosts running vSphere 6.7 U3 (74607)
https://kb.vmware.com/s/article/74607
「Impact / Risks」に、「ハードウェアの問題を示していない」「vCenter データベースのサイズが大きくなり、ディスク容量が不足する問題が発生する可能性がある」とありましたから、KB にしたがって、このアラートを表示させないように設定変更をしました。
vCenter Server の管理ツールではハードウェアの健全性は正常でアラートも表示されていなかったため、、vROps のこのアラートは何だろうとドキドキしていたのですが、大事に至らずホッとしました。
vSphere 6.7 U3 をお使いの方は、KBの内容をご確認ください。
◆まとめ◆
Workbench が追加され、既知の問題と未知の問題の両方を調査できるようになりました。
Workbench を起動すれば、トラブルシューティングに必要な情報が一画面で収集できますから迷う必要がないですね。vRealize Operations (vROps) のユーザーさんから、情報が多過ぎて、どこを見たらよいかのかわからないとご相談されることがあります。アラートが表示されていたら、最初にWorkbenchを 起動してみてください。「アラート」メニューからも Workbench を起動できます。
私は vSphere 6.7 U3 の KB が見つかり、vROps を活用できたなぁと喜んでおります(笑)
次回は、「vROps 8.0の vSAN ダッシュボード/SDDC コンプライアンス」です。