Home > Blogs > Japan Cloud Infrastructure Blog


VMware vCenter Operations Management Suite をリリース

仮想環境およびクラウド インフラの管理を最適化する VMware vCenter Operations Management Suite がついにリリースされました。VMware vCenter Operations Manager を中心とするこの製品スイートは、VMware vSphere 環境におけるパフォーマンス、キャパシティの管理を大幅に簡素化します。

VMware vCenter Operations Management Suite にはさまざまな機能があるのですが、本日のエントリでは、システム全体の状況を容易に把握する機能と、それを支える技術について紹介したいと思います。

システムの状態を容易に把握

vSphere 環境の管理ツールとしては vCenter Server があり、さまざまなデータを vCenter Server を用いて集めることができます(CPU やメモリーの使用率など)。これらのデータは、仮想環境の管理を行ううえで欠かせない重要なものです。

しかし、管理者にとってより重要なのは、これらのデータが何を意味しているかということです。たとえば、CPU やメモリーの使用率がしきい値を超えたというデータだけでは、何が起こっているのかを判断することは困難です。それは単なる一時的な負荷の増大かもしれませんし、リソースが逼迫しているのかもしれません。もしくは何かの設定ミスにより引き起こされたのかもしれません。 

問題が発生しているかどうか、そして、問題の原因がどこにあるのかを理解するためには、vCenter Server が収集したデータに解釈を加えていく必要があります。ここに運用管理の難しさの一面があります。

vCenter Operations Manager が解決しようとしている課題は、この部分です。vCenter Operations Manager は、vCenter Server が収集した無数のデータから、管理者の目的に合った3つの指標 Health、Risk、Efficiency を自動的に計算し、表示します。

Blog vCOps dashboard

Health はシステムの健全性を意味し、現在システムに問題が起きていないかどうかがこの指標でわかります。Risk は近い将来にキャパシティ不足に陥るリスク、Efficiency はシステムの最適化の余地を意味します。管理者はこれらの指標により、無数のデータを見てそれらを分析してという作業をすること無く、システムの状態を把握することができるようになるのです。 

これらの指標は、システム全体だけでなく、vSphere 環境のさまざまなオブジェクトに対して同様に計算されています(クラスタ、ホスト、仮想マシンなどに対して)。これにより、システムの個々のオブジェクトがどんな状態にあるかについても、容易に把握することができます。

トップレベルの指標に問題が出た場合に、下位のオブジェクトにドリルダウンしていって、問題をより詳細に理解していくこともできます。仮想マシンに閉じた問題なのか、それともホストのリソースが枯渇しているのかなどが、すぐに判断できるようになります。

Blog vCOps drilldown

異常を自動検出する動的しきい値技術

では、vCenter Operations Manager が、データの解釈をどのようにして自動的に行っているのか、そのエッセンスを簡単に紹介しましょう。

vCenter Operations Manager は、一定期間のデータが入力されると、システムの標準的なふるまいを自動的に学習し、しきい値を設定します。下記の図において、グレーの部分が自動的に設定されたしきい値の範囲です。このしきい値から外れると、システムが異常と判断します(赤い部分)。この分析は、特許取得済みの動的しきい値技術によるものです。

Blog vCOps dynamic-threshold

従来では、最大値=○○、最小値=△△といった固定的なしきい値を設定してシステムを監視していました。たとえば、CPU 使用率が 80 %を超えたらアラームを上げる、という様な設定です。

しかし、そのような固定的なしきい値では、現実世界での負荷の変化についていけません。負荷は、時間帯や曜日によって大きく変化します。たとえば、平日と週末では負荷パターンは大きく違います。平日に合わせたしきい値設定では、週末に起こる問題は見過ごされてしまうか、もしくは大量の誤ったアラーム発生に繋がるでしょう。

vCenter Operations Manager は、そのような問題を解決することができます。時刻とともに変わる負荷の変化を認識し、それぞれの時間帯に適切なしきい値を自動的に設定するからです。上記の図から、しきい値は固定ではなく、時刻とともに柔軟に変化していることがおわかりになると思います。曜日や時間帯に合わせたしきい値設定により、システムの異常を従来よりもずっと正確に検知できるようになります。

しきい値のメンテナンス作業がなくなるという利点もあります。管理者の方ならご経験があると思いますが、アラーム設定をメンテナンスするというのは大きな負担のかかる作業です。時間が経てば 負荷・構成が変わるので、適切なしきい値は変わってきます。vCenter Operations Manager の導入により、そのような変化に伴うしきい値の調節が必要なくなるのです。

 

本日のエントリでは、vCenter Operations Manager の優れた視認性と、動的しきい値技術について紹介しました。

製品にご興味のある方は、60日間無償評価版をぜひお試しください。インストールの手順をスクリーンキャプチャ入りでわかりやすく説明した、vCenter Operations簡易インストールガイドもあります。

データシートから、製品の詳細、または貴社に最適なエディションをお確かめいただくこともできます。