VSAN管理者は、これまでVSAN Observer を使用してVSANのパフォーマンスを確認していました。
VSAN Observerは非常に強力なツールですがいくつかの欠点もありました。
たとえば、リアルタイムなパフォーマンスデータは確認できましたが、過去のパフォーマンス統計データを確認することはできませんでした。また、VSAN Observerは個別のツールとして提供されていたため、vSphereweb clientと統合されておらずシングルコンソールでの管理がおこなえませんでした。VSAN Observerは多くのメトリックを提供しますが、大半がエンジニアリングレベルのメトリックとなり、管理者向けのメトリックではありませんでした。また、vCenter Server 上のRVC(Ruby vSphere Console)で実行されるため、vCenter Serverへの影響もありました。
これらの状況をふまえ、VSAN6.2では管理者が容易にVSANのパフォーマンスを確認するための機能として、新たに VSAN Performance service が実装されましたので、ご紹介させていただきます。
VSAN Performance Service は下記の機能を提供します。
- vSphere Web Client への統合
最初のポイントとして、VSAN Performance Service は vSphere Web Client から使用できます。VSAN Observer のように、RVCにログインして手動でサービスを起動する必要はありません。また、管理者が VSAN Performance Service を一度有効に設定するだけで、常にサービスが稼動している状態となります。
vSphere Web Client から、vCenter server のインベントリでクラスタや各ホスト、仮想マシンを選択し、 [ 監視 ] タブの [ パフォーマンス ] からパフォーマンス統計情報をパフォーマンスチャートで表示できます。
- シンプルなメトリック
VSAN Performance Serviceで表示できるメトリックは VSAN Observer と比べて削減されていますが、各メトリックは管理者が活用しやすい項目となっています。
管理者は、ホスト上で実行されている仮想マシンのパフォーマンス情報と、ホストのバックエンド操作のパフォーマンス情報を選択して表示する事ができます。例えば、RAID1(FTT=1)構成の仮想マシンでは、仮想マシンで 500 IOPS の書込み処理が表示される場合、バックエンド操作としては1000 IOPS の書込み処理が表示されます。バックエンド操作ではVMDKがミラーされますので、各レプリカに500 IOPS ずつの書込み処理が行われ、合計1000 IOPS となります。IOPS以外のメトリックとしては、スループット、遅延、輻輳、未処理の I/O があります。
ホストのパフォーマンスビューでは、ディスクグループや個々のディスクに関する、いくつかの追加のメトリックが提供されています。
ディスクグループに関しては、読み取りキャッシュ ヒット率(ハイブリット構成時のみ)や、削除、書き込みバッファの未使用割合などの多くの有益な項目を表示する事ができます。
仮想マシンのパフォーマンスビューでは、各VMDKへの仮想 SCSI IOPS、スループット、遅延などの項目が表示できます。
また、特定のメトリックに関しての内容が不明な場合は、メトリックの横にある ボタンをクリックする事でメトリックに関する情報が表示されます。詳細情報の確認の為に AskVMware のリンクも用意されています。
VSAN Performance Serviceで表示できるメトリックは、VSANの管理者に頻繁に利用されるものになっています。
- 分散型アーキテクチャ
VSAN Performance Service を設計する上で、vCenter Server へパフォーマンスの影響を与えない事が一つの目標でした。
このため、VSAN Performance Service はVSANの分散型アーキテクチャを採用しています。
パフォーマンスデータは、統計DBに格納されますが、VSAN Performance Serviceが有効化されると、VSANデータストア上に統計DBが1つのオブジェクトとして作成されます。クラスタの中から一台のホストが統計DBを更新するマスターとして選ばれ、クラスタ内の他のホストはマスターへパフォーマンス統計情報を送信します。統計情報は5分間の平均値となります。パフォーマンスグラフを描写する際はvSphere web client が統計DBを参照します。
もうひとつの設計目標は vCenter server に依存しないことでした。vCenter server に何かしらの問題が起こった場合や、新しく vCenter server が展開された場合でも、パフォーマンス統計情報は継続して取得され続けます。
- シングルポイント障害の回避
統計DB はVSANデータストア上に作成されると述べましたが、統計DBに対してもVSANストレージポリシーを適用して高可用性を実現する事が可能です。VSAN Performance Serviceを有効化すると、統計DBオブジェクトに対して、どのVSANストレージポリシーを適用するか聞かれます。
デフォルトのポリシーでは、許容する障害の数は1(FTT=1)として設定されますので、1台のホストに障害が発生した場合でも、パフォーマンス統計情報は継続して取得され続けます。
また、VSAN Performance Serviceおよび統計DB の状態はヘルスチェックシステムで確認されるため、管理者はサービスに問題が発生した場合にアラートを確認する事が可能です。
下記はクラスタにスプリットブレインが発生したような場合の表示例です。
- 履歴情報の利用
最後のポイントとして、VSAN Performance Service では VSAN Observer では利用できなかった、過去のパフォーマンスの履歴情報を確認する事が可能となりました。デフォルトでは、直近1時間のデータが表示されますが、もちろん表示対象とする時間範囲は変更が可能です。
特定の期間の情報を確認したい場合は、下記のように時間範囲を指定することができます。
VSAN6.2で実装された VSAN Performance Serviceにより、VSANのパフォーマンスの概要を容易に確認する事が可能となりました。
VSAN Observerは継続して利用可能ですが、我々はこの新たに提供された VSAN Performance Service で、より多くの VSAN上のパフォーマンスデータが確認できるべきであると感じています。皆さんがVSAN Observerで定期的に使用しているフィールドやメトリック等で、VSAN Performance serviceに追加するべきと感じる項目があれば、プロダクトマネージャおよびエンジニアへフィードバックしますのでご連絡ください。
原文: VSAN 6.2 Part 6 – Performance Service
VMware Storage and Availability Business Unitの シニアスタッフエンジニアCormac Horganの個人ブログを翻訳したものになります。VSANの詳細に関しては弊社マニュアル 、KBをご確認ください。また本記事は VSAN 6.2ベースに記載しております。予めご了承ください