皆様こんにちは!
株式会社ネットワールドの Dell EMC 製品担当です。
前回の予告通り、連載 4 回目は VxRail 上の「Intel® Optane ™ SSD DC P4800 シリーズをキャッシュドライブで利用するとどれくらい性能が出たのか?」の検証結果についてご報告したいと思います!!
なお、VxRail は vSphere にストレージ機能 vSAN 機能を標準搭載した VMware 社とデル・テクノロジーズ社が共同開発したハイパーコンバージド インフラストラクチャ (HCI) になります。VxRail の基本的な事や運用管理面に関して疑問をお持ちの方はぜひ、以前のブログをご参照下さい。
今回の検証内容としては以下を予定しています。
<アジェンダ>
-
検証環境
-
パフォーマンス検証結果①
[ハードウェア構成]
モデル:Hybrid
キャッシュ:SSD
ネットワーク:10GbE
-
パフォーマンス検証結果②
[ハードウェア構成]
モデル:All Flash
キャッシュ:Intel Optane
ネットワーク:10GbE
-
パフォーマンス検証結果③
[ハードウェア構成]
モデル:All Flash
キャッシュ:Intel Optane
ネットワーク:25GbE
検証環境
まずは、検証環境についてご紹介いたします。
◆ VxRail
キャッシュ層に Intel® Optane ™ SSD DC P4800 シリーズを搭載した VxRail E560F (All-Flash Model) を 4 ノード使用してクラスタを構築いたしました。
◆ ToR スイッチ
Dell PowerSwitch S5212-F を 2 台を Virtula Link Trunking (以下、VLT) で冗長化した構成で構築いたしました。
ケーブルも SFP28 の Twinax ケーブルを使用しているため、最大リンクスピードは 25G となりますが、まずは現在主流の 10GbE ネットワークを模擬するため、10G にてリンクアップさせております。
上記構成なので、通常時 vSAN のトラフィックは、スイッチ# 2 側にて処理をする構成となっております。
- E560F 単体でのスペックは下記の通りです (各ノードで同一構成となります)
CPU : Intel(R) Xeon(R) Gold 6230 CPU @ 2.10GHz * 2socket |
Memory : DDR4 32GB * 12 =384GB |
Cache Disk : Intel® Optane™ SSD DC P4800X 375GB * 2 |
Capacity Disk : 1.75TB SSD * 4 |
NIC : Broadcom Dual 25Gb Ethernet |
- キャッシュディスクとして使用するIntel® Optane™ SSD DC P4800Xのスペックは、以下の通りです。
順次読み出し(最大) : 2400 MB/s |
順次書き込み(最大) : 2000 MB/s |
ランダム・リード (100% スパン) : 550000 IOPS |
ランダム・ライト (100% スパン) : 500000 IOPS |
レイテンシー – 読み出し : 10 µs |
レイテンシー – 書き込み : 10 µs |
ベンチマークの測定は、VMware 社が提供している [HCIBench] を使用しました。
これ一つで負荷掛け用仮想マシンのデプロイから、ワークロード作成、負荷掛け、測定結果のまとめまで自動でできる便利なベンチマーク測定自動化ツールです。
実際に負荷をかけるベンチマークツールが別途必要で、[vdbench] か [FIO] から選択する必要がありますが、今回は [vdbench] を使用します。
実際に負荷をかけるにあたって、ワークロードを作成する必要があります。
vSAN に関するワークロードの作成指標は、弊社内でもかなり試行錯誤しましたが、以下の作成指標にたどり着きました。
Read/Write で 5 パターン、Random/Sequential で 5 パターン、計 25 パターンのワークロードで 1 セットとしました。
VxRail では、デプロイ後 FTT=1 のストレージポリシー SPBM : Storage Policy Based Management) がデフォルトで適用されています。従って、通常は以下のような Read/Write のデータフローとなります。
vSphere 6.7 版の VxRail では、デプロイすると vSAN データストア上に [vCenter Server Appliance]、[外部PSC]、[VxRail Manager] が構成されます。(以下、VxRail ⽤管理 VM)
また、HCIBench ⽤の仮想マシンとして、[コントローラ VM]、[負荷掛け⽤ゲスト VM] が作成されますが、これらの VxRail ⽤管理 VM や、コントローラ VM、負荷掛け⽤ゲスト VM は、ベンチマークを測定するリソースを⽤いないほうが測定結果としてはより正確なものが計測できますが、弊社検証機材の制約等からすべて同⼀のクラスタ/データストア上に配置して測定しました。そのため、テスト結果は参考としてご活⽤ください。
-
パフォーマンス検証結果①
Hybrid モデルでのパフォーマンス測定
まずは、非 Optane キャッシュの VxRail でどれぐらいの性能が出るのか指標を測定してみます。
検証機材として、VxRail E560 (Hybrid) のクラスタがありましたので、そちらでベンチマークを測定してみます。各ノードのスペックは、下記のとおりです。
こちらも同様に、E560 のクラスタ上に HCI Bench をデプロイし、ベンチマークを測定してみました。
◆パフォーマンス (参考)
今回、これから Intel® Optane ™ SSD との比較を行うためのベースラインとなるパフォーマンステストを十分、行いました。パフォーマンス結果そのものは紙面の都合上、本ブログでは公表できませんが、既存の 3Tier ディスクや他社 HCI と比べても何ら遜色ない (むしろ十分早い!!) パフォーマンス結果を確認することができました。
(Networld では、”IOPS” / “スループット” / “遅延” をランダム IO・シーケンシャル IO・書き込み IO / 読み込み IO と HCI ベンチのワークロードタイプ毎にデータ収集を⾏っております。詳しい値を確認したい⽅はぜひ、Networld 担当営業までご連絡ください)
では、Hybrid モデルでのベースとなるパフォーマンス傾向も見えてきた為、早速、Intel® Optane ™ SSD 搭載の All-Flash モデルでのパフォーマンスを確認していきましょう。
-
パフォーマンス検証結果②
② All-Flash Optane キャッシュ (10GbE) でのパフォーマンス
◆IOPS (参考値)
Hybird 構成と同じ種類の IO を流したところ、約 4.6 ~ 4.9 倍近くのパフォーマンス結果となりました。
◆スループット (参考値)
Hybird 構成と同じ種類の IO を流したところ、約 4.7 ~ 4.8 倍近くのパフォーマンス結果となりました。
◆遅延 (参考値)
Hybrid 構成と比較して、パフォーマンス面で 4.6 ~ 4.9 倍近いパフォーマンスを出しながら、遅延という側面では、約 1/3 程度の遅延になっていることが確認することができました。
現状でもオールフラッシュディスク等と比べても十分満足のいくパフォーマンスを計測しておりますが、ToR スイッチの状況を確認してみると、vSAN の 10G ネットワーク部分から大量のパケットドロップが発生していることが確認できました。
show interface status コマンド抜粋
==============================================================================
【Ethernet 1/1/1】
Input statistics:
0 CRC, 0 overrun, 0 discarded
Output statistics:
0 throttles, 13 discarded, 0 Collisions, wred drops
【Ethernet 1/1/2】
Input statistics:
0 CRC, 0 overrun, 0 discarded
Output statistics:
0 throttles, 4294967185 discarded, 0 Collisions, wred drops
【Ethernet 1/1/3】
Input statistics:
0 CRC, 0 overrun, 0 discarded
Output statistics:
0 throttles, 4294967180 discarded, 0 Collisions, wred drops
【Ethernet 1/1/4】
Input statistics:
0 CRC, 0 overrun, 0 discarded
Output statistics:
0 throttles, 4294967165 discarded, 0 Collisions, wred drops
==============================================================================
どうやら、ネットワークの帯域がボトルネックとなっている模様です。ここのネットワーク帯域を解消することにより、Intel® Optane™ SSD 搭載の VxRail はもっとすごいパフォーマンスを発揮するのではないでしょうか。
という事で、引き続き、Intel® Optane™ SSD 搭載の VxRail のパフォーマンスチューニングを実施していきたいと思います。
今回の記事はこの位にさせて頂き、次回の第 5 回では、vSAN ネットワークの帯域を 25G に変更したり、ジャンボフレームを有効にする等、Intel® Optane™ SSD のパフォーマンスを更に引き出していきたいと思います。
なお、Networld では、本ブログでご紹介している全ての検証パターン (Read・Writeはもちろん、ランダム、シーケンシャル等) の様々な IO パターンでの検証結果を収集しております。本 Blog では紙面の都合上、全てのパフォーマンス結果をご紹介させて頂いておりませんが、皆様の環境の参考になる様な検証結果も持ち合わせておりますので、ぜひ、お気軽に Networld 担当営業までお声がけください。
では、次回もお楽しみに