我々のLabにあるサーバの一台で興味深い事象が発生しました。4ノードのクラスタの1台のホストで、そのホスト上のストレージがVSANデータストアとして利用出来なくなるというトラブルです。VSANには自動復旧させる機能が実装されているので、障害が発生した際には可能な限り多くのVMを再保護しようとします。しかしVSANデータストアの容量が限界になった時に発報されるWarningを無視したことによって、VSANデータストアを失う羽目になりました。このVSAN環境は私たちの管理クラスタとしての機能も含まれていて、vCenter Server、DNS/AD及び、VDPやView等の他のアプリケーションも配置されています。
注:ホスト障害を対処する為に十分な容量がないことを示しています – 全てのVMを再保護する為には、120%の利用可能なストレージ容量が必要。(今後、この警告を無視してはいけない)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
<span style="font-family: courier new,courier,monospace; font-size: 8pt;">2016-04-17T09:50:05.280Z| vmx| I120: Msg_Question: 2016-04-17T09:50:05.280Z| vmx| I120: [msg.hbacommon.outofspace] There is no \ more space for virtual disk mgmt-vc01.rainpole.com_6.vmd 2016-04-17T09:50:05.280Z| vmx| I120: ---------------------------------------- 2016-04-17T09:50:25.278Z| vcpu-0| I120: Tools: Tools heartbeat timeout. 2016-04-17T09:54:05.650Z| vmx| I120: Timing out dialog 1510834 2016-04-17T09:54:05.651Z| vmx| I120: Vigor_MessageRevoke: message \ 'msg.hbacommon.outofspace' (seq 1510834) is revoked 2016-04-17T09:54:05.651Z| vmx| I120: MsgQuestion: msg.hbacommon.outofspace reply=0 2016-04-17T09:54:05.687Z| vmx| I120: Msg_Question: 2016-04-17T09:54:05.687Z| vmx| I120: [msg.hbacommon.outofspace] There is no \ more space for virtual disk mgmt-vc01.rainpole.com_6.vmd 2016-04-17T09:54:05.687Z| vmx| I120: ---------------------------------------- 2016-04-17T09:58:06.664Z| vmx| I120: Timing out dialog 1510835</span> |
その時点でvCenterにアクセスすることが出来ませんでしたので、このメッセージに対してどのように対応すればいいのかを検討し、CLIコマンドである、”vim-cmd”コマンドを実行してみることにしました。AD/DNSサーバ(dc01.rainpole.com)から始めてみます。最初にVM idが必要になりますので、ESXi上に配置されているVM idを以下のコマンドで確認します。
1 2 3 4 5 6 7 8 |
<span style="font-size: 8pt; font-family: courier new,courier,monospace;">[root@esxi-hp-01:~] <strong>vim-cmd /vmsvc/getallvms</strong> Vmid Name 15 vVNX [vsanDatastore] ... 16 vdp-01.rainpole.com [vsanDatastore] ... 20 dc01.rainpole.com [vsanDatastore] ... 22 appvolmgr.rainpole.com [vsanDatastore] ... 24 HCIBench [vsanDatastore] ... </span> |
1 2 3 4 5 6 7 8 |
<span style="font-family: courier new,courier,monospace; font-size: 8pt;">[root@esxi-hp-01:~] <strong>vim-cmd /vmsvc/message 20</strong> Virtual machine message 6034178: There is no more space for virtual disk \ dc01-rainpole.com.vmdk. You might be able to continue this \ session by freeing disk space on the relevant volume, \ and clicking Retry. Click Cancel to terminate this session. 0. button.retry (Retry) [default] 1. button.abort (Cancel)</span> |
次のコマンドで、出力されているメッセージを対処します。注:メッセージ id 6034178に対して、”0″(0. button.retry (Retry) [default])を実行。問題なく処理できたことが確認出来ます。
1 2 |
<span style="font-size: 8pt;">[root@esxi-hp-01:~] <strong>vim-cmd /vmsvc/message 20 6034178 0 </strong>[root@esxi-hp-01:~]</span> |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
<span style="font-size: 8pt; font-family: courier new,courier,monospace;">[root@esxi-hp-01:~] <strong>vim-cmd /vmsvc/message 20</strong> Virtual machine message 6034179: There is no more space for virtual disk \ dc01-rainpole.com.vmdk. You might be able to continue this \ session by freeing disk space on the relevant volume, and \ clicking Retry. Click Cancel to terminate this session. 0. button.retry (Retry) [default] 1. button.abort (Cancel) [root@esxi-hp-01:~] <strong>vim-cmd /vmsvc/message 20 6034179 0</strong> [root@esxi-hp-01:~] <strong>vim-cmd /vmsvc/message 20 </strong> Virtual machine message 6034180: There is no more space for virtual disk \ dc01-rainpole.com.vmdk. You might be able to continue this \ session by freeing disk space on the relevant volume, and \ clicking Retry. Click Cancel to terminate this session. 0. button.retry (Retry) [default] 1. button.abort (Cancel) [root@esxi-hp-01:~] <strong>vim-cmd /vmsvc/message 20 6034180 0</strong> [root@esxi-hp-01:~] <strong>vim-cmd /vmsvc/message 20 </strong> No message. [root@esxi-hp-01:~]</span> |
全てのメッセージに対処し、最終的にはメッセージが出力されなくなります(”No message.”)。次は同様の方法でvCenterサーバを起動させます。vCenterサーバが起動したら各種クライアントから接続し、未解決の問題に対応します。
原文:Recovering from a full VSAN datastore scenario
VMware Storage and Availability Business Unitの シニアスタッフエンジニアCormac Horganの個人ブログを翻訳したものになります。VSANの詳細に関しては弊社マニュアル 、KBをご確認ください。また本記事は VSAN 6.2ベースに記載しております。予めご了承ください