【VMware】vSAN構成の冗長性に関する注意点

はじめに

SDS(Software Defined Storage)が普及してきており、安定して運用できるようになってきていると感じております。私のプロジェクトでもVMware社が提供しているvSANを適用してシステムを運用してきております。ただ、vSAN特有のトラブル起因でサービス影響起きる事象が発生することもあるので、特徴をしっかり押さえておくことで早期トラブル解決ができる準備を整えておきましょう。

vSAN構成例

vSAN構成の一例を下図に記載します。vSAN通信用にvmk1(vmkernel1)を割り当てており、vmk1が物理NICであるvmnic2, vmnic3と紐づいた設計としております。本構成にすることで物理NICが故障した際でもサービス継続ができる構成となっています。

ESXiサーバ間をまたがるディスク書き込みの流れ

vSANにおいて、仮想サーバからの書き込みはESXiサーバ間をまたがって処理されます。その際、vmk1と紐づいているvmnic2、vmnic3の片方がActive、もう片方がStandbyとなります。現時点ではActive-Activeの構成はVMware製品として採用できません。

vmnic故障時の挙動

vmnic故障が発生してリンクダウンを検知すると、StandbyのvmnicがActiveに昇格します。その後、arpパケットをL2SWに飛ばすことでL2SWが新しくActiveになったvmnicを認識し、書き込みパケットを飛ばすという流れになります。

vmnicの障害時の動きについて補足しておきます。standbyのvmnicがactiveに変わる時は、ESXiサーバーがリンクタウン検知した時になります。仮にリンクダウンしない故障が発生した場合は故障しているvmnicを使い続けてしまうので注意が必要です。通信ができない状態になれば、他のESXiサーバーが故障検知してサーバーを切り離し、上に乗っている仮想サーバーはVMHAすることでリカバリされますが、CRCエラーが頻発するような状態になった場合は他のESXiサーバから故障検知されず、ディスクへの書き込みが不安定な状態が続いてしまうので、手動で復旧、あるいはサーバを切り離す必要がありますのでご留意ください。

参考資料

もっと詳細内容を知りたい方は、ぜひVMwareの社員の方が記載しているブログを見てみることをお勧めします。
https://blogs.vmware.com/vmware-japan/2015/11/vsan_01.html

おわりに

最後まで読んでいただき、ありがとうございました。ほかにも皆さんのためになると思うコンテンツを配信していますので、ぜひ目を通してもらえると嬉しいです。
https://eeengineer.com/

コメント