原因を特定できないまま・・・続くトラブル対応
現在、頭を悩ませているのが、Hyper-V2.0環境でのバックアップ時のトラブル。
バックアップ製品は、Symantec BackupExec2010(以下、BE2010)。
環境としては、IBM System x3650と同x3650M2に、FC接続のストレージであるDS3400を加えたMSFC+Hyper-V2.0環境です。
この環境で、BE2010によるバックアップを行うと、ゲストOSがストール(ハングアップ)、リブート、もしくはシャットダウンしてしまう現象。
今までわかってきたことをまとめると・・・
1.バックアップ時にCSV(ClusterSharedVolume)が、バックアップ対象のゲストOSが稼動するHyper-Vホストに所有者が移動すること。
2.バックアップ対象のゲストOSが稼動するHyper-Vホストとは別のHyper-Vホストで、ゲストOSに障害が発生すること。
3.本現象が発生する際、バックアップジョブは稼動し続けているように見える(ただし、メディアサーバ上でジョブが実行中に見えるだけで、バックアップ対象となるサーバのRemoteAgentがハングアップしている可能性が高い)
4.検証環境で酷似した現象が発生し、MSKB:2277439にて解消と思われたが、どうやら検証環境と現場環境では発生原因が異なるようだ(ちなみに、MSKB:2277439は、Hyper-V2.0環境でバックアップする際に、Cluster Serviceが停止してしまう問題。Cluster Serviceが停止すると、CSVへのアクセスができなくなるのでゲストは落ちる)。
そこで、現場環境を見据えた仮説としては・・・
”3”の現象が発生すると、”2”の現象が発生することから、CSVの所有者側ではないHyper-VホストでCSVへのアクセスができなくなり(実際、CSVが利用できなくなった旨のイベントログがあがる)、ゲストOSは、ディスクを抜かれたも同然の状況となり、ハングアップしてしまうのではないか・・・
現段階(2010年12月12現在)では、Hyper-V2.0ホストのNICのチーミング設定も懸念事項としてあがっている。
Hyper-VおよびLiveMigration環境でのNICのチーミング設定の可否はMSではなく、メーカーに委ねられており、主要なサーバメーカーは、その対応状況を公開している。
はてさて、どうなることやら。
我が家の検証環境でも再度検証してみるとするか・・・
#今まで対応してきた内容、わかってきたこと
1.Hyper-Vに関連する個別パッチの適用
2.BE2010をBE2010 R2へアップグレード(LiveUpdate)
3.BE2010 R2にHotfixを適用(LiveUpdade)
4.バックアップ時に発生するこの障害は、仮想ディスクサイズの大きなゲストで発生する(しやすい?)...400GB超のExchange2010用ゲストOSのバックアップ時に、本障害は発生した。
5.問題の原因は?
・Microsoft:
Hyper-V環境?VSSとバックアップの関係?Exchange特有?
・Symantec:
BE2010(R2含む)、特にRemoteAgentに何らかの不具合?
・IBM:
NICチーミング設定の問題(問題があれば、チーミング解除)、ストレージやFC-HBA関連でなにか障害原因がある?
・現環境で怪しいところとか、その他
・ゲストOSの稼動数超過
・Exchange2010の仮想ディスクが容量可変
・ゲストOSをHyper-Vホストに振りわけて稼動する場合・・・
CSVをRAIDグループレベルまで分けたほうがよいのでは?
⇒最低限、CSVのドライブを分けたほうがよさそうな気がする。
・異なるCPUの場合の互換設定は有効にしてある
・・・うーーーん
« IBM ThinkPad X40:SSDへの換装と感想(続編) | トップページ | HP ProLiant ML115G5 ~70度超のチップセットを冷却する~ »
「パソコン・インターネット」カテゴリの記事
- Affinity がスプリングセールを開催中らしい(2024年4月10日現在)Affinity V2 Universal Licence (Upgrade)がお得(2024.04.10)
- Windows Update(KB5034848)がインストールできない ~予定どおりに完了できませんでした。~(2024.03.04)
- Windows ネットワークに現れた 不明な怪しいネットワークデバイス Vehicle 、製造元: Qualcomm 、モデル: wdk_ap_test(2024.02.08)
- Lumix DMC-FZH1 で使っているSDカードがカードリーダで読み出し中にエラー。突然raw形式に。chkdskで復旧。(2024.01.17)
- SYNCO G3 ワイヤレス録音マイク の送信機の充電やデータ転送ができない件(2023.09.18)
« IBM ThinkPad X40:SSDへの換装と感想(続編) | トップページ | HP ProLiant ML115G5 ~70度超のチップセットを冷却する~ »
コメント