« IBM ThinkPad X40:SSDへの換装と感想(続編) | トップページ | HP ProLiant ML115G5  ~70度超のチップセットを冷却する~ »

2010年12月12日 (日)

原因を特定できないまま・・・続くトラブル対応

現在、頭を悩ませているのが、Hyper-V2.0環境でのバックアップ時のトラブル。

バックアップ製品は、Symantec BackupExec2010(以下、BE2010)。

環境としては、IBM System x3650と同x3650M2に、FC接続のストレージであるDS3400を加えたMSFC+Hyper-V2.0環境です。

この環境で、BE2010によるバックアップを行うと、ゲストOSがストール(ハングアップ)、リブート、もしくはシャットダウンしてしまう現象。

今までわかってきたことをまとめると・・・

1.バックアップ時にCSV(ClusterSharedVolume)が、バックアップ対象のゲストOSが稼動するHyper-Vホストに所有者が移動すること。

2.バックアップ対象のゲストOSが稼動するHyper-Vホストとは別のHyper-Vホストで、ゲストOSに障害が発生すること。

3.本現象が発生する際、バックアップジョブは稼動し続けているように見える(ただし、メディアサーバ上でジョブが実行中に見えるだけで、バックアップ対象となるサーバのRemoteAgentがハングアップしている可能性が高い)

4.検証環境で酷似した現象が発生し、MSKB:2277439にて解消と思われたが、どうやら検証環境と現場環境では発生原因が異なるようだ(ちなみに、MSKB:2277439は、Hyper-V2.0環境でバックアップする際に、Cluster Serviceが停止してしまう問題。Cluster Serviceが停止すると、CSVへのアクセスができなくなるのでゲストは落ちる)。

そこで、現場環境を見据えた仮説としては・・・

”3”の現象が発生すると、”2”の現象が発生することから、CSVの所有者側ではないHyper-VホストでCSVへのアクセスができなくなり(実際、CSVが利用できなくなった旨のイベントログがあがる)、ゲストOSは、ディスクを抜かれたも同然の状況となり、ハングアップしてしまうのではないか・・・

現段階(2010年12月12現在)では、Hyper-V2.0ホストのNICのチーミング設定も懸念事項としてあがっている。

Hyper-VおよびLiveMigration環境でのNICのチーミング設定の可否はMSではなく、メーカーに委ねられており、主要なサーバメーカーは、その対応状況を公開している。

はてさて、どうなることやら。

我が家の検証環境でも再度検証してみるとするか・・・

#今まで対応してきた内容、わかってきたこと

1.Hyper-Vに関連する個別パッチの適用

2.BE2010をBE2010 R2へアップグレード(LiveUpdate)

3.BE2010 R2にHotfixを適用(LiveUpdade)

4.バックアップ時に発生するこの障害は、仮想ディスクサイズの大きなゲストで発生する(しやすい?)...400GB超のExchange2010用ゲストOSのバックアップ時に、本障害は発生した。

5.問題の原因は?

・Microsoft:

 Hyper-V環境?VSSとバックアップの関係?Exchange特有?

・Symantec:

 BE2010(R2含む)、特にRemoteAgentに何らかの不具合?

・IBM:

 NICチーミング設定の問題(問題があれば、チーミング解除)、ストレージやFC-HBA関連でなにか障害原因がある?

・現環境で怪しいところとか、その他

 ・ゲストOSの稼動数超過

 ・Exchange2010の仮想ディスクが容量可変

 ・ゲストOSをHyper-Vホストに振りわけて稼動する場合・・・

  CSVをRAIDグループレベルまで分けたほうがよいのでは?

  ⇒最低限、CSVのドライブを分けたほうがよさそうな気がする。

 ・異なるCPUの場合の互換設定は有効にしてある

・・・うーーーん

« IBM ThinkPad X40:SSDへの換装と感想(続編) | トップページ | HP ProLiant ML115G5  ~70度超のチップセットを冷却する~ »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: 原因を特定できないまま・・・続くトラブル対応:

« IBM ThinkPad X40:SSDへの換装と感想(続編) | トップページ | HP ProLiant ML115G5  ~70度超のチップセットを冷却する~ »

Google Adsense

2024年12月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

最近のコメント

最近のトラックバック

無料ブログはココログ