« IBM ThinkPad X40:SSDへの換装と感想(続編) | トップページ | 【ML115G5】70度超のチップセットを冷却する »

2010年12月12日 (日)

原因を特定できないまま・・・続くトラブル対応

現在、頭を悩ませているのが、Hyper-V2.0環境でのバックアップ時のトラブル。

バックアップ製品は、Symantec BackupExec2010(以下、BE2010)。

環境としては、IBM System x3650と同x3650M2に、FC接続のストレージであるDS3400を加えたMSFC+Hyper-V2.0環境です。

この環境で、BE2010によるバックアップを行うと、ゲストOSがストール(ハングアップ)、リブート、もしくはシャットダウンしてしまう現象。

今までわかってきたことをまとめると・・・

1.バックアップ時にCSV(ClusterSharedVolume)が、バックアップ対象のゲストOSが稼動するHyper-Vホストに所有者が移動すること。

2.バックアップ対象のゲストOSが稼動するHyper-Vホストとは別のHyper-Vホストで、ゲストOSに障害が発生すること。

3.本現象が発生する際、バックアップジョブは稼動し続けているように見える(ただし、メディアサーバ上でジョブが実行中に見えるだけで、バックアップ対象となるサーバのRemoteAgentがハングアップしている可能性が高い)

4.検証環境で酷似した現象が発生し、MSKB:2277439にて解消と思われたが、どうやら検証環境と現場環境では発生原因が異なるようだ(ちなみに、MSKB:2277439は、Hyper-V2.0環境でバックアップする際に、Cluster Serviceが停止してしまう問題。Cluster Serviceが停止すると、CSVへのアクセスができなくなるのでゲストは落ちる)。

そこで、現場環境を見据えた仮説としては・・・

”3”の現象が発生すると、”2”の現象が発生することから、CSVの所有者側ではないHyper-VホストでCSVへのアクセスができなくなり(実際、CSVが利用できなくなった旨のイベントログがあがる)、ゲストOSは、ディスクを抜かれたも同然の状況となり、ハングアップしてしまうのではないか・・・

現段階(2010年12月12現在)では、Hyper-V2.0ホストのNICのチーミング設定も懸念事項としてあがっている。

Hyper-VおよびLiveMigration環境でのNICのチーミング設定の可否はMSではなく、メーカーに委ねられており、主要なサーバメーカーは、その対応状況を公開している。

はてさて、どうなることやら。

我が家の検証環境でも再度検証してみるとするか・・・

#今まで対応してきた内容、わかってきたこと

1.Hyper-Vに関連する個別パッチの適用

2.BE2010をBE2010 R2へアップグレード(LiveUpdate)

3.BE2010 R2にHotfixを適用(LiveUpdade)

4.バックアップ時に発生するこの障害は、仮想ディスクサイズの大きなゲストで発生する(しやすい?)...400GB超のExchange2010用ゲストOSのバックアップ時に、本障害は発生した。

5.問題の原因は?

・Microsoft:

 Hyper-V環境?VSSとバックアップの関係?Exchange特有?

・Symantec:

 BE2010(R2含む)、特にRemoteAgentに何らかの不具合?

・IBM:

 NICチーミング設定の問題(問題があれば、チーミング解除)、ストレージやFC-HBA関連でなにか障害原因がある?

・現環境で怪しいところとか、その他

 ・ゲストOSの稼動数超過

 ・Exchange2010の仮想ディスクが容量可変

 ・ゲストOSをHyper-Vホストに振りわけて稼動する場合・・・

  CSVをRAIDグループレベルまで分けたほうがよいのでは?

  ⇒最低限、CSVのドライブを分けたほうがよさそうな気がする。

 ・異なるCPUの場合の互換設定は有効にしてある

・・・うーーーん

« IBM ThinkPad X40:SSDへの換装と感想(続編) | トップページ | 【ML115G5】70度超のチップセットを冷却する »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/568191/50280745

この記事へのトラックバック一覧です: 原因を特定できないまま・・・続くトラブル対応:

« IBM ThinkPad X40:SSDへの換装と感想(続編) | トップページ | 【ML115G5】70度超のチップセットを冷却する »

2017年6月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  
無料ブログはココログ