お世話になります。
Windows Server 2016でHyper-Vレプリカ環境を構築したのですが、
「レプリカの変更を適用中...」のまま先に進まず、
レプリケーションが止まるという症状に悩んでいます。
より詳細な情報は以下の通りです。
- 発生頻度は定期的ではなく2~3日毎。
- 3台の仮想マシンをレプリケーションしているが、うち1台について症状が頻発する。
もう1台は稀に症状が発生し、最後の1台は今のところ全く症状が起こらないなど、発生傾向に偏りがある。 - 3台の仮想マシンは何れもWindows Server 2012 R2/第2世代仮想マシンで、
Hyper-V統合サービスやWindows Updateは少なくとも2017年8月の更新プログラムレベル以上が適用されている。 - 各仮想マシンはレプリカホスト側のタスクスケジューラ+PowerShellスクリプトにより、
1日1回チェックポイントを作成し、7世代を超えた分は自動的に削除しているが、
この症状はチェックポイント数が2世代程度でも発生する為、
チェックポイントの削除に伴うVHDXの結合処理が原因ではない。(結合処理を行わなくても発生する) - 一度症状が発生すると、Hyper-V VMMSサービスの再起動を試みても「サービスの停止中」から進まなくなり、
ホストを再起動するしかなくなる。 - ホストの再起動を行うと処理は再開⇒完了し、停止している間に溜まったHRLの適用も順次行われ正常になる。
- 複数の仮想マシンのうち1台のレプリケーションでこの問題が発生しても、
他の仮想マシンのレプリケーションは問題なく継続される。 - レプリカホスト側のHyper-V VMMSイベントログ等には特にエラーや警告は記録されない。
プライマリホスト側では当然レプリケーションが送信できない旨のエラーが記録される。 - プライマリホストはWindows Server 2012 R2、レプリカホストがWindows Server 2016。
- 問題の仮想マシンについて計画フェールオーバーを実施して、
プライマリを2016、レプリカを2012 R2にすると問題は発生しなくなる。
問題のレプリカホストに対しては、別のWindows Server 2016のホストからも
2台の仮想マシンのレプリケーションを行っていますが、
こちらは現時点では全く症状が発生していません。
海外のフォーラムを確認したところ、同様の症状が2例発生している模様です。
(うち1件は諦めてホストをダウングレードした模様、最後の1例は私自身の投稿です)
上記フォーラムや他のサイトに、ホストのWindows Defenderが無効だと
症状が発生する旨がありましたが、
こちらの環境ではWindows Defenderは有効であり、
他のウィルス対策製品などはホストへは導入していません。
ホストへ導入したアプリはRAID構成ツール等のハードウェアメンテナンス用のものと、
UPSの電源管理ソフトのみです。(何れもHPE製)
どなたか同様の症状が発生している方は居ませんでしょうか?
または、これまでの情報で気になる点があればご指摘頂けると幸いです。