Veritas InfoScale™ 8.0.2 トラブルシューティングガイド - Linux
- はじめに
- 第 I 部 Veritas File System のトラブルシューティング
- 第 II 部 Veritas Volume Manager のトラブルシューティング
- ハードウェア障害からのリカバリ
- RAID 5 ボリュームの障害
- DCO ボリュームの障害からのリカバリ
- インスタントスナップショット障害からのリカバリ
- 失敗した vxresize 操作のリカバリ
- ブートディスク障害からのリカバリ
- コマンド、タスク、トランザクションの管理
- ディスクグループ設定データのバックアップとリストア
- ディスクグループのインポートを使った問題のトラブルシューティング
- CDS エラーからの回復
- ログおよびエラーメッセージ
- Veritas Volume Replicator のトラブルシューティング
- 設定エラーのリカバリ
- プライマリまたはセカンダリでのリカバリ
- ハードウェア障害からのリカバリ
- 第 III 部 Dynamic Multi-Pathing のトラブルシューティング
- 第 IV 部 Storage Foundation Cluster File System High Availability のトラブルシューティングについて
- 第 V 部 Cluster Server のトラブルシューティング
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- サービスグループに関するトラブルシューティング
- リソースに関するトラブルシューティング
- I/O フェンシングのトラブルシューティング
- システムパニックによって潜在的なデータ破損が防止される
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- CP サーバーのトラブルシューティング
- Veritas InfoScale 製品 クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- ライセンスに関するトラブルシューティング
- ライセンスのエラーメッセージ
- VCS のトラブルシューティングおよびリカバリ
- 第 VI 部 SFDB のトラブルシューティング
各種のイベントシナリオにおける I/O フェンシングの動作
表: I/O フェンシングのシナリオ に、障害イベントの各種シナリオで、データの破損を回避するために I/O フェンシングがどのように動作するかを示します。イベントごとに、オペレータの対処方法を確認します。
表: I/O フェンシングのシナリオ
イベント | ノード A の動作 | ノード B の動作 | オペレータのアクション |
---|---|---|---|
両方のプライベートネットワークで障害が発生。 | ノード は、コーディネーションポイントの定足数を獲得しようとします。 ノード A は、コーディネーションポイントの競合に勝利すると、ノード B を共有ディスクの登録から除外して処理を続行します。 | ノード B は、コーディネーションポイントの定足数を獲得しようとします。 ノード B は、コーディネーションポイントの競合に敗退すると、パニックになり、クラスタから自分自身を削除します。 | ノード B がクラスタから切り離されたら、ノード B を復帰させる前にプライベートネットワークを修復します。 |
上記イベント後に、両方のプライベートネットワークが再び正常に動作する。 | ノード A は処理を続行します。 | ノード B はクラッシュしています。単に再起動しただけでは、ノード B はデータディスクに書き込めないため、データベースを起動できません。 | プライベートネットワークが復元されたらノード B を再起動する。 |
一方のプライベートネットワークでエラーが発生する。 | ノード A は、I/O フェンスのエラーメッセージをコンソールに表示し、処理を続行します。 | ノード B は IOFENCE に関するメッセージをコンソールに表示するが、動作を続ける。 | プライベートネットワークを修復します。ネットワークの修復後に、両方のノードは修復したネットワークを自動的に使います。 |
ノード A がハングする。 | ノード A は、何らかの理由で異常なビジー状態になっているか、カーネルデバッガに制御されています。 ノード A がハング状態またはカーネルデバッガの制御から解放されると、キューイングされていたデータディスクへの書き込みは、ノード A の登録が解除されているため失敗します。ノード A は、削除されていることに関するメッセージを GAB から受け取ると、パニックになり、自身をクラスタから削除します。 | ノード B はノード A とのハートビートを失い、コーディネーションポイントの定足数を獲得しようとします。 ノード B はコーディネーションポイントの競合に勝利すると、ノード A の登録を共有ディスクから解除します。 | ハングしたノードを修復またはデバッグし、クラスタを再結合するためにノードを再ブートします。 |
ノード A、ノード B の電源およびプライベートネットワークが遮断される。 コーディネーションポイントおよびデータディスクの電源は維持される。 ノードに電源が戻り再起動されるが、プライベートネットワークは依然として電源がオフになっている。 | ノード A は再起動され、I/O フェンシングドライバ(vxfen)はノード B がコーディネーションポイントに登録されていることを検出する。プライベートネットワークがダウンしているため、ドライバはノード B がクラスタのメンバーとして一覧表示されていることを認識しません。このため、I/O フェンシングデバイスドライバはノード A がクラスタに参加することを拒否します。ノード A のコンソールは次の内容を表示します。 Potentially a preexisting split brain. Dropping out of the cluster. Refer to the user documentation for steps required to clear preexisting split brain. | ノード B は再起動され、I/O フェンシングドライバ(vxfen)はノード A がコーディネーションポイントに登録されていることを検出する。プライベートネットワークがダウンしているため、ドライバはノード A がクラスタのメンバーとして一覧表示されていることを認識しません。このため、I/O フェンシングデバイスドライバはノード B がクラスタに参加することを拒否します。ノード B のコンソールは次の内容を表示します。 Potentially a preexisting split brain. Dropping out of the cluster. Refer to the user documentation for steps required to clear preexisting split brain. | すでに発生しているスプリットブレイン状態を解決する。 フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告されるを参照してください。 |
ノード B がダウンしている間にノード A がクラッシュする。ノード B は再起動されるが、ノード A は停止したままである。 | ノード A はクラッシュしています。 | ノード B は再起動され、ノード A がコーディネーションポイントに登録されていることを検出する。ドライバは、ノード A がクラスタのメンバーとして一覧表示されていることを認識しません。I/O フェンシングデバイスドライバはコンソールに次のメッセージを表示します。 Potentially a preexisting split brain. Dropping out of the cluster. Refer to the user documentation for steps required to clear preexisting split brain. | すでに発生しているスプリットブレイン状態を解決する。 フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告されるを参照してください。 |
3 つのコーディネーションポイントのうちの 2 つを含むディスクアレイの電源が遮断される。 いずれのノードもクラスタメンバーシップから切り離されません。 | ノード A は、クラスタから切り離されるノードがないかぎり動作を続行します。 | ノード B は、クラスタから切り離されるノードがないかぎり動作を続行します。 | 障害が発生したディスクアレイの電源を入れ、以降のネットワーク分割によってクラスタがシャットダウンしないようにするか、コーディネーションポイントを交換します。 ???を参照してください。 |
3 つのコーディネーションポイントのうちの 2 つを含むディスクアレイの電源が遮断される。 ノード B はクラスタから正常に切り離され、ディスクアレイは電源が切れたままである。正常な切り離しはクリーンシャットダウンを意味するため、vxfen が適切に設定解除される。 | ノード A はクラスタで動作を続行します。 | ノード B はクラスタから切り離されました。 | 障害が発生したディスクアレイの電源を入れ、以降のネットワーク分割によってクラスタがシャットダウンしないようにするか、コーディネーションポイントを交換します。 ???を参照してください。 |
3 つのコーディネーションポイントのうちの 2 つを含むディスクアレイの電源が遮断される。 ノード B が不意にクラッシュするか、ノード A およびノード B 間でネットワーク分割が発生し、ディスクアレイは電源が切れたままである。 | ノード A は、コーディネーションポイントの定足数を獲得しようとします。3 つのコーディネーションポイントのうち 1 つしか使えないため、ノード A は定足数の確保に失敗します。ノード A は、パニックになり、クラスタから自身を削除します。 | クラッシュまたはネットワーク分割が原因で、ノード B はクラスタから切り離されました。 | 障害が発生したディスクアレイの電源を入れ、I/O フェンシングドライバを再起動して、ノード A をすべてのコーディネーションポイントに登録できるようにするか、コーディネーションポイントを交換します。 クラスタがオフラインになっているときに不具合のあるディスクの置換を参照してください。 |