Veritas InfoScale™ 7.4 トラブルシューティングガイド - Solaris
- 概要
- 第 I 部 Veritas File System のトラブルシューティング
- 第 II 部 Veritas Volume Manager のトラブルシューティング
- ハードウェア障害からのリカバリ
- RAID 5 ボリュームの障害
- DCO ボリュームの障害からのリカバリ
- インスタントスナップショット障害からのリカバリ
- 失敗した vxresize 操作のリカバリ
- ブートディスク障害からのリカバリ
- コマンド、タスク、トランザクションの管理
- ディスクグループ設定のバックアップと復元
- ディスクグループのインポートを使った問題のトラブルシューティング
- CDS エラーからの回復
- ログおよびエラーメッセージ
- Veritas Volume Replicator のトラブルシューティング
- 設定エラーのリカバリ
- プライマリまたはセカンダリでのリカバリ
- クラウド配備の問題のトラブルシューティング
- ハードウェア障害からのリカバリ
- 第 III 部 Dynamic Multi-Pathing のトラブルシューティング
- 第 IV 部 Storage Foundation Cluster File System High Availability のトラブルシューティング
- 第 V 部 Cluster Server のトラブルシューティング
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- サービスグループに関するトラブルシューティング
- リソースに関するトラブルシューティング
- I/O フェンシングのトラブルシューティング
- システムパニックによって潜在的なデータ破損が防止される
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- CP サーバーのトラブルシューティング
- Veritas InfoScale products クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- ライセンスに関するトラブルシューティング
- ライセンスのエラーメッセージ
- VCS のトラブルシューティングおよびリカバリ
- 第 VI 部 SFDB のトラブルシューティング
フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
vxfen ドライバは、プライベートネットワークリンクの障害が発生した後、プライベートネットワークリンクが修復されるまでの間、削除されたノードがクラスタに再参加することを防止するように機能します。
たとえば、システム 1 とシステム 2 によって形成されているクラスタが正常に機能しているときに、プライベートネットワークリンクが破損したとしましょう。システム 1 が削除されたシステムであるとしましょう。プライベートネットワークリンクが修復される前にシステム 1 が再起動した場合、システム 1 のメンバーシップ設定ではシステム 2 が表示されません。ただし、システム 1 がコーディネータディスクに登録を行おうとしたときに、システム 2 がコーディネータディスクにすでに登録されていることを検出します。システム 2 に関するこの競合情報が与えられた結果、システム 1 はクラスタに参加せず、vxfenconfig が実行されたときに次のようなエラーを返します。
vxfenconfig: ERROR: There exists the potential for a preexisting split-brain. The coordinator disks list no nodes which are in the current membership. However, they also list nodes which are not in the current membership. I/O Fencing Disabled!
また、コンソールには次の情報が表示されます。
<date> <system name> vxfen: WARNING: Potentially a preexisting <date> <system name> split-brain. <date> <system name> Dropping out of cluster. <date> <system name> Refer to user documentation for steps <date> <system name> required to clear preexisting split-brain. <date> <system name> <date> <system name> I/O Fencing DISABLED! <date> <system name> <date> <system name> gab: GAB:20032: Port b closed
ただし、プライベートネットワークリンクが動作していて、両方のシステムが停止し、システム 1 が再起動し、システム 2 が復帰に失敗した場合も、同じエラーが発生する可能性があります。 システム 1 からクラスタを見たときに、システム 2 はコーディネータポイント上で依然として登録されている可能性があります。
サーバーベースのフェンシングでの既存のスプリットブレインを理解するため、次の状況を考えてみます。
コーディネーションポイントとして機能する 3 つの CP サーバーがあるとします。3 つの CP サーバーの 1 つがアクセス不能になります。この状態で、1 つのクライアントノードがクラスタから除かれます。しかし、その登録はアクセス不能になった CP サーバーからは削除できません。アクセス不能な CP サーバーが再起動すると、このサーバーには VCSから切り離されたノードからの無効登録が含まれます。この場合、新しいノードはクラスタに参加できません。クラスタに参加しようとする各ノードは CP サーバーから登録のリストを取得します。1 つの CP サーバーは(先に切り離されたノードの)登録を余分に含んでいます。これにより、joiner ノードは、joiner ノードと無効登録によって表されるノードとの間にスプリットブレインが存在すると結論付けます。
すべてのクライアントノードのフェンシングキーが CP サーバーから消去されていないため、それらのクライアントノードは同時にクラッシュしました。その結果、ノードの再起動時に、vxfen 設定による既存のスプリットブレインの報告が失敗します。
これらの状況は、vxfenclearpre コマンドを実行して解決できる、コーディネータディスクとすでに発生しているスプリットブレインの状況に似ています。サーバーベースのフェンシングでも、cpsadm コマンドを使った同様の解決策が必要です。
すでに発生しているスプリットブレイン状態のクリアを参照してください。