Storage Foundation for Oracle® RAC 7.3.1 管理者ガイド - Solaris
- 第 I 部 SF Oracle RAC の概念と管理
- Storage Foundation for Oracle RAC の概要
- Storage Foundation for Oracle RAC について
- SF Oracle RAC のコンポーネント製品とプロセス
- Virtual Business Service について
- SF Oracle RAC とそのコンポーネントの管理
- SF Oracle RAC の管理
- 各ノードの SF Oracle RAC の起動または停止
- VCS の管理
- I/O フェンシングの管理
- CP サーバーの管理
- CFS の管理
- CVM の管理
- Flexible Storage Sharing の管理
- SF Oracle RAC のグローバルクラスタの管理
- SF Oracle RAC の管理
- Storage Foundation for Oracle RAC の概要
- 第 II 部 処理速度とトラブルシューティング
- SF Oracle RAC のトラブルシューティング
- SF Oracle RAC のトラブルシューティングについて
- I/O フェンシングのトラブルシューティング
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- CP サーバーのトラブルシューティング
- SF Oracle RAC クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- SF Oracle RAC クラスタの Cluster Volume Manager のトラブルシューティング
- CFS のトラブルシューティング
- VCSIPC のトラブルシューティング
- Oracle のトラブルシューティング
- SF Oracle RAC クラスタの ODM のトラブルシューティング
- 防止と修復の戦略
- チューニングパラメータ
- SF Oracle RAC のトラブルシューティング
- 第 III 部 参照
フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
vxfen ドライバは、プライベートネットワークリンクの障害が発生した後、プライベートネットワークリンクが修復されるまでの間、削除されたノードがクラスタに再参加することを防止するように機能します。
たとえば、システム 1 とシステム 2 によって形成されているクラスタが正常に機能しているときに、プライベートネットワークリンクが破損したとしましょう。システム 1 が削除されたシステムであるとしましょう。プライベートネットワークリンクが修復される前にシステム 1 が再起動した場合、システム 1 のメンバーシップ設定ではシステム 2 が表示されません。ただし、システム 1 がコーディネータディスクに登録を行おうとしたときに、システム 2 がコーディネータディスクにすでに登録されていることを検出します。システム 2 に関するこの競合情報が与えられた結果、システム 1 はクラスタに参加せず、vxfenconfig が実行されたときに次のようなエラーを返します。
vxfenconfig: ERROR: There exists the potential for a preexisting split-brain. The coordinator disks list no nodes which are in the current membership. However, they also list nodes which are not in the current membership. I/O Fencing Disabled!
また、コンソールには次の情報が表示されます。
<date> <system name> vxfen: WARNING: Potentially a preexisting <date> <system name> split-brain. <date> <system name> Dropping out of cluster. <date> <system name> Refer to user documentation for steps <date> <system name> required to clear preexisting split-brain. <date> <system name> <date> <system name> I/O Fencing DISABLED! <date> <system name> <date> <system name> gab: GAB:20032: Port b closed
ただし、プライベートネットワークリンクが動作していて、両方のシステムが停止し、システム 1 が再起動し、システム 2 が復帰に失敗した場合も、同じエラーが発生する可能性があります。 システム 1 からクラスタを見たときに、システム 2 はコーディネータポイント上で依然として登録されている可能性があります。
サーバーベースのフェンシングでの既存のスプリットブレインを理解するため、次の状況を考えてみます。
コーディネーションポイントとして機能する 3 つの CP サーバーがあるとします。3 つの CP サーバーの 1 つがアクセス不能になります。この状態で、1 つのクライアントノードがクラスタから除かれます。しかし、その登録はアクセス不能になった CP サーバーからは削除できません。アクセス不能な CP サーバーが再起動すると、このサーバーには SF Oracle RAC クラスタから切り離されたノードからの無効登録が含まれます。この場合、新しいノードはクラスタに参加できません。クラスタに参加しようとする各ノードは CP サーバーから登録のリストを取得します。1 つの CP サーバーは(先に切り離されたノードの)登録を余分に含んでいます。これにより、joiner ノードは、joiner ノードと無効登録によって表されるノードとの間にスプリットブレインが存在すると結論付けます。
すべてのクライアントノードのフェンシングキーが CP サーバーから消去されていないため、それらのクライアントノードは同時にクラッシュしました。その結果、ノードの再起動時に、vxfen 設定による既存のスプリットブレインの報告が失敗します。
これらの状況は、vxfenclearpre コマンドを実行して解決できる、コーディネータディスクとすでに発生しているスプリットブレインの状況に似ています。サーバーベースのフェンシングでも、cpsadm コマンドを使った同様の解決策が必要です。
すでに発生しているスプリットブレイン状態のクリアを参照してください。