Index: [Article Count Order] [Thread]

Date: Fri, 25 Jul 2008 01:25:58 +0900
From: ごりゅ <sakura@usamimi.info>
Subject: [info-ml:00149] 【障害情報】7/24 13:30〜21:15 復旧連絡
To: usamimi infomation <info-ml@usamimi.info>
Message-Id: <20080724162551.D442645102@smtp.usamimi.info>
X-Mail-Count: 00149

こんばんわ
ごりゅです。

全サーバーが正常に動作していることが確認出来ましたので連絡いたします。

調べていて分かってきた事の顛末は以下の通りと思われますが
発生時のサーバーの状態が確認できている訳では無いので、憶測です。

メインサーバーの負荷軽減の為に、隔離サーバーに負荷の掛かっているアカウントを寄せる
何かの拍子に隔離サーバーが、パンクしてダウンする
メインサーバーが引きずられる形でフリーズ
WEBへのアクセスもできず、監視からアラートが上がった為、SSHでのログインを試みたがタイムアウト
電源管理装置からリモートで再起動を試みたが、隔離サーバーと依存関係にある為、再起動途中でストップ
帰宅後ノートPCからシリアルコンソールで繋いで止まっていた起動進める

現在、隔離サーバーに関わる処理は停止させています。
しばらくは様子見するしかないのですが、隔離サーバーが落ちたとしても
巻き添えでメインサーバーが落ちる事は無くなったと考えています。
#こちらも確証がある訳ではないので、確実にとは言えません。
#不明瞭な点ばかりで申し訳ないです。

尚、先のMLのメールが私の不手際で恐らく10名にしか届いていない事が分かりました。
再送するのも宛先が多い事からメールサーバーに負荷が掛かる為
以下のURLから参照する様お願い致します。
http://www.usamimi.info/fml_log/20080724/148.html

暑さの為なのか色々とミスが多くて申し訳ありませんが
よろしくお願いします。

以上です。

\e
--------------------------
ふろむ:goryu
めいる<sakura@usamimi.info>
ほーむ<http://www.usamimi.info/>