Index: [Article Count Order] [Thread]

Date: Mon, 27 Mar 2006 13:25:07 +0900 (JST)
From: ごりゅ <sakura@usamimi.info>
Subject: [info-ml:00099] 接続不能障害について続報
To: info-ml@usamimi.info
Message-Id: <34584.157.2.21.248.1143433507.squirrel@www.usamimi.info>
X-Mail-Count: 00099

こんにちわ
ごりゅです。

///usamimi.info障害情報///

先週末から発生している、サーバーの不安定動作について
原因は、PHPのアクセラレータであるeAcceleratorの
バージョンアップに端を発している事が分かりました。

問題を修正しましたが
まだ、潜在的に残っている問題や数日経たなければ
問題が改善されたとは分からない為、暫く様子を見ます。
詳細は、連絡事項に書きます。

また、この間、隔離サーバーにも少なからず影響が出ています。
多くの修正点があった為、全体を把握できていない状態です。
もし、問題等々を発見した場合は
サポート掲示板、メール等で連絡をお願い致します。

///メンテナンス情報///
予定は、今のところ有りません。


///連絡事項///

今回の障害の要因は2つあります。
1.OSごとハングアップする問題
2.WEBサーバーのログローテーションなどの時に
設定をリロードさせると、WEBサーバーが死んでしまう問題

1については、アクセラレータの仕様の変化なのか
従来の設定で、WEBサーバーが上がらない事が確認された為
メモリを多めに取るようにしていましたが、今回の問題が確認された為
従来より確保するメモリ量を減らして対応しています。

2については、apachectl gracefulやsyslogからのシグナルを受け取ると
[notice] SIGUSR1 received.  Doing graceful restart
メッセージを出力し、WEBサーバーが死ぬ事が確認されていました。
問題の特定に時間が掛かり、深夜から長期停止などを招いていましたが
アクセラレータを入れなおす事で改善されています。
尚、この問題については、アクセラレータの新バージョンのテストを隔離サーバーで
行い、
そのバイナリをそのまま、ほぼ同じ構成である
メインサーバーに入れた事によるWEBサーバのモジュール不整合の問題であると推測
しています。

以上です。

このメーリングリスト(マガジン)は、usamimi.infoのアカウントを取得している人向
けに配信されています。
質問等、返信に関しては、ML宛ではなく、sakura@usamimi.info宛てにお願いします。

\e
--------------------------
from:ごりゅ
home:http://www.usamimi.info/
mail:sakura@usamimi.info
--------------------------