Category Archives: サーバ管理 - Page 2

ZABBIXを1.8から2.0にアップデートする

 5 月に ZABBIX がメジャーバージョンアップして 2.0 がリリースされていたが、7 月にリリースされた 2.0.1 が Gentoo Linux でも Portage ツリーに追加されたのでインストールしてみた。

 これまでは Web インターフェイスについては手動インストールしていたが、外部監視用のさくら VPS には Gentoo Linux で使われている webapp-config を使ってインストールしたこともあって、LAN 内の ZABBIX についても webapp-config でアップデートすることにした。

Read more »

ZABBIXで太陽光発電システム(JH-RWL3)をモニタリングする

 前回、初めての検針結果を貼ってみたが、月に1回の検針結果だけで売電量などが分かるのはあまり効率もよくない。電力モニタ JH-RWL3 でも確認はできるが、粒度は 1 時間単位とそんなに細かくはない。

 ただ、JH-RWL3 には lighttpd による Web サーバ機能があり、LAN 越しにもアクセスすることができる。そのため、ZABBIX で 30 秒ごとにデータを取得するようにしてみた。

Read more »

ファーストサーバのデータ消失事件を見ていて雑感など

 先週はファーストサーバ株式会社がサービスしているレンタルサーバでデータ消失事件が発生し、一部では何かと話題になっていた。サイボウズや EC CUBE をエンドユーザには ASP 的に売っていたこともあって、スケジュールが消えたりトランザクション情報が消えたりと何かと大変だったらしい。

 個人的にはバックアップを取っていない状態で RAID5 が崩壊したりしたこともあったし、何よりも業務として SaaS 的なものをいくつか扱っていることもあって、今回のインシデントは決して対岸の火事ではなく、他山の石としたい事例だった。後出しじゃんけんにはなるが、いくつか思ったことを書いておきたい。

 6/30 時点で「大規模障害の概要と原因について(中間報告)」が上がっているが、これを読む限りは今回のポイントはいくつかあって、ファーストサーバ側だと

  • そもそも「別のマシンでバックアップを取っている」と書いて売っているのに「同じマシンの別ドライブにバックアップ」だったのは違うのではないか? → ウェブサイト側に修正が入った
  • バックアップ「環境」と「データのバックアップ」は別物じゃないのか?
  • 複数世代管理されていないバックアップはバックアップとはいわない。
  • スタンバイ機を更新したときにデータ保全まで検証できなかったのか?
  • そもそもバックアップ系のスクリプト作成タスクは、バックアップを書き戻す手順まで作って初めてタスク完了じゃないのか?
  • SLA100% って相当コストがかかるよね? 無理じゃない?
  • 実は社員が地雷を仕込んでいたのではないか? バックアップ・リストアスクリプトのコードレビューはやった?

あたりだろうか。特にバックアップの複数世代は本当は重要で、今回はたまたま問題発生後すぐに分かったからいいものの、実運用では問題発生から数日~数週間後に判明することも多い。バックアップを 1 世代しか取っていない場合はこういうケースで詰んでしまう。レンタルサーバの場合、1 顧客に割り当てる見込みディスク容量が非常に多いこともあって複数世代バックアップは難しいが、SLA100% を謳うならやはり外せないポイントだろう。

Read more »

3ware 9650SEでHDDの不良セクタに対処する

 我が家のネットワーク環境には、3ware 9650SE-4LPML で RAID 運用しているサーバが 2 台ある。そのうち 1 台、この blog 用の MySQL も稼動しているマシンの 3DM2 から以下のようなメールが来た。

May 24, 2012 02:02.03PM - Controller 0
ERROR - Drive timeout detected: port=1

 タイムアウトしただけでデグレードはしていないので HDD の故障というわけではない。そこで、smartmontools で S.M.A.R.T. 情報を取得してみた。

 通常、ハードウェア RAID カードの場合、RAID カード上のプロセッサが各 HDD にデータを読み書きする仕様になっている。そのため、ホスト側の CPU からはドライバがなくても RAID アレイが 1 台のディスクドライブに見えるしブートも可能となる反面、実ドライブにアクセスすることはできない。だが、3ware や LSI の RAID カードの場合、smartctl にオプション -d 3ware,N を追加することで実ドライブの S.M.A.R.T. 情報を取得することができる。N はポート番号で、デバイスファイルは /dev/twaX を指定する。X はコントローラ番号となる。

Read more »

Postfix + dkim-milterからOpenDKIMに移行する

 かなり以前に Postfix を DKIM 対応にするネタを書いたが、その後、dkim-milter は OpenDKIM にリプレイスされた。遅ればせながら今回、OpenDKIM に乗り換えてみた。dkim-milter のままでも問題はないが、1 MTA で複数のドメインに対して複数の DKIM-Signature を付けられるようになったので、ぜひ乗り換えるべきだと思う。

Read more »

Apache HTTPサーバ – Upgrading to 2.4 from 2.2 超意訳版

 前回、Gentoo Box の Apache を 2.4.1 に上げたメモを書いたが、2.2 から 2.4 にするに当たって Upgrading to 2.4 from 2.2 – Apache HTTP Server を読むべきだと書いた。ただ、現状で公式に日本語翻訳されたものがないので、例によって超意訳をしてみた。間違いがある場合は指摘していただけるとうれしい。

Read more »