6月 302012
 

 先週はファーストサーバ株式会社がサービスしているレンタルサーバでデータ消失事件が発生し、一部では何かと話題になっていた。サイボウズや EC CUBE をエンドユーザには ASP 的に売っていたこともあって、スケジュールが消えたりトランザクション情報が消えたりと何かと大変だったらしい。

 個人的にはバックアップを取っていない状態で RAID5 が崩壊したりしたこともあったし、何よりも業務として SaaS 的なものをいくつか扱っていることもあって、今回のインシデントは決して対岸の火事ではなく、他山の石としたい事例だった。後出しじゃんけんにはなるが、いくつか思ったことを書いておきたい。

 6/30 時点で「大規模障害の概要と原因について(中間報告)」が上がっているが、これを読む限りは今回のポイントはいくつかあって、ファーストサーバ側だと

  • そもそも「別のマシンでバックアップを取っている」と書いて売っているのに「同じマシンの別ドライブにバックアップ」だったのは違うのではないか? → ウェブサイト側に修正が入った
  • バックアップ「環境」と「データのバックアップ」は別物じゃないのか?
  • 複数世代管理されていないバックアップはバックアップとはいわない。
  • スタンバイ機を更新したときにデータ保全まで検証できなかったのか?
  • そもそもバックアップ系のスクリプト作成タスクは、バックアップを書き戻す手順まで作って初めてタスク完了じゃないのか?
  • SLA100% って相当コストがかかるよね? 無理じゃない?
  • 実は社員が地雷を仕込んでいたのではないか? バックアップ・リストアスクリプトのコードレビューはやった?

あたりだろうか。特にバックアップの複数世代は本当は重要で、今回はたまたま問題発生後すぐに分かったからいいものの、実運用では問題発生から数日~数週間後に判明することも多い。バックアップを 1 世代しか取っていない場合はこういうケースで詰んでしまう。レンタルサーバの場合、1 顧客に割り当てる見込みディスク容量が非常に多いこともあって複数世代バックアップは難しいが、SLA100% を謳うならやはり外せないポイントだろう。

Continue reading »

6月 282012
 

 我が家に導入したシャープ製太陽光発電システムだが、電力モニタ JH-RWL3 のネットワーク周りにバグがあるっぽい。Linux Box から cron などで定期的に JH-RWL3 の Web サーバにアクセスして発電量または電力消費量などを監視する際、JH-RWL3 に割り当てる IP アドレスを固定する必要がある。だが、手動設定で IP アドレスを固定した場合、Linux Box と JH-RWL3 での HTTP 通信は問題ないが、「設定」メニューにある「通信テスト」を行うと「ルータ〜モニタリングセンタ間の通信」が NG となる。

JH-RWL3 の通信テストで NG が出る

JH-RWL3 の通信テストで NG が出る


Continue reading »

6月 242012
 

 我が家では月に1~2回、入間市にあるコストコ入間倉庫店に買い出しに行っている。コストコの隣は三井アウトレットなので、買い出しのついでに服などを買ったりしているのだが、たまたまそこで太陽光発電のイベントをやっていた。やっていたというよりはほぼ常設なのだが、

  • 常時稼働しているサーバ類が3~4台あり、それだけで電気代が500~600Wほど消費していること。
  • 以前より太陽光発電には興味があったこと。
  • 大災害時に若干とはいえ太陽光発電システム単体で自宅に電力供給が可能なこと。
  • 基本的に太陽電池で自家発電した電力を使い、不足分のみを東京電力から買電すること。余剰分は東京電力に売電できること。
  • 太陽光発電促進付加金を払うだけなのは癪なこと。

より、太陽光発電システムの設置に興味があったので話を聞いてみて、実際に施工してみた。

Continue reading »