卓越したオペレーション能力で「想定外」を「想定内」に
2011年11月に開設された石狩データセンターは、数多くのサーバーを収容するさくらインターネットの基幹データセンターになる。開設当時はソーシャルゲームの普及でサーバーの需要がうなぎ登りだったほか、環境に配慮したエコなデータセンターが求められていた。こうしたニーズに対応する石狩データセンターは、寒冷地のメリットを活かした外気冷却と東京ドーム1個分に相当する広大な敷地を用いたスケーラビリティが大きな売りだった。私も開設時と増設時で2回ほど現地に足を運んでおり、現地のエンジニアとも話をしている。同じデータセンターに2度訪れることなんてほぼないので、個人的にも思い入れが深い。
思い起こせば、なぜ石狩だったのか? 皮肉なことにその大きな一因は災害リスクが低いことであった。同社の石狩データセンターの紹介にも「石狩地域は、今後30年間で震度6以上の地震が発生する確率が0.1〜3%と低く、(以下略)」と明記されており、さくらインターネットにとっても今回の地震は「想定外」だったはずだ。しかし、今回さくらは約3000ラックを超える巨大データセンターを非常用電源設備で60時間無停止で運用し続けた。卓越したオペレーション能力で未曾有の停電を乗り切り、「想定外」を「想定内」にしてしまったのだ。
東日本大震災のときは首都圏のデータセンターが停電の影響をあまり受けてないので、ここまで長時間での非常用電源設備の運用はおそらく初めて。世界的に見てもあまり例を見ないはずだ。しかも、途中で電力が一部復活し、燃料調達にめどが付いたこともあり、非常用電源設備停止の直前は、1週間近い連続稼働まで視野に入れていた。薄氷を踏むどころか、最後は余力すらあったわけだ。
さくらにとって絶対落とせなかった石狩データセンター
まずは話の前提としてデータセンターの停電対策について簡単に説明しておきたい。実は9月6日に北海道の震災が発生してから、石狩データセンターに関しては経緯から復旧まで3本の記事を挙げているのだが、どれもシンプルな速報体裁。細かい説明を割愛していたため、書き手としてもどれだけ読者に伝わっているか正直不安だった。しかも、ITに対する知識の不足により、いたずらに不安をあおるような報道も多い。これを読めば、今回さくらがどれだけすごかったのか、信頼性というデータセンターの役割をきちんと果したのか、少しは理解してもらえるはずだ。
個人・企業問わず数多くのサーバーが集まるデータセンターでは、停電時の対策として非常用電源設備が用意されている。そのため、電力会社からの電力供給が停止すると、バックアップ用のUPSで非常電源設備の起動までの時間を確保し、ガスや重油などの燃料を用いて自家発電するようになっている。発電の際に用いられる燃料も多くのデータセンターでは48時間程度の燃料が備蓄されているので、停電が起こってもおおむね2日間は運用は止まらない。とはいえ、一連の設備はどれも高価で、日本でも自前できちんと運用できる事業者はそれほど多くない。さくらインターネットはこうした数少ない事業者のうちの1つだ。
石狩データセンターでも48時間稼働する分の重油を備蓄していた。しかし、今回の大規模な停電からの復旧は当初「1週間後」と発表されており、実際に東日本大震災のときは停電解消が約80%に至るまで3日間、94%に至るまで8日間かかっている。そのため、電力供給が再開せず、重油が足りなくなったら、石狩データセンター自体の稼働を停止しなければならなかった。
もし石狩データセンターが停止に追い込まれたら、そのインパクトは計り知れない。40万以上にも上るさくらのレンタルサーバのユーザーや、メルカリやマネーフォワードといったWebサービス事業者、官公庁や学術機関などのサービスも大きな影響を受けることになる。また、石狩データセンターならではの事情として、ユーザー自身が運用するコロケーションもそれなりにある。さくらインターネットにとっては絶対落とせないデータセンターなのだ。
これだけのガチンコ本番をベアメタル少し止めた程度で乗り切ったのは普通に凄い
うむ
ガッツだぜ!
上は「それができて当たり前」になるからなあ
当たり前の話だよ。逆にきっちり保守管理してないところは肝心な時に非常用電源
が役に立たたず損失こうむってるところがたくさんあるよ。
この業界ではきっちり保守管理できるだけのリソースが適切に注ぎ込まれていることが奇跡なんですよ…
確かに。保守を本気でやると金にならないからなぁ。
まー正直メールさえ使えればビジネスには影響なかったんだが
安い割にはいいと思う
電力会社見とるか?お?
火山もあるしな
何重苦やねん
それが日本
悪目立ちしないのが仕事で、それをこなす人達は本当にクールだと思う。
一番の理由は安い(わりに品質もいい)からかな
仕事でもプライベートでもまだ使ってる
万一の場合に備え、自家発電設備等を備えていた方がいいね。
「その予算でうまくいったのか、じゃあもっと下げてもいいな」みたいないつもの払い渋りに繋がらないか心配
ファーストサーバみたいなのは論外だけど、災害時は多少被害出た方が日本のIT業界には良さそう