cybozu.comの生みの親が自作クラウド派になった理由

http://ascii.jp/elem/000/000/827/827199/

 障害対応に関しては、自動障害回復システムである「月読」を導入している。cybozu.comにおける障害の最大の要因は仮想マシンとなるホストの故障だ。「原因の一番はHDDだが、2番目はマザーボード、3番目はメモリ」(山本氏)。そのため、ホストが障害を起こした場合は、障害を検出し、稼働している仮想マシンを予備のホストに移動させ、仮想マシン上で動作すべきプログラムを起動させるといった手順を踏む必要がある。従来は、これを人手で行なっていたため、30分以上の時間がかかり、稼働率を下げる要因となっていた。この障害復旧をまさに自動で行なうのが、月読になる。

 月読は各ホストのエージェントとして動作しており、プログラムが自律的に監視と情報交換を行なう。他社のクラウド障害を元に、ネットワークの分断や連鎖的なサーバーのダウン、誤検出などにも配慮された優れたシステムだが、「非同期な処理をがんばってPythonでやってしまったので、ソースが複雑で読みにくい。Goで書けば、もっとシンプルで性能もよかったという忸怩たる思いがある」(山本氏)とのことで、公開は予定していないという。

残念。
ってか、記事タイトルの理由が明記されてない...