オープンソースのクラウドストレージ企業がAmazonとGoogleに挑む オープンソースのクラウドストレージ企業がAmazonとGoogleに挑む

オープンソースのクラウドストレージ企業がAmazonとGoogleに挑む

オープンソースのクラウドストレージ企業がAmazonとGoogleに挑む

Backblazeの最初のサーバーは2007年に合板の箱の中に作られました。現在、個人向けクラウドバックアップの提供に特化した同社は、合計200ペタバイト(2億ギガバイト)のデータを保管しています。

しかし、このクラウドストレージ企業は、Amazon、Microsoft、Googleといった業界の大手競合とは一線を画しています。Backblazeは「Storage Pods」と呼ばれる独自のサーバー設計を採用しており、自社で構築することで、サーバー購入コストの10分の1のコストでサービスを提供しています。設計は公開されており、構築手順もBackblazeのウェブサイトで無料で入手できます。

過去2年間で、Microsoft、Facebook、そして最近ではGoogleが、同様の設計をオープンソース化することに特化したOpen Compute Projectに参加しました。しかし、Backblazeは2009年からこのプロジェクトに取り組んでおり、独自のビルドに依存する企業や技術者のコミュニティを形成してきました。彼らのサーバー設計は、小規模なメーカーからNetflixまで、あらゆる企業に利用されています。

本日、Backblazeは最大の競合他社に本格的に参入します。これまで同社は個人用コンピュータのバックアップに特化し、ファイルサイズに上限を設けた大企業向けクラウドストレージを提供してきました。本日発表されたのは、Backblazeが今後、最大10テラバイトのファイルサイズをサポートすること、そしてエンタープライズ顧客向けに多数のAPIとプラグインを提供することです。これまで対応していた最大ファイルサイズは5GBでした。同社はこれを「ビッグファイルベータ」と呼んでいます。

従来、S3サービスを提供するAmazonやAzureを提供するMicrosoftといった大企業は、大規模なエンタープライズストレージ市場を独占してきました。企業は膨大なサーバーファイルをバックアップするためにテラバイト単位の容量を必要とします。しかし、Backblazeは、特定の分野でより安価で堅牢なサービスを提供することで、これらの大企業からビジネスを獲得できると確信しています。Google、Amazon、Verizon、Rackspaceなどのサービスでは、ファイル1GBあたり0.20ドルから0.75ドルのコストがかかりますが、Backblazeでは0.005ドルです。

現在、10テラバイトはAmazonとGoogleが提供している最大ファイルサイズの2倍、Microsoftの10倍の容量です。つまり、企業がデータベース全体を1つのファイルとしてバックアップしたい場合、それが可能になります。あるいは、巨大なファイルをBackblazeのサーバーに保管することで、負荷を軽減することも可能です。

Backblaze の CEO である Gleb Budman 氏は、同社が大容量のファイルを処理するために特別にサーバーを構築した経緯を説明します。

「10TBのファイルを1台のハードドライブに収めるのは不可能です」とバッドマン氏は語る。「しかし、私たちはクラウドファイルシステム全体を所有しているので、バックエンドではファイルを細かく分割し、別のラックの別のストレージポッドの別のドライブに保存しています。」

1つのファイルを複数のハードドライブに分割して分散させるこの方法は、消失訂正符号と呼ばれています。この方法はBackblazeに固有のものではありませんが、サイズはBackblazeに固有のものです。

この手法はBackblaze特有のものではありません。しかし、その規模は特異です。

バッドマン氏によると、他社が購入するサーバーはアーキテクチャが異なり、顧客がサーバーを1台購入するか10台購入するかに関わらず、個別に動作する必要があるためです。Backblazeは、自社で構築するサーバーがシステムに追加されるだけであることを把握しているため、分散コンピューティング向けに最適化できます。

Backblazeは、10キロバイトでも10テラバイトでも、ファイルを受け取るとそれを20の断片に分割します。そのうち17の断片は、ファイルを復元するために必要です。残りの3つの断片には冗長データが含まれており、元の17ファイルの一部が失われた場合に使用できます。Budman氏によると、このシステムにより、ドライブ、ポッド、あるいはサーバーラック全体が失われた場合でも、すべてのデータを復元できるとのことです。

しかし、エンタープライズビジネスの激しさにもかかわらず、Backblaze は引き続きそのデザインをすべて公開する予定です。

バッドマン氏は、オープンソースコミュニティの規模が小さいことがBackblazeの成功の大きな要因だと考えている。コミュニティにデザインを提供することで好意が生まれるだけでなく、彼らからアドバイスも得られるのだ。

「ストレージポッドの設計の新バージョンを公開するたびに、『これ試してみた?』『このコンポーネントは見てみましたか?』といったたくさんのコメントをいただきます」とバッドマン氏は語る。「ストレージポッドをオープンソース化することはリスクと賭けでしたが、実際には素晴らしい成果を上げました。」

最近、コミュニティからBackblazeが使用している部品の一つである電源ボタンが本来の価格よりも高価だと指摘がありました。これを受けて、Backblazeは新しいスイッチを探し始め、最終的に1万ドル以上を節約しました。この様子はRedditのスレッドに記録されています。

別の部品についても、Backblazeはバックプレーンと呼ばれる部品の製造を1社に独占的に依存していました。バックプレーンはコンピューターのマザーボードのようなもので、PCのコンポーネントを接続するハブです。しかし、Backblazeがバックプレーンの設計をオープンソース化したことで、別の企業が製造を開始し、Backblazeにとってこの部品の新たな供給元が誕生しました。

競合他社もOpen Compute Projectを通じてオープンソースの波に乗っているが、バッドマン氏によると、それぞれのアプローチは依然として異なるという。例えば、Backblazeサーバーは依然として製造コストが安いため、同社はコストを抑えることができるが、Storage Podの使用中はドライブを交換することができない。

アラスカ州フェアバンクスでは、アラスカ地理情報ネットワーク(GINA)が3つのストレージポッドを構築しました。地図製作者、科学者、教授、学生が何年分もの衛星画像や大規模なデータセットをいつでも利用できるようにする必要があるのですが、小規模な組織であるため資金が限られていると、GINAの技術サービスマネージャーであるデイン・ブローダーソン氏は言います。

「数ペタバイトの回転式ストレージが必要な場合、[ストレージポッド]がおそらく最もコスト効率の高い方法でしょう」とブローダーソン氏は語った。

しかし、Storage Podソリューションは必ずしもすべての人に最適ではないかもしれないと彼は言います。すぐに使えるソリューションではないため、サーバーのセットアップとメンテナンスには手間がかかる可能性があります。幸いなことに、GINAは最初の構築では学生の労働力に頼ることができました。ただし、時間はかかりました。ブローダーマン氏によると、学生1人と教員1人でサーバーを構築した(毎日ではありませんでしたが)のに4~5ヶ月かかり、部品を誤って焼損することもありました。彼はこれを学習経験として捉えています。

「何かを揚げてそこから学ぶのは素晴らしいことだが、次の作業に移る前に8ドルの小さな部品を注文するのに1週間もかかる」とブローダーマン氏は語った。