このサイトはCookieを使用しています。 サイトを閲覧し続けることで、Cookieの使用に同意したものとみなされます。 プライバシーポリシーを読む>

CERNで活躍するファーウェイのクラウド・ストレージ

CERN(European Organization for Nuclear Research:欧州原子核研究機構)は、素粒子物理学という宇宙の中心であり、最近では「神の粒子」とも呼ばれるヒッグス粒子と一致する性質を持つ粒子を発見したことでたびたびニュースに取り上げられた。しかし、物理学ではよくあるように、ひとつの課題を乗り越えたのち、また別の課題に直面している。科学者たちは現在この発見を、物理学でいう自然界の基本的な力の一部の解明に役立てようとしている。

スイスに本部があるCERNは世界最大の素粒子物理学研究機関で、世界の素粒子物理学界の科学者の半分以上がメンバーとして名を連ねている。1954年の設立以来、CERNは何度も科学の歴史的な進展の舞台となってきた。世界初の陽子・陽子衝突(1971年)、中性カレントの発見(1973年)、W粒子とZ粒子の発見(1983年)などが、そのごく一部だ。2012年7月4日、CERNはATLAS(A Toroidal LargeHadron Collider Apparatus:ドーナツ型のLHC(大型ハドロン衝突型加速器)装置)とCMS(Compact Muon Solenoid:小型ミューオン・ソレノイド)で実施した2つの汎用実験において、質量約125~126GeV(gigaelectronvolt:ギガ電子ボルト)の新たな亜原子粒子の存在を証明したと発表した。この粒子は、すべての物質に質量を与えている粒子として長らく捜し求められてきたヒッグス粒子が持つとされる性質を備えている。傑出した物理学者でありハード・サイエンス分野では随一の著名人にして『ホーキング、宇宙を語る』の著者として知られるスティーヴン・ホーキング(StephenHawking)氏は、ヒッグス粒子の存在を疑っていたため、この発見によって賭けに負け、100ドルを失うこととなった。

CERNのストレージにおけるボトルネック

しかしながら、この大発見はCERNが実現を目指す多くの目標のひとつにすぎない。高エネルギー素粒子物理学における研究ニーズに応えるため、CERNは宇宙の神秘の解明を使命としたきわめて大規模なグリッド・コンピューティング・システムを構築した。WLCG(Worldwide LHC ComputingGrid:世界規模のLHCコンピューティング・グリッド)Tier-0と呼ばれるCERNのデータセンターは、世界各地に広がる同機構のコンピューティング・リソースの中核を成しており、現在、年間20ペタバイトを超えるLHCデータの格納と解析が可能となっている。

CERNは全世界のICTの先進企業と協力し、世界中の素粒子物理学界で利用できる最先端のITソリューションの開発を促進することを目的としたCERNオープンラボを設立した。近年CERNのデータ量は驚異的な勢いで増加を続け、ストレージ・システムの拡張性と信頼性に深刻な課題が生じている。そのためオープンラボは2011年、次に示すような評価基準を設け、新たなストレージ技術の評価を開始した。

まず、1,600万回を超える粒子衝突からの貴重な未加工データをはじめ、長年にわたる実験で蓄積された研究データを格納するための信頼性の高いストレージ・システムが必要である。次に、このシステムは将来発生するデータに対応できる高い拡張性を備えていなければならない。CERNの研究データは2007年には合計7ペタバイトであったが、2009年には15ペタバイトに達し、その後3年間で25ペタバイトに及ぶことが見込まれた。このストレージ・システムでは膨大なデータを解析する際にも高速検索を行えるよう、非常に優れたスループットと読み書き性能が必要になる。さらに、データが格納されるデータベースは国や組織によってさまざまであるため、システムはシームレスかつ安全性の高いものであることが求められる。

ファーウェイのUDSクラウド・ストレージ

CERNオープンラボが第4フェーズに入った2012年1月、自動化と制御、データベース、ネットワーク接続、プラットフォームなどに関わるプロジェクトでより徹底した共同作業がスタートした。いずれのプロジェクトにも、ストレージ・システムが必要不可欠である。

ファーウェイはストレージに精通し、革新的な次世代クラウド・ソリューションの開発に取り組んでいる。当社はCERNオープンラボに貢献するパートナーとして、クラウドベースのUDS(Universal Distributed Storage:汎用分散ストレージ)システムを開発し、エクサバイト規模(1エクサバイト=1,048,576テラバイト)のデータ・ストレージの課題に対応している。

こうした拡張性の高さに加え、ファーウェイのUDSクラウド・ストレージは高い信頼性と幅広い互換性を備えている。また高密度なノジュール分散を採用し、エネルギー効率のよいARM(Advanced RISC Machine:アドバンストRISCマシン)アーキテクチャに基づいた設計となっている。UDSでは、オブジェクト・ベース・ストレージ、P2P分散ストレージ・エンジン、クラスタリング・アプリケーションが統合された、大規模なオブジェクト・ベース・ストレージのインフラストラクチャ上でビッグ・データの格納や共有ができる。また、ノードごとに作業負荷をインテリジェントに調整することで、これまでのような性能上のボトルネックを改善し、容量拡大に合わせてシステム性能も等しく増加できるようになっている。

ファーウェイのUDSクラウド・ストレージ・システムは99.999999999%(9が11個)の信頼性を備えており、データセンター間の冗長化も強化している。また、データのセキュリティーも全段階で確保され、インターフェース、保存、転送の各プロセスにおける多重コピー、消去コード、マルチレイヤー暗号化検証などを通じ、ノード、ストレージ、データセンターの各レベルでデータを保護する。

このソリューションは、コスト効率の点でも優れている。デスクトップ・ハード・ドライブ、インテリジェントかつオートマティックな障害回復、高エネルギー効率のARMチップ、効果的な冷却技術など、各種の自動保守技術によって保守コストを削減すると同時に、ストレージの可用性・信頼性の効率的な向上も実現している。また、S3インターフェース、NFS/CIFSプロトコル、主要なバックアップ・ソフトウェアとの互換性があるため、使い勝手のよいエンド・ツー・エンドのパブリック・クラウド・ソリューションであるとともに、さまざまな用途におけるストレージへのアクセス要件を満たすことができる。

UDSで限界に挑む

ファーウェイは2012年の始めに、CERNにUDSクラウド・ストレージ・システムを納入し、3か月間で設置とベンチマーク性能評価を完了した。読み書き性能は大規模データ環境できわめて有効であり、拡張性も良好であることが証明された。全体的に見ると、まさにワールド・ワイド・ウェブを生み出した組織に値するスコアであるという評価を受けたのである。

CERNオープンラボのボブ・ジョーンズ(Bob Jones)所長は、「CERNはリソース集約型のシミュレーションと解析における技術の限界に挑んでいます。ファーウェイとの協業から新しい刺激的なアプローチが生み出されました。最新のアーキテクチャによって機能を拡張することで、将来見込まれるエクサバイト規模のデータ量の増加に備えられるようになったのです」と述べている。

ファーウェイのクラウド・ストレージ主任アーキテクトであるジェームス・ヒューズ(James Hughes)は、これについて次のように付け加えている。「CERNオープンラボとの関係を築くことで、ファーウェイのクラウド・ストレージ製品をさらに向上させるすばらしい機会を得るとともに、当社の製品が非常に高度な科学研究における大量データ環境に耐えうることが証明できました」

CERNは、量子領域という未知の境地を開拓し続けている。現在は前述の新たな粒子について理解を深め、そのほかの宇宙の謎の究明へとつなげるため、さらに掘り下げた研究を進めている。ファーウェイのUDSクラウド・ストレージ・システムも、CERNとの協力を通じてますます発展を続けていくはずだ。