このサイトはCookieを使用しています。 サイトを閲覧し続けることで、Cookieの使用に同意したものとみなされます。 プライバシーポリシーを読む>

カリフォルニア大学高性能アストロコンピューティング・センター

ファーウェイのUDS(Universal Distributed Storage:ユニバーサル分散ストレージ)ソリューションは「ユニバース」の名に相応しく、暗黒物質や暗黒エネルギーなど天体物理学上の未解決の諸問題を解明する上で一役買うことになりそうだ。UC-HiPACC(The University of California High-Performance AstroComputingCenter:カリフォルニア大学高性能アストロコンピューティング・センター)が行う最先端の研究とそれを支えるITの役割について、同センター長のジョエル・R・プリマック博士に話を聞いた。UC-HiPACCでは、天文学者、天体物理学者、コンピューター科学者が宇宙の仕組みに関する数学モデルの開発や検証を行っている。こうした研究では、銀河系全体や銀河団の相互作用を何十億年もの単位でシミュレートすることがある。これほどの複雑さと大規模なモデリングで使用される数字はまさに天文学的であるため、近年、センターの計算リソースとストレージ・リソースに大きな負荷がかかってきている。「冷たい暗黒物質」理論を発案し、発展させてきた主要な研究者の一人である同センター長のジョエル・プリマック博士は、天体物理学の分野における未解決の問題を解くためには桁違いのストレージ・ソリューションが必要だと語る。

WinWin:天体物理学において近年最大の発見は何であるとお考えですか。

プリマック氏:2011年の終わりに、私を含め天体物理学者をおおいに興奮させた発見がありました。カリフォルニア大学サンタクルーズ校にいる私の同僚たちが、知りうる限りでは原初とされるガス雲を発見したのです。原始ガス雲はビッグ・バンにより生じた水素とヘリウムのみで構成されており、それ以外の重元素はまったく含んでいません。そのようなガス雲を、クエーサー(きわめて離れた距離で明るく輝いているために恒星のように見える天体)のスペクトルを測定することで観測したのです。そこに含まれるジュテリウム(重水素)の量を測定した結果、先に実施していたサンプルでの測定値と一致しました。サンプルには重元素が若干混じっていたため、その段階ではそれが真の原始ガス雲における値と等しいという確信が持てなかったのですが、いま、この原始的なガス雲から同じ答えが得られようとしています。この方法によって宇宙にある通常物質の総量を測定することができ、他の多くの方法で測定された結果を裏付けています。したがって、これは、私たちがビッグ・バンの仕組みや過程を本当に理解しているのかどうかの重要なテストだったわけです。

2つめは、宇宙の質量のほとんどを構成している謎めいた物質である暗黒物質の特性を発見できるかもしれないということです。現在ある特定のデータが得られつつあり、それが何を意味しているかはまだ不明ですが、非常に興味深いものであることは明らかです。NASA(National Aeronauticsand Space Administration:アメリカ航空宇宙局)のフェルミ・ガンマ線宇宙望遠鏡を使用して、天の川銀河の中心からガンマ線(非常に強力な放射線)が放出されていることが確認されました。このガンマ線は1,300億電子ボルトものエネルギーを持っています。これは、すべての陽子の質量を純粋なエネルギーに変換した場合に得られるエネルギーの130倍にも相当します。さらに、それは銀河の中心からしか出ていません。これより信憑性はやや低いのですが、隣接する銀河団から同じ放射線を観測したという報告もあります。これは減衰しているか消滅しかけている暗黒物質が存在した場合にのみ考えられる現象です。つまり、通常の原子物質とはまったく異なる性質を持つ、目に見えない暗黒物質の特性を知るための重要な手がかりである可能性があります。この放射線を観測したことに疑問の余地はありません。これは確実に「発見」と呼べるレベルのものです。これが本当に暗黒物質かどうかは、これから解明しなければいけません。すぐには進展しないかもしれませんが、可能性はおおいにあります。

WinWin:研究を実施する際、ITインフラストラクチャの面で直面している課題は何ですか。

プリマック氏:2つの大きな課題があります。コンピューティングと、データの保存および転送です。コンピューティングの課題は、スーパーコンピューターがますます複雑化していることです。以前の高性能コンピューティングは、単純にシングル・プロセッサーをつないだもので、複数のプロセッサーでひとつのシングル・プロセッサー・コードを実行するという作業を分散するだけのものでした。しかし新しいコンピューターには、同じメモリーをアドレス指定する複数のコアで構成されたマルチコア・チップが搭載されています。その上、多くの場合、同様にメモリーをアドレス指定するGPU(Graphic Processor Unit:グラフィック・プロセッサー・ユニット)などのアクセラレーターも搭載されています。これらの要素を効果的にプログラムする方法は非常に複雑です。高速のメリットを享受するためにはGPUのパイプラインが常にフル稼働するように調整する必要があります。また、GPUは基本的にベクトル・マシンであって「乗加算」が得意なため、そのようなジョブだけを処理させて、それ以外の不得意なジョブはコアに処理させるようにする必要があります。そのため、マシンの複雑なアーキテクチャを活用できるようにプログラムのアーキテクチャをうまく設計し、作業を多くのノードに分散させる必要があります。したがって、プログラミングが以前よりも大幅に複雑になります。

また、大量のデータの分析やスーパーコンピューターによる計算から膨大なデータが生成されるため、その場で即座にデータを解析することが非常に難しくなっています。データを一度保存しておき、解釈しながら分析方法を考えたいわけですが、大量のデータが急速に生成されるので、大規模なスーパーコンピューター・センターでは簡単に保存できないのです。

たとえば去年、あるスーパーコンピューター・センターでシミュレーションを実行して、7,200の時間ステップを保存したところ、データ量が340TB(テラバイト)にも及びました。そのデータをセンターの高速ディスク・アレイに落としたのですが、そこでは数週間しか保存させてもらえませんでした。テープの数が多すぎるためその時点ではアーカイブしないと言われ、そんなに大量のテープを読むつもりもないだろうと思ったらしく、分析を行う十分な時間も与えられませんでした。結局そのデータは手放すしかありませんでした。出力はもっと長期間保存したいし、少なくとももう少し詳細な分析を行う機会ぐらいはほしいものです。つまり、ストレージ容量を増やすことがきわめて重要なのです。

WinWin:クラウド・コンピューティングは教授の研究分野にどのような影響を与えますか。

プリマック氏: クラウドによって、より柔軟に大量のデータセットを処理できるようになるでしょう。ひとつの例を紹介しましょう。私は先日、カリフォルニア大学全体を対象とするUC-HiPACCの所長として、高解像度銀河シミュレーションを実施している世界中のリーダーに呼びかけ、主要なグループすべてを集めました。

同大学サンタクルーズ校で数週間前に開催されたこの会議では、シミュレーションを同じ初期条件で実施することに対してグループ全体の同意を得ることができました。初期条件をすべてのコードで使用可能な形式で作成することに成功したのはつい最近なのですが、これは大きな飛躍であり、誰もが感銘を受けました。これはまったく新しいテクノロジーなのです。他にも、冷却の実装方法やエネルギー背景放射の実装方法など、コードの各種側面に対して全員の同意を得ることができたのは、世界の第一人者たちをこの会議に招いたおかげです。これだけの条件に同意しても、依然として異なるコードでは多くの処理方法が違うことにはなりますが、少なくとも出力に見られる違いの原因を絞り込むことはできるということに全員が納得しました。さらに、すべての異なるコード出力で利用可能なもうひとつの新しいツールとして、あらゆるシミュレーションを同じ方法で分析するための統一された分析ツールも開発されました。

ここで重要なのは、入出力を全員で共有できるワークスペースと、すべての出力を同時に分析できる処理能力を確保することです。シミュレーションはさまざまな時間セットで比較したいと考えています。そこで、ファーウェイのUDSシステムをサンタクルーズ校で利用可能にすることを発表し、このプロジェクト専用に最大100TBを確保しました。全員がデータ・システムにアクセスできるようにするという完全なクラウド・プロジェクトです。われわれのだれもがお互いのデータや分析を見ることができるようになります。これにより、この分野全体が発展することになるはずです。いずれにせよ、これは世界規模のコラボレーションになり、2013年には多くのことが解明されるでしょう。

WinWin:UC-HiPACCでは、大容量・高スループットの実験を処理するために、ストレージ・システムの性能を高めるどのような対策をとっていますか。

プリマック氏:UC-HiPACCでは、5,000個以上のコア、多数のGPU、十分な量のFlashを搭載した新しい天体物理学コンピューターを購入し、ファーウェイ製UDSシステムと結合したいと考えています。これにより、当センターのコンピューティング能力とデータ・ストレージ容量は飛躍的に増加し、データ分析に理想的な組み合わせが実現します。これをカリフォルニア大学全体のユーザーが利用できるようにするとともに、特定の目的のものに関しては世界中の天体物理学コミュニティーに開放する予定です。

WinWin:UDS以外で、興味を持たれたファーウェイのテクノロジーはありますか。

プリマック氏: そうですね、いくつかのサブコンポーネントからなるバリエーションに富んだコンピューター・システムを購入したいと考えています。たとえば、特定の種類の計算や動画編集には、コアあたりのRAM(Random Access Memory)容量が大きい部分が必要です。また、同じRAMをアドレス指定するGPUと複数のコアで構成された部分も必要です。さらに、従来通り並列プロジェクトを実行する人もたくさんいますので、基本的に個別のプロセッサーを束ねただけのユニットも求められます。つまり、さまざまなユーザーのニーズに応えるバリエーションに富んだシステムにする必要があるのです。

システムを購入するためNSF(NationalScience Foundation:全米科学財団)より資金を調達できたので、早々に行動に移したいと考えています。まずは、複数のベンダーにどのようにシステムを組み立てるべきかについて意見を聞きたいと思っています。システムの機能は指定しますが、その詳細までは指定しません。次に、ベンダーから入手可能なものがわかった段階で、第2ラウンドとして詳細な仕様を提示し、ベンダーを細かく比較して、最適なソリューションを提供してくれるベンダーを決定するつもりです。数年前の経験では、この2段階のそれぞれに2か月の期間を要しました。希望としては、2013年上旬にはファーウェイUDSシステムとうまく統合されたシステムを稼働させたいと思っています。

WinWin:もう少し先を見据えて、今後数年以内に天体物理学において解明が期待されることは何でしょうか。

プリマック氏:宇宙が何でできているかはまだわかっていません。暗黒物質や暗黒エネルギーのような目に見えない物体が宇宙をどのように制御しているのかはある程度予測がついていますが、現状は混沌としています。宇宙のシミュレート方法はいくつかわかっているものの、この物体が一体何なのかはまったく不明です。何しろ、宇宙のほとんどがこの物体なのです。したがって、期待されているのは暗黒物質の性質を解明することです。

ヒントは見つかっていますし、うまくいけば、ジュネーブにあるLHC(Large HadronCollider:大型ハドロン衝突型加速器)で暗黒物質の生成が開始されるでしょう。また、たとえば銀河の中心や他のどこかで観測されるガンマ線の量から暗黒物質の質量を推定することができるかもしれません。あるいは、地下深くの実験室で暗黒物質粒子が発見される可能性もあります。暗黒物質粒子は宇宙線などの影響をきわめて受けやすいとされるため、その影響を避けるため地下深くで観測を行うのです。これらの異なる実験領域のそれぞれで、たとえば質量などの特性が同じ値で検出されれば、暗黒物質の正体を突き止めたということになります。これらの実験はどれも非常に複雑なため、長い年月がかかるでしょう。しかし、宇宙の組成を理解するための重要な探求のひとつです。

暗黒エネルギーの解明はさらに大変です。宇宙を加速的に膨張させている暗黒エネルギーの性質を知るためには、宇宙の膨張の歴史と構造体の成長の仕組み、つまりどのように銀河が生成され、合体したかなどを、きわめて正確に特定することが鍵となります。これには、かつてない精度での観測が必要になります。つまり、100分の1~1,000分の1の精度です。これまでの天文学では2分の1から2倍以内の誤差範囲で測定結果が得られれば良しとされてきましたが、現代の天文学ではそうはいきません。今は精密科学の時代であり、宇宙の性質を解明するためにはこれだけの精度が必要なのです。

暗黒エネルギーは、われわれの未来を握っています。宇宙はこの先、加速的に膨張して、われわれの遠い子孫の時代にはそのほとんどが見えなくなってしまうのか。あるいは、速度が低下して別の種類の宇宙になるようなことが起きうるのか。暗黒エネルギーの特性がわかれば、未来がわかります。これは今後10年程度で実現できそうなことですが、膨大な量のコンピューティングとストレージが必要になるでしょう。

WinWin:最後に、UC-HiPACCとファーウェイの提携に対する期待をお聞かせください。

プリマック氏:UDSシステムが利用できるようになることを待ち望んでいます。すぐにでも必要なので、入手次第、早急に稼働させたいと思っています。利用していくうちに、その価値がわかってくるでしょう。われわれの研究のためだけでなく、サンタクルーズ校やカリフォルニア大学全体の多くの科学者の研究にも広く開放するつもりです。このようなすばらしいシステムを提供していただいたことに感謝しています。