京都大学大学院医学研究科附属ゲノム医学センター長﨑教授と川口助教は、ヒトの疾患関連因子の探索を主な目的として、ゲノムや代謝物、健康情報を中心に数千人〜数万人規模の大規模データ解析を行っています。
一人あたり30億塩基対(3GB)で構成されるゲノムは、解析時にはその数十倍の大きさのデータを処理する必要があり、ストレージには特に高いパフォーマンスが求められます。これまではオンプレミスのニアラインストレージとして各計算サーバにRAIDストレージを直結して利用していましたが、この方法ではI/Oがネックになるとともに、データが分散してしまい、研究者はデータの利活用に苦労を強いられていました。データ解析におけるストレージ基盤の整備が急務となっています。
高いI/O速度、保守期間後の部品供給体制、データ輸送を想定しての持ち運びの容易さ、コストパフォーマンスを考慮し、QNAPの TS-2483XU-RP を3台導入しました。TS-2483XU-RPは高性能な24ベイNASで、Intel® Xeon® Eプロセッサ、最大128 GBのDDR4 ECC メモリ、10GbE SFP+ 2ポートをサポートしています。さらに、I/Oが高速な分散ストレージを別途導入し、QNAP NASで構成されるニアラインストレージと組み合わせて、より高速なI/Oが求められる解析データと、長期保存が不可欠なもののアクセス頻度の低い基盤データの配置場所のすみ分けを行いました。
新たに導入するニアラインストレージをQNAPのNASに統一することで管理インタフェースが一元化でき、またGUIベースで設定できることから、システム管理者の学習コストが下がりました。
また、導入が容易なQNAPのNASは、外部機関とのデータ交換媒体として不可欠な存在となっています。
一元的なデータアクセスによるユーザ利便性の向上と、I/O要求に応じた高いコストパフォーマンスのストレージシステムが実現できました。
現在、オンプレミスサーバ、パブリッククラウド、学際大規模情報基盤(スーパーコンピュータ)の3つの基盤を、学術情報ネットワーク「SINET*」上で組み合わせたハイブリッドクラウドによって、時々の要件や状況に応じた最適なシステムが導入できる環境の構築を進めています。
その中でQNAP NASは当初の想定のニアラインストレージに加え、クラスタ型のコンピューティングリソースからの直接入出力環境としても利用することができています。将来は、パブリッククラウドとのシームレスな連携機能の活用などを通じて、各基盤のデータを一元化し、利用者が基盤や用途の違いを意識することなく目的とするデータを利活用できる環境の構築を目指しています。
*SINETは、日本の大学・研究機関のための学術IT基盤ネットワークです。