学術情報メディアセンターが提供するデータを活用した研究を支援するサービス
学術情報メディアセンターでは、全国共同利用サービスとしてスーパーコンピュータを利用した大規模計算サービスを提供しており、本学を含む全国の研究者の皆様に、大規模なシミュレーションや可視化のアプリケーション等、大規模計算を必要とする幅広い用途でご利用いただいています。一方、データを活用した研究においては、実験機器・センサーやWebページ等からのデータの収集と集積・管理、収集したデータの解析、データセットとしての公開等、スーパーコンピュータによる大規模計算サービスではカバーできない多様な処理が必要とされます。また、データの性質によっては隔離された環境での分析が必要になる等、従来のスーパーコンピュータが利用できないケースも想定されます。本稿では、本センターで提供するデータを活用した研究を支援するサービスをご紹介します。
データ活用社会創成プラットフォーム mdx
mdxは仮想化技術を用いて研究プロジェクト毎に分離したプライベートな計算機環境を提供するIaaS型の学術向けクラウドサービスです。mdx上で研究プロジェクト毎に異なる仮想ネットワークを構成し、サーバ仮想化技術を用いた高性能な仮想マシン(GPUを含む)を接続して隔離された高性能な計算環境を構築したり、大規模で高速なストレージを利用したりすることができます(図 1)。これらの計算資源は利用者向けのWebポータルからセルフサービスで設定することが可能です。また、国立情報学研究所が運用する学術ネットワークSINETのL2VPNサービスと連携することで、研究室のVLANや遠隔の観測機器等を同一の仮想ネットワークに接続することが可能な場合があります(本センター又は各システムの担当にご相談ください)。
mdxは本センターが参画するデータ活用社会創成プラットフォーム協働事業体が運用しており、mdx Iは東京大学情報基盤センターに、mdx IIは大阪大学D3センターに設置されています。現在非常に需要が高いGPUについては、mdx IはNVIDIA Tesla A100、mdx IIはNVIDIA H200 SXMを備えています。また、ストレージについても数百TB以上の利用が可能です。詳細はhttps://mdx.jp/をご参照ください。
図 1 mdxの概要 (2021年3月9日付広報発表資料より引用)
エッジコンピューティング基盤
研究者がデータを活用した研究において利用可能な主な計算資源として、従来から提供しているスーパーコンピュータに加え、前述のmdxや、情報環境機構が提供する研究データ用ストレージサービスであるRDM Drive及びRDMオブジェクトストレージ等があります。実際の研究においては、これらのシステムを各研究室やフィールドに存在する研究機器やセンサー、計算機等と組み合わせて利用されることが想定されます。例えば、研究機器やセンサーからデータを収集しRDM DriveやRDMオブジェクトストレージに機微なデータを保存するとともに、スーパーコンピュータで大規模解析を実行するケースを考えると、研究機器やセンサーが接続されている隔離ネットワークとRDM Drive又はRDMオブジェクトストレージをブリッジする機能や、RDM Drive又はRDMオブジェクトストレージに保存されたデータから機微なデータを削除しつつスーパーコンピュータのストレージにデータを転送する機能が求められると考えられますが、このようなシステム間の橋渡しの処理に利用しやすいサービスはありませんでした。
そこで、本センターでは、「研究DXを創発する横断型データ駆動のためのデータ運用支援基盤センターの創設」事業(2023年度~2027年度、情報環境機構・学術情報メディアセンター・図書館機構)とその関連プロジェクト「mdx連携・データ駆動基盤」の一環として、2024年度末にエッジコンピューティング基盤を導入しました。
本システムは、昨今利用が広がっているコンテナの実行環境を提供します。コンテナは、コンテナイメージという形でアプリケーションとその実行に必要なファイルをまとめることにより、可搬性の高いソフトウェア実行環境を実現する技術です。コンテナイメージが広く公開されているソフトウェアは多数あり、そのようなソフトウェアを利用するケースでは、仮想マシンの利用時は必要であったソフトウェアのセットアップの手間を省くことができると期待されます。また、コンテナの実行形態として、常時実行や定期実行、一回のみの実行など、多様な実行形態をサポートします。
本システムは、コンテナオーケストレーションツールとして事実上の標準であるKubernetesを採用し、利用者の皆様にKubernetesのAPIへのアクセスを提供します。そのため、橋渡しの処理に限らず一般的なコンテナの実行環境として利用することが可能です(図 2)。また、利用にあたり、Web上にある多くのノウハウが利用できると期待されます。 本システムは本学のキャンパスネットワークKUINSに200Gbpsで接続しており、本システム上で動作するコンテナは他のシステムに高速にアクセスすることができます。さらに、KUINSのVLANを引き込むことで、研究機器やセンサーが接続されている隔離ネットワークと通信することが可能な設計になっています(詳細はご相談ください)。加えて、本システムは停電の影響を受けないよう無停電電源装置及び発電機で電源をバックアップしており、メンテナンス及び障害時を除き24時間365日運用します。 本システムは原稿執筆時点(2025年12月)でサービス提供に向けた準備中であり、今後、2026年度に試行サービスを経て正式なサービスの開始を予定しています。
図 2 エッジコンピューティング基盤の概要
(小谷 大祐:学術情報メディアセンター 社会情報解析盤研究部門 准教授)
info号数