PCクラスタワークショップ in すずかけ台2024

日時 2024年6月27日(木)~28日(金)
会場 東京工業大学 すずかけ台キャンパス 大学会館 多目的ホール/ラウンジ(3階)
〒226-8501 神奈川県横浜市緑区長津田町4259
※ ご来場に際しては公共交通機関をご利用ください(駐車スペースは限られています)。
共催 東京工業大学 学術国際情報センター
開催形式 現地とZoomによるオンラインのハイブリッド型運営
現地定員 160名
※現地参加登録締切 6月21日(金)17時
参加費 無料(要参加登録/懇親会の申込締切6月14日・参加費1000円)

参加登録受付は終了しました。

開催趣旨:「GPUとHPC」

GPUは、いまやAIを支えるキーコンポーネントであると同時に、HPCにおいても電力あたり性能の点でますます重要となっており、PCクラスタは両者を繋げる重要なインフラ技術です。
本ワークショップは「GPUとHPC」をサブテーマとして開催いたします。東京工業大学すずかけ台キャンパスに新たに稼働開始したスーパーコンピュータシステム TSUBAME4.0 についてご紹介いただき、想定される応用例として、機械学習とHPCによる創薬や物質・材料の創出についてもご講演いただきます。
また、新しい試みとして、HPC-OSS普及、AI・機械学習技術、HPCクラウドの各部会によるオーガナイズドセッションも計画しております。
さらにTSUBAME4.0の見学会も企画しております。多数の皆さまのご参加をお待ちしております。

プログラム

6月27日(木)10:30~17:20

10:15

Zoom オープン

10:30-10:40

開会挨拶

塙 敏博(PCCC会長/東京大学)

10:40-11:00

東京工業大学 学術国際情報センターの紹介

遠藤敏夫(東京工業大学)

講演概要を開く

東京工業大学 学術情報国際センターは、同大学の情報インフラの整備・運用などを通して、学内の研究・教育の支援や大学間連携に貢献しています。本センターについて、2006年より運用してきたTSUBAMEスパコンシリーズと本年4月に運用開始したTSUBAME4.0を中心にご紹介します。

11:00-11:30

PCCC会員発表1

11:00-11:15

「NECのHPCソリューションのご紹介」

浅田洋祐(日本電気株式会社)

講演概要を開く

NECは、5月に「お客様を未来へ導く価値創造モデル」として新ブランド「BluStellar」を発表しました。このブランドによるソリューションのご提供先の1つがアカデミアです。お客様の用途に最適な高性能プラットフォームをご提案し、構築から運用・保守までをトータルにカバーする総合的なHPCソリューションをご提供いたします。

11:15-11:30

「GPU不足を緩和する技術AI Computing Broker」

吉田 英司(富士通株式会社)

講演概要を開く

GPU価格が高騰し入手が難しくなる中で、GPUの効率的利用が急務となっております。本発表はGPUの利用効率を引き上げることで少ないGPUでもより多くの深層学習を進める技術AI Computing Brokerをご紹介いたします。本技術はオンプレミスからクラウド、HPCに至るまでの様々な計算機環境を利用するユーザーへGPU利用効率向上をサポートします。

11:30-12:45 昼休み
12:45-14:15

PCCC会員発表2

12:45-13:00

「SCSKのAI技術戦略 - 最新手法の活用とこれからの展望」

富田勇希(SCSK株式会社)

講演概要を開く

当社は短期目標として、AI領域の現場実装と、大規模データ技術開発に力を入れています。これまでの取り組みとしては、プロンプトチューニングやRetrieval-Augmented Generation(RAG)といった手法を使ってAIを活用してきました。現在は、特定のタスクに特化した言語モデルを作るために、ファインチューニングや、Small Language Model(SLM)の開発に力を注いでおります。
本セッションでは、これらの開発やGPUサーバーの導入について説明させていただきます。

13:00-13:15

「Bringing AI everywhere in HPC (AIをHPCへ)」

矢澤克巳(インテル株式会社)

講演概要を開く

生成 AI の出現により、AI はより身近に無視のできない社会インフラになりつつあります。そうしたスピードある要求に対応するため、インテルは HPC に加え AI により注力したポートフォリオの大幅な機能拡張を計画しています。このセッションでは、インテルの HPC/AI 関連の中長期の取り組みをご紹介します。

13:15-13:30

「AMD Instinct MI300Aが実現するAPUプログラミング・モデルについて」

大原久樹(日本AMD株式会社)

講演概要を開く

MI300AはZen4 EPYC CPUコアとCDNA3アーキテクチャのGPUコアを統合した、初のデータセンター向けAPUです。APUが実現するUnified Memoryによって、性能の向上が見込まれるだけでなく、従来必要とされてきたホスト・デバイス間の煩雑なメモリー管理を簡易化させることができます。本講演ではAPUプログラミング・モデルの概要と応用事例についてご紹介します。

13:30-13:45

「AIとHPCの進化を支えるエヌビディアのコンピューティングプラットフォーム」

佐々木邦暢(エヌビディア合同会社)

講演概要を開く

2006年のCUDA発表から始まったアクセラレーテッドコンピューティングは、今やAIやHPCに欠かせない要素となりました。このセッションでは、GTC 2024で発表した最新のBlackwellアーキテクチャGPU、Green500ランキングの上位を独占したGrace Hopperスーパーチップなど、エヌビディアのコンピューティングプラットフォームの最新情報をお伝えします。

13:45-14:00

「GPUとOCI の HPC関連サービス」

松山 慎(日本オラクル株式会社)

講演概要を開く

Oracle Cloud Infrastructure (OCI) では、NVIDIA H100やAMD MI300Xなどの最新GPUを含むベアメタルコンピュートやデータセンタワイドにフラットなTCP/IPネットワーク、低遅延のRDMAネットワーク、クラウドストレージなどによる高い性能再現性をお約束するHPC&AI環境が簡単に安価にご利用頂けます。また、SINET接続ではクラウドとオンプレミスの間の転送データ量が "完全に無料" となります。講演ではGPU関連サービスを中心にOCIの特長を中心に紹介させて頂きます。

14:00-14:15

「AI時代のデータインテンシブHPCプラットフォームの開発と展開」

鶴見利章(コアマイクロシステムズ株式会社)

講演概要を開く

  1. アカデミック向け大規模ラックスケールFusion Scale AI HPC
  2. クラウドサービス向けFull Composable Larg Scale AI HPC
  3. エンタープライズ向けAI native Large Scale HPC
  4. インダストリー向けSingle Machine Big AI HPC(Big Memory/Big Accelerator)
  5. エンジニアリング向けHyper Converged Cloud Scale AI HPC
14:15-14:35 休憩(コーヒーブレイク)
14:35-16:05

HPCクラウド部会セッション
(第2回 HPCクラウド部会ワークショップ)

部会長:塙 敏博(東京大学)

セッション趣旨を開く

本ワークショップではHPCクラウドにおける最先端のGPUを含むサービスとその活用例などをクラウドサービスプロバイダならびに先進ユーザをお招きして紹介と「プロバイダもしくはユーザへの要望」を含む講演と質疑を行います。

14:35-15:05

「mdx: アカデミックHPCクラウドmdxの紹介と今後の技術課題」

空閑洋平(東京大学)

講演概要を開く

mdxは全国9大学2研究機関が共同運営するCPU・GPUクラスタで、最近ではLLM-jpによる大規模言語モデルの構築に利用されています。mdxの特徴としては、基盤システムに仮想化技術を採用することで、研究プロジェクト単位でテナントを構築し、研究者自身がソフトウェア環境を構築可能になっています。本セッションでは、mdxの紹介と、LLM事前学習クラスタの構築経験から見えてきた今後の基盤構築に関する課題を紹介します。

15:05-15:25

「クラウド HPC の最先端:未来を切り拓く スーパー コンピュータ Microsoft Azure Eagle」

松森健明(マイクロソフト株式会社)

講演概要を開く

EagleはTOP500 ランキングで第 3位を記録したスーパーコンピュータであり、Microsoft Azure上に構築された世界最速のクラウド型スーパーコンピュータです。このセッションでは先進的な Eagleの技術的特徴やユースケースをご紹介します。また、Eagle を支えるクラウド HPC 技術の特徴や実例も併せてご紹介します。

15:25-15:45

「研究開発に最適!業界最安級、GPUクラウドサービス『GPUSOROBAN』のご紹介」

福島 修(ハイレゾ株式会社)

講演概要を開く

当社は国内最大級のGPU専用データセンターを構築し、業界最安値級のGPUクラウドサービス【GPUSOROBAN】を展開しています。GPUSOROBANは、使いやすいインターフェースと丁寧な技術サポートを提供しており、幅広い業種・業態の皆様に生成AIや機械学習、研究開発など、累計1000案件以上でご活用いただいています。

15:45-16:05

「粒子挙動解析ソフトウェアAltair EDEMのGPU適用による計算効率向上化事例の紹介」

河野稔弘(アルテアエンジニアリング株式会社)

講演概要を開く

アルテアの粒子挙動解析ソフトウェアEDEMは粉粒体の現象を高精度に表現することが可能なソフトウェアである。ソフトウェアの機能向上により、ユーザーの"より粒子を多く、より早く"というニーズが年々高まっているが、EDEMはGPUソルバーの適用拡大によってこのニーズに応えている。本講演ではGPUを様々な現象や課題に対して適用した時の効果や、機能拡充の取り組み内容について紹介する。

16:05-16:10

挨拶

萩原 孝(PCCC副会長/NEC)

16:10-17:20

TSUBAME4.0 システム紹介・見学会

東京工業大学 学術国際情報センター

概要を開く

東京工業大学すずかけ台キャンパスにおいて、2024年4月に運用開始したTSUBAME4.0の紹介および見学会を実施します。マシンルームまでは会場から徒歩5分程度の場所にあります。

17:30-19:00

懇親会(参加費1000円)

6月28日(金)10:30~16:50

10:15

Zoom オープン

10:30-10:35

挨拶

中島耕太(PCCC副会長/富士通)

10:35-11:25

PCCC会員発表3

10:35-10:45

「HPCインフラでのAIワークロードから、AIインフラでのHPCワークロードへ」

森本賢治(Pacific Teck Japan)

講演概要を開く

ここ数年のAIブームの中、世界中でHPC向けに作られたスパコンでAIジョブをどう実行するかがホットトピックとなっていた。しかしその立場は逆転しつつあり、AI向けに作られたインフラ上でHPCジョブをどう動かすかを考えなくてはならない状況にある。科学技術計算も従来手法に加えAIを利用して多大な成果が得られはじめた。環境の統合と効率的な運用が求められている。弊社の取り扱い製品が、この時代にどう寄与するのかを紹介する。

10:45-10:55

「新スーパーコンピュータシステム玄界の紹介」

大島聡史(九州大学 情報基盤研究開発センター)

講演概要を開く

九州大学情報基盤研究開発センターでは、新しい全国共同利用スーパーコンピュータシステム玄界を2024年7月に導入します。このシステムでは、旧システム「ITO」における科学技術計算の支援に加え、大規模言語モデルなどの新しい研究分野における需要に応えるとともに、データ駆動型研究やオープンサイエンスの推進を目指しています。本講演では、玄界のハードウェア、ソフトウェアおよび運用方針について紹介します。

10:55-11:25

「JCAHPCの新スパコンシステム Miyabiの準備状況」

朴 泰祐(筑波大学)、塙 敏博 (東京大)

講演概要を開く

筑波大学計算科学研究センターと東京大学情報基盤センターが合同で運営する「最先端共同HPC基盤施設(JCAHPC)」の第二世代システムは Miyabi と命名され、2025年1月稼働開始に向けた準備を進めている。本講演では、Miyabiの準備状況について、NVIDIA GH200を用いた予備評価も含めて報告する。

11:25-12:30 昼休み
12:30-13:10

基調講演

「機械学習による創薬標的タンパク質に対するオーダーメイド化合物生成について」

関嶋政和(東京工業大学)

講演概要を開く

これまで、創薬の初期の研究においては、ウェットの実験で数万の化合物ライブラリを用いて、創薬標的タンパク質への阻害能を確認し、得られた化合物をより薬らしく成長させてきた。本研究では、標的タンパク質の阻害能を持つ化合物を機械学習を用いることで、直接的に生成する手法を開発することで、創薬にかかるコストや期間の削減を目指していく。

13:10-14:40

HPC-OSS部会セッション
(PCCC GPU-アクセラレータ OSS活用ワークショップ)

部会長:住元真司(東京大学)

セッション趣旨を開く

本ワークショップでは、GPU-アクセラレータを活用するために有用なオープンソースソフトウェアの紹介、インストール時の注意点、活用例などをGPU-アクセラレータ提供ベンダーならびに先進ユーザをお招きして事例紹介とQ&Aを行います。特にオープンソースのコンパイラ・MPIなどインストールや実行に注意が必要なものを中心に紹介いただき、GPU-アクセラレータユーザのHPC OSSの活用促進を図ります。

13:10-13:15

HPC-OSS部会のご紹介

13:15-13:30

「AMD ROCm ソフトウェアについて」

大原久樹(日本AMD株式会社)

講演概要を開く

ROCmはプログラミング・モデル、コンパイラ、各種ライブラリ、プロファイラなどのツールから構成される、オープンソースのソフトウェアスタックです。HPCやAIのワークロードにおいて、ROCmがどのようにオープンソースとして活用されているのか、具体例を用いてご紹介いたします。

13:30-13:45

「AIアクセラレータGaudiにおけるOSSの活用事例」

戸谷大介(インテル株式会社)

講演概要を開く

インテルではAI専用アクセラレータのGaudiを提供しており、今年後半にはGaudi3の出荷を予定している。Gaudiを活用して低コストで高効率に開発を行うために重要なOSSと開発者向けクラウドサービスの概要とGaudi2での活用事例を紹介する。

13:45-14:00

「NECのAI研究用スーパーコンピューターにおけるGPU性能を最大限引き出すためのオープンソースの活用方法」

北野貴稔(日本電気株式会社)

講演概要を開く

NECでは、国内最大級のAI研究用スーパーコンピュータを用いて、生成AIをはじめとして様々な先進AIの技術開発を行っています。多数のGPUを用いた大規模な分散学習を効率的に行うために、GPU性能を最大限に引き出すためのオープンソースの活用方法について説明します。

14:00-14:15

「NVIDIA/AMD/Intel製GPU向けのN体計算コードの実装と性能評価」

三木洋平(東京大学)

講演概要を開く

NVIDIA/AMD/Intelの3社は高性能GPUおよびそれぞれのGPU向けの開発環境を提供し,また自社製品をアピールする情報を多数発信している.こうした環境下でユーザがGPUベンダーやプログラミング環境を選択する際には、各GPU・開発環境を第三者的に比較した基礎研究事例が参考になると考えられる。そこで本講演では直接法に基づくN体計算コードを例題として取り上げ、CUDA/HIP/SYCL実装およびNVIDIA/AMD/Intel製GPU上での性能評価結果について紹介する。

14:15-14:25

「Introduction of Open MPI+UCX+UCC」

住元真司(東京大学)

14:15-14:35

「Getting Started with Open MPI on NVIDIA Hardware」

George Bosilca(NVIDIA Corporation)

講演概要を開く

This concise guide aims to equip users with the knowledge to set up, validate and test Open MPI for optimal performance on a cluster equipped with NVIDIA accelerators. It is targeted to a relatively experienced users or sysadmin that are ready to take the challenge to install their own version of Open MPI. We'll cover:
- Choosing the software ecosystem : Identifying compatible and stable versions of Open MPI, compilers, and libraries (gdrcopy, UCX, CUDA, etc.) for a successful build.
- High-Performance Build: Highlighting the key configuration options to achieve a high-performance Open MPI build.
- Verification and Optimization: Demonstrating methods to test the installation's functionality and identify performance bottlenecks specific to NVIDIA hardware.
By the end, you'll be well-positioned to leverage Open MPI effectively on your NVIDIA cluster.

14:40-15:10 休憩(コーヒーブレイク)
15:10-16:40

AI/ML部会セッション
パネル討議
「生成AI時代の高性能計算インフラの抱える課題-これからの日本DC設計に求められるもの」

部会長:遠藤敏夫(東京工業大学)

セッション趣旨を開く

次の課題について討議を進めていきます。

  1. DCにおける電力について
  2. DCにおける冷却について
  3. 今後日本が作るべくDC像とは?
モデレータ: 遠藤敏夫(AI/ML部会長/東京工業大学)
パネリスト:
  • 愛甲浩史(エヌビディア合同会社)
  • 高野了成(産業技術総合研究所)
  • 矢澤克巳(インテル株式会社)
  • 大原久樹(日本AMD株式会社)
  • 石橋史康(レノボ・ジャパン合同会社)
司会: 岩谷正樹(エヌビディア合同会社)
16:40-16:50

閉会挨拶

塙 敏博(PCCC会長/東京大学)

現地展示@ラウンジ 13社・大学(五十音順)

  • 株式会社アルゴグラフィックス
  • インテル株式会社
  • SCSK株式会社
  • エヌビディア合同会社
  • 九州大学 情報基盤研究開発センター
  • コアマイクロシステムズ株式会社
  • 筑波大学 計算科学研究センター
  • 東京工業大学 学術国際情報センター
  • 東京大学 情報基盤センター
  • 日本電気株式会社
  • 日本オラクル株式会社
  • Pacific Teck Japan合同会社
  • 富士通株式会社