PCクラスタワークショップ in 大阪2023「ビッグデータとHPC」

会期 2023年6月21日(水)~22日(木)
会場 富士通 Osaka Hub(富士通 関西システムラボラトリ)  セミナールーム 8階
大阪市中央区城見2丁目2−6 〒548-8514
開催形式 現地とZoomによるオンラインのハイブリッド型運営
現地定員 70名
参加費 無料参加登録受付は終了しました。

開催趣旨

2023年度のPCCCワークショップは、大阪で「ビッグデータとHPC」をテーマに開催します。ビッグデータを扱うアプリケーションと、ビッグデータを支えるHPCインフラの両面から、データサイエンス、産業応用、研究データ管理基盤、システムソフト等の事例、計算プラットフォーム、商用クラウド、ストレージ、ネットワークなど、多様な技術動向をご紹介いただきます。多くの皆さまのご参加をお待ちしています。

プログラム

6月21日(水)13:00~17:30(終了後、懇親会)

13:00~13:10

開会挨拶

塙 敏博(PCCC会長/東京大学)

13:10~13:40

招待講演1

コネクティッドカーから収集した大規模車両データの解析・活用

福島 真太朗(トヨタ自動車株式会社)

講演概要を開く

現在、自動車業界は「100年に一度の大変革の時代」に入り、従来の産業構造から大きく変化しようとしています。その中で、コネクティッドカーと呼ばれる通信機能を持つ自動車から、運転操作・車両挙動、画像等の大量のデータを収集、解析して新たなサービスの実現に向けた取り組みが行われています。本講演では、研究開発・先行開発の立場から、これらのデータ解析・利活用の取り組みと今後の展望について説明します。

13:40~14:10

事例発表1

Wisteria/BDEC-01におけるビッグデータとHPC ― シミュレーション、データ、学習の融合 ―

住元 真司(東京大学情報基盤センター)

講演概要を開く

東京大学情報基盤センターで運用しているWisteria/BDEC-01では革新的なソフトウェア基盤h3-Open-BDECの研究開発を進めている。本講演では進行中のプロジェクトにおけるリアルタイムデータ、シミュレーションデータを用いたビッグデータとHPCの事例について述べる。

14:10~15:10

会員発表1

14:10~14:30

「第4世代AMD EPYCプロセッサーの新ラインナップ (Genoa-X、Bergamo) の技術概要」

大原久樹(日本AMD株式会社)

講演概要を開く

2022年11月に発表した第4世代AMD EPYCプロセッサーに、新しいラインナップが2023年上半期に追加されます。AMD 3D V-Cacheテクノロジーを採用した Genoa-X と、スケールアウト性能を大きく向上させた Bergamo です。これらの新しいプロセッサーの技術概要を説明いたします。また、AI推論をCPU、GPU、FPGAで一元的に適応させる AMD Unified Inference Frontend について解説します。

14:30~14:50

「ヘルスケアデータ解析への説明可能AIの応用」

根本 翔太(株式会社日立製作所)

講演概要を開く

演算処理の高速化と説明性の確保にも応えられる説明可能AI(XAI)の登場は、ヘルスケアデータ解析の進展に大きく貢献してきた。日立はXAIの独自開発を進めており、これまでにヘルスケアデータ解析への応用を行ってきた。本発表では日立が独自開発したXAI技術の概要、及びXAIのヘルスケアデータ解析への適用事例を紹介するとともに、今後の展望について述べる。

14:50~15:10

「Introduction of Open OnDemand」

グレッグ・ゲタマン(株式会社計算科学)

講演概要を開く

「Open OnDemand」は米国オハイオ・スーパーコンピュータ・センターを中心に開発が進められているHPCシステムを利用するためのオープンソースのWebポータルです。PBS Pro、SLURM、Grid Engine、Torque、LSFなどのジョブスケジューラに対応しており、特にJupyter Notebookなどのインタラクティブなジョブにも対応しています。弊社ではシステムの構築からカスタマイズ、運用まで幅広く対応いたします。

15:10~15:30 休憩
15:30~16:00

招待講演2

「激動の宇宙の姿をもとめて ―木曽トモエゴゼンとビッグデータ天文学」

酒向 重行(東京大学 天文学教育研究センター)

講演概要を開く

宇宙で稀におきる一過性のイベントの理解が、宇宙と生命の起源と進化の解明につながるとして近年注目を集めている。それは天体の爆発現象であったり空を駆け抜ける移動現象であったりする。こうした現象は稀にしか発生しないため、空の広域を常に監視し、その時が来るのを虎視眈々と待つ必要がある。本講演では、我々のグループが進める木曽トモエゴゼン計画による空の広域動画サーベイの最新成果を紹介するとともに、サーベイで得られる毎晩10TBを超えるデータの逐次処理と高速ネットワークの活用とそれらの課題について述べる。

16:00~17:00

会員発表2

16:00~16:20

「HPC/AIにおけるビッグデータサイエンスを加速するNVIDIAのIOソリューションのご紹介」

岩谷正樹(エヌビディア合同会社)

講演概要を開く

HPCやAIの世界においては、解析用の計算アルゴリズムが次々と開発投入されるばかりでなく、扱われるデータ量やパラメーター量も急速に増加しています。これにより、データのロードに費やされる時間は大きなボトルネックとなり、アプリケーション全体のパフォーマンスに影響を及ぼします。今回は、これらIOのボトルネックを回避するためのIO管理や高いIO性能を実現するNVIDIA Magnum IOをはじめ、NVIDIAのビッグデータに対応する製品や技術をご紹介いたします。

16:20~16:40

「ビッグデータとHPCとOCI」

松山 慎(日本オラクル株式会社)

講演概要を開く

OCIはクラウドならではのAgilityに優れたデータ処理基盤と安価で高速・堅牢なストレージに加え、インフラに最適化された機械学習基盤や広帯域低遅延RDMAネットワークと最新のCPUやGPUで構成されるHPCクラウド基盤を提供し、ビッグデータ-HPCを協力にサポートします。国内の東京-大阪両リージョンはどちらもSINET6に接続され、SINET6を介した通信の転送データ量は無制限に無料でご利用頂けます。ビッグデータやHPCにおけるクラウドサービスの弱点の多くを排除したOCIの特長をご紹介させて頂きます。

16:40~17:00

「ビッグデータを取り巻く制約からの解放」

森本 賢治(Pacific Teck Japan)

講演概要を開く

ビッグデータという言葉は初出から十余年、既にバズワードとしての役割は終えて久しい。しかしデータがビッグでなくなったかと言うと、そうでないことは論を待たない。データ処理技術はAIモデル乱造の時期を過ぎ、シンギュラリティを目前に控えているようにすら見える一方、データハンドリングは依然POSIXファイルシステムとオブジェクトストレージに依存している。この状況に対応していくためのソリューションを紹介する。

17:00~17:30

事例発表2

「ビッグデータとHPCを活用したアプリケーション事例のご紹介」

白幡 晃一(富士通株式会社)

講演概要を開く

ビッグデータを扱うアプリケーションの事例として、遺伝子分析と材料探索について紹介します。遺伝子分析では、データから新たな発見の手掛かりを提示する因果発見技術を「富岳」上に実装し、1,000兆通りの可能性から未知の因果を発見できる技術を開発しました。材料探索では、アンモニアをクリーンに合成するための触媒探索において、量子化学シミュレーション高速化技術を開発し、因果発見技術と組み合わせることで探索期間を半減しました。

17:30

第1日 終了

17:40~19:00 懇親会(参加費1000円)

6月22日(木)10:00~15:40

10:00~10:05

挨拶

中島 耕太(PCCC副会長/富士通)

10:05~10:35

事例発表3

「大型放射光施設のデータ処理を支えるシステムソフトウェア技術」

佐藤 賢斗(理化学研究所 計算科学研究センター)

講演概要を開く

大型放射光施設では、高エネルギーX線やレーザーを用いて物質の構造や振る舞いを解明するための実験が行われています。これにより、材料科学、生命科学、エネルギー分野などで重要な情報が得られますが、その実験からは膨大な量のデータが生成されます。このためデータの収集、保存、解析などのプロセスの効率化が重要です。本講演では、大型放射光施設から得られる大規模データのデータ圧縮を中心にソフトウェア技術について解説します。

10:35~11:05

事例発表4

「Big Data Analytics on IA ~ビッグデータ技術に関するインテルの取り組みと事例のご紹介~」

大内山 浩(インテル株式会社)

講演概要を開く

2006年のApache Hadoopの登場から、2014年のApache Sparkの登場、そしてその後の発展へと続く系譜により、ビッグデータ分析領域にてマルチノードベースの分散並列処理技術が不動の地位を得ております。本セッションでは、こうした技術に活用できるインテルXeonの機能に加え、関連ソフトウェア、および、主にエンタープライズにおけるユーザー事例のご紹介をいたします。

11:05~11:45

会員発表3

11:05~11:25

「実行時コンパイラを用いたデータフレーム高速化技術」

石坂 一久(日本電気株式会社)

講演概要を開く

データ分析や前処理に広く用いられているデータフレームの高速化技術を紹介します.データフレーム用ライブラリとしてはPythonのPandasが有名ですが,本技術は実行時に中間言語生成・最適化などを行うコンパイル技術を利用することで,Pandasと互換のAPIでの高速化を可能とします.本技術を用いたPython用高速データフレームライブラリと合わせてご紹介します。

11:25~11:45

「DDN HPC/AI Solutionのご紹介」

橋爪 信明(株式会社データダイレクト・ネットワークス・ジャパン)

講演概要を開く

DDNが提供するHPC/AI Solutionについて、5/22-24 ドイツ・ハンブルグで行われた ISC23での発表も踏まえてご紹介させていただきます。

11:45~13:00 昼休み
13:00~13:30

招待講演3

「オープンサイエンスとHPCにおける研究データ管理の課題」

込山 悠介(国立情報学研究所 コンテンツ科学研究系)

講演概要を開く

研究データ管理はオープンサイエンスだけでなくHPC領域でも重要な課題です。国立情報学研究所のGakuNin RDMとストレージやデータ解析プラットフォームの連携がこれらの課題の解決に寄与できるか議論します。研究データのアクセシビリティ、透明性、再利用の重要性を強調し、HPCと連携した研究データ管理の新たな視点を開くことを目指します。

13:30~13:50

会員発表4

「AIとHPC融合に向けたTSUBAME4.0スーパーコンピュータ」

遠藤 敏夫(東京工業大学)

講演概要を開く

東京工業大学では、次世代スパコンTSUBAME4.0を2024年4月に稼働開始予定である。その計算資源の規模は、HPCで多用される倍精度演算で66.8PFlops、AI分野で利用される半精度演算で952PFlopsと、双方の尺度で富岳に次ぐ国内2位に相当する。これまでのTSUBAMEシリーズのようにGPUの大幅活用により上記のような高性能と、Webアプリケーション経由での利用などを通した使いやすさを両立する。

13:50~14:00 休憩
14:00~15:30

パネル討議

「ビッグデータ解析とHPCのさらなる協調に向けて」

モデレータ: 塙 敏博(PCCC会長/東京大学)
パネリスト:
  • 福島 真太朗(トヨタ自動車)
  • 酒向 重行(東京大学 天文学教育研究センター)
  • 込山 悠介(国立情報学研究所)
  • 住元 真司(東京大学 情報基盤センター)
  • 白幡 晃一(富士通)
  • 松山 慎(日本オラクル)
15:30~15:40

閉会挨拶

塙 敏博(PCCC会長/東京大学)