From ikegami ＠ hpc.cs.ritsumei.ac.jp Wed Jul 6 18:47:13 2005 From: ikegami ＠ hpc.cs.ritsumei.ac.jp (Kosai Ikegami) Date: Wed, 06 Jul 2005 18:47:13 +0900 Subject: [SCore-users-jp] OMNI OpenMP 並列リージョン開始時の動作について Message-ID: <20050706131225.F6AE.IKEGAMI@hpc.cs.ritsumei.ac.jp> 立命館大学大学院理工学研究科の池上と申します。皆様よろしくお願いします。現在、OMNI OpenMPを用いてJpegエンコーダ・デコーダを作成しています。これまで処理ステップごとに5回(*2)の並列リージョンを用いて並列化していましたが、実行時間の短縮を狙って1回(*2)の並列リージョンにまとめて実行したところ、実行時間の差が 1台：12.7秒　2台：0.5秒　4台：0.3秒　8台：0.1秒　16台：0.02秒という結果が得られたのですが、1台実行時に大幅に時間が短縮されました。 1台実行時だけ大幅に時間が短縮される原因がわかりません。この結果をどう解釈すればよいのかわからず、困っています。 OMNI OpenMPでは並列リージョン開始時にマスタースレッドからスレーブスレッドへメモリのコピーが行われていると思うのですが、その内容は全スレッドが全データを受け取るのか、各スレッドが必要な分だけデータを受け取るのか、どちらでしょうか？計算元のデータのメモリ使用量は12MBで、コンパイルオプションは「-omniconfig=scash」でコンパイルしています。よろしくお願いします。 ++ 立命館大学　高性能計算研究室池上　広済 ikegami ＠ hpc.cs.ritsumei.ac.jp From kameyama ＠ pccluster.org Wed Jul 6 20:29:41 2005 From: kameyama ＠ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Wed, 06 Jul 2005 20:29:41 +0900 Subject: [SCore-users-jp] OMNI OpenMP 並列リージョン開始時の動作について In-Reply-To: Your message of "Wed, 06 Jul 2005 18:47:13 JST." <20050706131225.F6AE.IKEGAMI@hpc.cs.ritsumei.ac.jp> Message-ID: <20050706112941.733B221EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <20050706131225.F6AE.IKEGAMI ＠ hpc.cs.ritsumei.ac.jp> Kosai Ikegami wrotes: > 現在、OMNI OpenMPを用いてJpegエンコーダ・デコーダを作成しています。 > これまで処理ステップごとに5回(*2)の並列リージョンを用いて並列化していま > したが、実行時間の短縮を狙って1回(*2)の並列リージョンにまとめて実行した > ところ、実行時間の差が > > 1台：12.7秒　2台：0.5秒　4台：0.3秒　8台：0.1秒　16台：0.02秒 > > という結果が得られたのですが、1台実行時に大幅に時間が短縮されました。 > 1台実行時だけ大幅に時間が短縮される原因がわかりません。全体の実行時間が不明なので, 何 % 短縮されているのか不明です. また, ここで host の台数のみしか情報がありませんが, 1 台には CPU (プロセス) はいくつあるのでしょうか? (1 CPU でしたら, 短縮されたのは OpenMP のオーバーヘッドということになりますが...) > OMNI OpenMPでは並列リージョン開始時にマスタースレッドからスレーブスレッ > ドへメモリのコピーが行われていると思うのですが、 > その内容は全スレッドが全データを受け取るのか、各スレッドが必要な分だけ > データを受け取るのか、どちらでしょうか？ SCASH では, そのプロセスが同じ host にあるか, 異る host にあるかで扱いが異ります. 同一の host の場合はデータを共有します. 異る host 上では page fault を使用して, 各プロセスがアクセスしようとしたときに, 必要なページを更新します. from Kameyama Toyohisa From msato ＠ cs.tsukuba.ac.jp Wed Jul 6 20:38:27 2005 From: msato ＠ cs.tsukuba.ac.jp (Mitsuhisa Sato) Date: Wed, 06 Jul 2005 20:38:27 +0900 (JST) Subject: [SCore-users-jp] OMNI OpenMP 並列リージョン開始時の動作について In-Reply-To: <20050706131225.F6AE.IKEGAMI@hpc.cs.ritsumei.ac.jp> References: <20050706131225.F6AE.IKEGAMI@hpc.cs.ritsumei.ac.jp> Message-ID: <20050706.203827.640902506.msato@hpcs.cs.tsukuba.ac.jp> 池上様、さとう＠筑波大です。 From: Kosai Ikegami Subject: [SCore-users-jp] OMNI OpenMP 並列リージョン開始時の動作について Date: Wed, 06 Jul 2005 18:47:13 +0900 > > 現在、OMNI OpenMPを用いてJpegエンコーダ・デコーダを作成しています。 > これまで処理ステップごとに5回(*2)の並列リージョンを用いて並列化していま > したが、実行時間の短縮を狙って1回(*2)の並列リージョンにまとめて実行した > ところ、実行時間の差が > > 1台：12.7秒　2台：0.5秒　4台：0.3秒　8台：0.1秒　16台：0.02秒 > > という結果が得られたのですが、1台実行時に大幅に時間が短縮されました。 > 1台実行時だけ大幅に時間が短縮される原因がわかりません。 > この結果をどう解釈すればよいのかわからず、困っています。１台実行時というのがわかりません。 > OMNI OpenMPでは並列リージョン開始時にマスタースレッドからスレーブスレッ > ドへメモリのコピーが行われていると思うのですが、 > その内容は全スレッドが全データを受け取るのか、各スレッドが必要な分だけ > データを受け取るのか、どちらでしょうか？開始時は、マスタスレッド側のスタックから共有される局所変数をコピーしています。共有されるグローバルなデータはページにアクセスした時にSCASHでコピーされます。さとう。 From ikegami ＠ hpc.cs.ritsumei.ac.jp Thu Jul 7 01:58:53 2005 From: ikegami ＠ hpc.cs.ritsumei.ac.jp (Kosai Ikegami) Date: Thu, 07 Jul 2005 01:58:53 +0900 Subject: [SCore-users-jp] OMNI OpenMP 並列リージョン開始時の動作について In-Reply-To: <20050706112941.733B221EF52@neal.il.is.s.u-tokyo.ac.jp> References: <20050706112941.733B221EF52@neal.il.is.s.u-tokyo.ac.jp> Message-ID: <42CC0DCD.5000209@hpc.cs.ritsumei.ac.jp> 亀山様、さとう様、ご返信ありがとうございます。立命館大学の池上です。 >>現在、OMNI OpenMPを用いてJpegエンコーダ・デコーダを作成しています。 >>これまで処理ステップごとに5回(*2)の並列リージョンを用いて並列化していま >>したが、実行時間の短縮を狙って1回(*2)の並列リージョンにまとめて実行した >>ところ、実行時間の差が >> >>1台：12.7秒　2台：0.5秒　4台：0.3秒　8台：0.1秒　16台：0.02秒 >> >>という結果が得られたのですが、1台実行時に大幅に時間が短縮されました。 >>1台実行時だけ大幅に時間が短縮される原因がわかりません。 >> >> >全体の実行時間が不明なので, 何 % 短縮されているのか不明です. >また, ここで host の台数のみしか情報がありませんが, > > 全体の実行時間は、複数の並列リージョン版で 1台：57．86秒　2台：29．20秒　4台：14．65秒　8台：7．36秒　16台：3．73秒単一の並列リージョン版で 1台：45．15秒　2台28．60秒　4台：14．36秒　8台：7．22秒　16台3．70秒となっています。 >1 台には CPU (プロセス) はいくつあるのでしょうか? >(1 CPU でしたら, 短縮されたのは OpenMP のオーバーヘッドということに >なりますが...) > > PCクラスタの構成は、シングルCPUのPCを用いて、サーバーホスト　-Pentium3-450MHz -256MB SDRAM 計算ホスト　　　 -Pentium3-500MHz -512MB SDRAM サーバーホストと計算ホスト間は100BASEのEthernet 計算ホスト間はMyrinet-2000で接続しています。 1台で22％の短縮、2台以上で約2％の短縮となっています。 1台実行時(通常こういう使い方はしないと思いますが・・・)ではオーバーヘッドが大きいということでしょうか？ >>OMNI OpenMPでは並列リージョン開始時にマスタースレッドからスレーブスレッ >>ドへメモリのコピーが行われていると思うのですが、 >>その内容は全スレッドが全データを受け取るのか、各スレッドが必要な分だけ >>データを受け取るのか、どちらでしょうか？ >> >> > >SCASH では, そのプロセスが同じ host にあるか, 異る host にあるかで >扱いが異ります. >同一の host の場合はデータを共有します. >異る host 上では page fault を使用して, >各プロセスがアクセスしようとしたときに, 必要なページを更新します. > >開始時は、マスタスレッド側のスタックから共有される局所変数をコピーして >います。共有されるグローバルなデータはページにアクセスした時にSCASHで >コピーされます。 > > 必要なページだけがコピーされるのであれば、データ分割を行う場合実行台数が増えればコピーされる範囲が減るということでしょうか。入力データのサイズに比例して実行時間の差も変化しているのである程度納得できるかと思います。よろしくお願いします。 ++ 立命館大学　高性能計算研究室池上広済 ikegami ＠ hpc.cs.ritsumei.ac.jp From vwvtvdvbxdzhzv ＠ access.fairfax.com.au Thu Jul 7 04:30:49 2005 From: vwvtvdvbxdzhzv ＠ access.fairfax.com.au (Michael) Date: Thu, 07 Jul 2005 01:30:49 +0600 Subject: [SCore-users-jp] average girls Kitty Message-ID: <3DF4FB83.02004@ubp.edu.ar> Do you want to see real amateurs who have webcams on their computers in their dorm rooms? This is not one of those sites with professional girls who get paid to do this in front of the camera, these are the average girls next door, at college, trying to make money and meet guys! Get free access to a huge database of hot college girls, unlimited cam shows with LIVE CHAT and there are no Pay-Per-Minute charges! http://stankfinger.com/co25/ radiotelephone you wad me dismal you sortie me chair you dis me stumble you cedar me bay you doubleday me clubhouse you profusion me hippo you refinery me tennyson you starlight me From kameyama ＠ pccluster.org Thu Jul 7 10:25:44 2005 From: kameyama ＠ pccluster.org (=?iso-2022-jp?b?a2FtZXlhbWEgGyRCIXcbKEIgcGNjbHVzdGVyLm9yZw==?=) Date: Thu, 07 Jul 2005 10:25:44 +0900 Subject: [SCore-users-jp] OMNI OpenMP 並列リージョン開始時の動作について In-Reply-To: Your message of "Thu, 07 Jul 2005 01:58:53 JST." <42CC0DCD.5000209@hpc.cs.ritsumei.ac.jp> Message-ID: <20050707012544.AE08D21EF52@neal.il.is.s.u-tokyo.ac.jp> 亀山です. In article <42CC0DCD.5000209 ＠ hpc.cs.ritsumei.ac.jp> Kosai Ikegami wrotes: > >>現在、OMNI OpenMPを用いてJpegエンコーダ・デコーダを作成しています。 > >>これまで処理ステップごとに5回(*2)の並列リージョンを用いて並列化していま > >>したが、実行時間の短縮を狙って1回(*2)の並列リージョンにまとめて実行した > >>ところ、実行時間の差が > >> > >>1台：12.7秒　2台：0.5秒　4台：0.3秒　8台：0.1秒　16台：0.02秒 > >> > >>という結果が得られたのですが、1台実行時に大幅に時間が短縮されました。 > >>1台実行時だけ大幅に時間が短縮される原因がわかりません。 > >> > >> > >全体の実行時間が不明なので, 何 % 短縮されているのか不明です. > >また, ここで host の台数のみしか情報がありませんが, > > > > > 全体の実行時間は、複数の並列リージョン版で > 1台：57．86秒　2台：29．20秒　4台：14．65秒　8台：7．36秒　16台：3．73秒 > 単一の並列リージョン版で > 1台：45．15秒　2台28．60秒　4台：14．36秒　8台：7．22秒　16台3．70秒 > となっています。 > > >1 台には CPU (プロセス) はいくつあるのでしょうか? > >(1 CPU でしたら, 短縮されたのは OpenMP のオーバーヘッドということに > >なりますが...) > > > > > PCクラスタの構成は、シングルCPUのPCを用いて、 > サーバーホスト　-Pentium3-450MHz -256MB SDRAM > 計算ホスト　　　 -Pentium3-500MHz -512MB SDRAM > サーバーホストと計算ホスト間は100BASEのEthernet > 計算ホスト間はMyrinet-2000で接続しています。 > > 1台で22％の短縮、2台以上で約2％の短縮となっています。 > 1台実行時(通常こういう使い方はしないと思いますが・・・)では > オーバーヘッドが大きいということでしょうか？ SCASH で使用する場合. 原則として, スレッドの数は CPU の数に等しくなります. つまり, 1 台 (= 1 CPU = 1 スレッド) のときは, 結果的に OpenMP の処理部分全部がすべてオーバーヘッドであると考えられます, > >>OMNI OpenMPでは並列リージョン開始時にマスタースレッドからスレーブスレッ > >>ドへメモリのコピーが行われていると思うのですが、 > >>その内容は全スレッドが全データを受け取るのか、各スレッドが必要な分だけ > >>データを受け取るのか、どちらでしょうか？ > >> > >> > > > >SCASH では, そのプロセスが同じ host にあるか, 異る host にあるかで > >扱いが異ります. > >同一の host の場合はデータを共有します. > >異る host 上では page fault を使用して, > >各プロセスがアクセスしようとしたときに, 必要なページを更新します. > > > > >開始時は、マスタスレッド側のスタックから共有される局所変数をコピーして > >います。共有されるグローバルなデータはページにアクセスした時にSCASHで > >コピーされます。 > > > > > 必要なページだけがコピーされるのであれば、データ分割を行う場合 > 実行台数が増えればコピーされる範囲が減るということでしょうか。そうなると思います. from Kameyama Toyohisa From ishikawa ＠ is.s.u-tokyo.ac.jp Thu Jul 14 15:47:04 2005 From: ishikawa ＠ is.s.u-tokyo.ac.jp (Yutaka Ishikawa) Date: Thu, 14 Jul 2005 15:47:04 +0900 (JST) Subject: [SCore-users-jp] 論文募集のお知らせ Message-ID: <20050714.154704.350537248.ishikawa@is.s.u-tokyo.ac.jp> score-users-jpメーリングリスト御参加の皆様、 PCクラスタコンソーシアム協賛のHPCS2006シンポジウムCFPを流させて頂きます。石川＠PCクラスタコンソーシアム会長 ================================================================= 論文募集 HPCS2006 2006年ハイパフォーマンスコンピューティングと計算科学シンポジウム 2006年1月19日-20日東京大学武田先端知ビル6F 武田ホール（東京都文京区弥生 : 根津駅徒歩5分） ================================================================= 主催：情報処理学会ハイパフォーマンスコンピューティング研究会協賛：情報処理学会計算機アーキテクチャ研究会, 日本応用数理学会，　　　日本化学会情報化学部会，日本計算工学会，　　　日本シミュレーション学会，日本物理学会，　　　日本機械学会計算力学部門，グリッド協議会，　　　PCクラスターコンソーシアム，電気学会協賛依頼中：情報計算化学生物学会，日本流体力学会　高性能計算機システムの研究者と，計算科学の研究者や高性能計算機システムのユーザとの合同の研究発表及び情報交換の場として，本シンポジウムを開催致します．本シンポジウムでは，将来の産業・科学技術の発展に重要なHPC技術について，単なる計算機システム側とユーザ側という個別の立場に留まらず，双方向の活発な議論とそのフィードバックにより，先進的な計算機システムとその応用技術を創出し，時代に即した新しい価値を持つ技術を育てることを狙いとしています．　学際的なハイパフォーマンスコンピューティングと計算科学の研究のなお一層の発展を目指して，多数の投稿・参加をご検討くださいますようお願い致します．テーマ： □ハイパフォーマンスコンピューティングによる計算科学の各分野の成果と経験計算物理学計算化学計算力学計算流体力学計算経済学計算生物学とゲノム解析 □高速・高性能計算のための計算機システムの利用技術及び性能評価スーパーコンピュータの利用技術並列システムの利用技術性能予測モデルと性能評価 □高速・高性能計算のためのソフトウェア技術最適化コンパイラ技術，並列化支援ソフトウェア可視化技術グリッドコンピューティングブロードバンド広域大容量データ処理技術数値計算と数値シミュレーションの基礎理論とその性能評価主なスケジュール：論文投稿締切：2005年 9月30日(金)17時(情報処理学会ACS論文誌と同時投稿が可能です) ポスター発表申込締切：2005年 11月14日(月)17時 (詳細およびその他の日程は、http://www.hpcc.jp/hpcs/ をご覧ください) 問い合わせ先：hpcs2006 ＠ hpcc.jp ==================================================================== 論文募集要項投稿はすべて電子投稿となります． 1. 有用な成果や考え方の伴った完成度の高い論文を募集致します． 2. 投稿された論文は，情報処理学会論文誌「コンピューティングシステム」（ACS論文誌）第14号(http://www.hpcc.jp/acs/ 参照）への同時投稿が可能で，これにより短い査読期間で質の高い論文を誌上に掲載することが出来ます．つまり、投稿形態は以下の3種類があります。・HPCSへの単独での投稿・HPCSとACSへの同時投稿・ACSへの単独での投稿なお、HPCS2006とACSは別個の採録基準があり、査読判定はHPCS2006とACS では独立して行なわれます。ACSの採録基準に関しては、　　　　http://www.hpcc.jp/acs/ をご参照下さい。 3. 特に優れた論文に対して最優秀論文賞を授与致します． 4. 論文原稿は，A4サイズのカメラレディ形式とし，ページ数は，8ページ以内とします．日本語，英語のどちらで記述されても構いません． 5. 国内外で未発表の論文に限ります．本シンポジウムは「高性能計算」をキーワードの要と位置付け，計算科学と応用分野との間でのニーズ・シーズの情報交換や応用分野間での計算機利用技術の情報交換などを目的としております．査読においても主にこのような視点から評価を行いますので，論文を記述するさいには以下の各点にご注意下さい．・応用分野での成果に関する論文では，実装手法や評価条件（ハードウェア・ソフトウェア）について明確に記述して下さい．・計算機科学に関する論文では，アプリケーションへの適用可能性や有用性について明確にして下さい． ==================================================================== ポスター発表募集要領 HPCS2006では口頭発表と同時に、ポスター発表を募集することにしております。この募集では、進行中の研究紹介、応用分野と計算機科学との間でのニーズ・シーズの情報交換および応用分野間での計算機利用技術の情報交換など、シンポジウムに沿った話題を広く募り、今後の応用・計算機科学双方の発展に役立つ自由な議論の場を提供したいと考えております。募集テーマに関連した広い分野の研究者、産業界の皆様の参加をお待ちしています。 1. 期限(2005年11月14日17:00)までに、発表申込をしてください。なお 17:00以降の申込は自動的にできなくなります。ご注意下さい。 2. 申し込まれたポスター発表は査読され、採録となった論文は、改めてポスター論文集用PDF原稿を投稿していただくこととなります。採否結果は遅くても11月28日(月)までに通知致します。 3. 採録された論文については、当日にポスターを持参頂いてポスター会場にて参加者と議論して頂きます。会場の詳細は、決定次第お知らせ致します。ポスター論文集原稿の形式 1. 締切までにA4用紙1ページのPDF原稿をお送り戴いた場合、原稿をポスター論文集に含めて印刷し、参加者に配布致します。これは義務ではありませんので、ご都合によりPDF原稿をお送り戴かなかった場合でも、当日のポスター発表は可能です。 2. PDFファイルで提出いただければ、記述形式は基本的には自由です。論文のような体裁でも、ポスターの縮刷でもよろしいです。ただし、以下のものを含めて下さるようお願いします。 i. 題名 ii. ポスター番号(採録通知でお知らせします。) iii. 著者名、所属 3. 日本語、または、英語で記述をお願いします。 4. PDFファイルは、あらかじめAcrobat Reader等で表示をご確認ください。 ====================================================================