|
早稲田大学
木村 啓二
教授
機関別共同研究
Discovery Saga
論文分野別Discovery Saga
研究テーマDiscovery Saga
協賛企業
共同研究先:Meisei University
Academic
共同研究数 1
Conference Paper
2016
Springer
Coarse grain task parallelization of earthquake simulator GMS using OSCAR compiler on various Cc-NUMA servers
OSCARコンパイラを用いた地震シミュレータGMSのCc-NUMA各サーバ上での粗粒タスク並列化
Mamoru Shimaoka, Yasutaka Wada, Keiji Kimura, Hironori Kasahara
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
【抄録】
This paper proposes coarse grain task parallelization for a earthquake simulation program using Finite Difference Method to solve the wave equations in 3-D heterogeneous structure or the Ground Motion Simulator (GMS) on various cc-NUMA servers using IBM, Intel and Fujitsu multicore processors. The GMS has been developed by the National Research Institute for Earth Science and Disaster Prevention (NIED) in Japan. Earthquake wave propagation simulations are important numerical applications to save lives through damage predictions of residential areas by earthquakes. Parallel processing with strong scaling has been required to precisely calculate the simulations quickly. The proposed method uses the OSCAR compiler for exploiting coarse grain task parallelism efficiently to get scalable speed-ups with strong scaling. The OSCAR compiler can analyze data dependence and control dependence among coarse grain tasks, such as subroutines, loops and basic blocks. Moreover, locality optimizations considering the boundary calculations of FDM and a new static scheduler that enables more efficient task schedulings on cc-NUMA servers are presented. The performance evaluation shows 110 times speed-up using 128 cores against the sequential execution on a POWER7 based 128 cores cc-NUMA server Hitachi SR16000 VM1, 37.2 times speed-up using 64 cores against the sequential execution on a Xeon E7-8830 based 64 cores cc-NUMA server BS2000, 19.8 times speed-up using 32 cores against the sequential execution on a Xeon X7560 based 32 cores cc-NUMA server HA8000/RS440, 99.3 times speed-up using 128 cores against the sequential execution on a SPARC64 VII based 256 cores cc-NUMA server Fujitsu M9000, 9.42 times speed-up using 12 cores against the sequential execution on a POWER8 based 12 cores cc-NUMA server Power System S812L. © Springer International Publishing Switzerland 2016.
【抄録日本語訳】
本論文では、3次元非均質構造中の波動方程式を解く有限差分法を用いた地震シミュレーションプログラム、または地盤変動シミュレータ(GMS)の粗視化タスク並列化をIBM、Intel、富士通のマルチコアプロセッサを用いたcc-NUMAサーバー上で実現することを提案するものです。GMSは、日本の防災科学技術研究所(NIED)によって開発されたものです。地震波動伝播シミュレーションは、地震による住宅地の被害予測を通じて人命を救うための重要な数値計算アプリケーションです。このシミュレーションを高速に精密に計算するためには、強力なスケーリングが可能な並列処理が必要とされてきました。提案手法では、OSCARコンパイラを用いて粗視化タスク並列を効率的に利用し、強力なスケーリングによるスケーラブルな高速化を実現します。OSCARコンパイラは、サブルーチン、ループ、基本ブロックなどの粗視化タスク間のデータ依存性、制御依存性を解析することができます。さらに、FDMの境界計算を考慮した局所性最適化、およびcc-NUMAサーバ上でより効率的なタスクスケジューリングを可能にする新しい静的スケジューラも紹介されています。性能評価では、POWER7ベースの128コアcc-NUMAサーバHitachi SR16000 VM1での逐次実行に対して128コアで110倍、Xeon E7-8830ベースの64コアcc-NUMAサーバBS2000での逐次実行に対して64コアで37.2倍、19.2倍の高速化を達成しました。 8倍、Xeon X7560ベースの32コアcc-NUMAサーバーHA8000/RS440のシーケンシャル実行に対して128コアで99.3倍、SPARC64 VIIベースの256コアcc-NUMAサーバー富士通M9000のシーケンシャル実行に対して12コアで9.42倍の高速化、Power8ベースの12コアcc-NUMAサーバーPower System S812Lで順次実行の高速化。© Springer International Publishing Switzerland 2016.