高性能計算

高性能計算

大規模疎行列の高性能反復計算法

流体計算の圧力ポアソン方程式から導出される連立一次方程式 $A\bm{x}=\bm{b}$ の係数行列 $A$ は大規模疎行列となります。近年の高い演算性能をもつ低Byte/Flop(B/F)アーキテクチャにおいては、行列ベクトル積のナイーブな実装はB/F値 ${}^1$ が高くなるため、低B/F計算機の性能を引き出すことが難しくなっています。そこで、連立一次方程式の解法として高い演算性能とスケーラビリティを達成できる直接法と反復法のハイブリッド解法SLOR-PCR法を提案しました。 提案方法は、シンプルなSOR法を基本反復法とし、多重ループの最内側の三重対角行列の反転に効率的なLU分解を組み合わせています。このとき、LU分解だけではB/F値が高くなるため、Parallel Cyclic Reduction (PCR)法を併用し、演算密度とスケーラビリティを向上させています。

  1. メモリから演算ユニットまでのデータの移動量 (Byte) と演算ユニットでの浮動小数点演算数の比。計算アルゴリズムやハードウェアの特性を表す指標の一つ。

SLOR-PCR法とJacobi, SOR法との性能比較 図 SLOR-PCR法とJacobi, SOR法との性能比較

時間並列計算

性能モニタリング

アプリケーションの実行性能をモニタリングするため、演算部と通信部の時間コストを記録、統計処理した情報を提供するライブラリを開発しました。

GPU計算