Software Design 2021年4月号掲載の「ディープラーニングではじめるソフトウェア高速化入門 第6回」のサンプルコードです。
- Ubuntu 18.04 LTS
- CUDA Toolkit 10.0
各サブディレクトリ中で make コマンドを実行することで対応するプログラムがビルドされます。
- 愚直に実装されたGPU版行列積です。
- 行列サイズはコマンドライン引数として指定します。
./matmul 2048- レジスタブロッキングを行ったGPU版行列積です。
- 行列サイズはコマンドライン引数として指定します。
./matmul 2048- cuBLASを利用したGPU版行列積です。
- 行列サイズはコマンドライン引数として指定します。
./matmul 2048- 平櫛 貴章 (株式会社フィックスターズ)
- Apache License 2.0