Ниже победители по задачам курса GPGPU 2025.
Замеры делались на NVIDIA Tesla T4: 8.1 TFLOPS FP32, 320 GBytes/s peak memory bandwidth.
Task 03. Matrix Multiplication
Place
Participant
Team
Result
API
Link
1
Роберт Смайт
СПбГУ
4927.92 GFlops
CUDA, WMMA
PR #357
2
Mikhail Stulov
МФТИ / ТБанк
4802.43 GFlops
CUDA, WMMA
PR #399
3
Хулиган Серега
ИТМО
4682.12 GFlops
OpenCL
PR #309
Place
Participant
Team
Result
API
Link
1
Роберт Смайт
СПбГУ
108.15 GB/s
CUDA
PR #478
2
Илья Коннов
ИТМО / Яндекс
92.98 GB/s
OpenCL
PR #499
3
Mikhail Stulov
МФТИ / ТБанк
89.48 GB/s
OpenCL
PR #474
Place
Participant
Team
Result
API
Link
1
Роберт Смайт
СПбГУ
1553 uint millions/s
CUDA
PR #545
2
Andrew Ratkov
СПбГУ
451 uint millions/s
OpenCL
PR #568
3
Pribytkov Fedor
СПбГУ
257 uint millions/s
OpenCL
PR #569
Place
Participant
Team
Result
API
Link
1
Артём Батыгин
ВШЭ
655 uint millions/s
OpenCL
PR #639
2
Mikhail Stulov
МФТИ / ТБанк
609 uint millions/s
OpenCL
PR #645
3
Роберт Смайт
СПбГУ
595 uint millions/s
CUDA
PR #625
Place
Participant
Team
Result (average over 5 cases)
API
Link
1
Артём Батыгин
ВШЭ
8722.14 uint millions/s
OpenCL
PR #666 comment
2
Вячеслав Григорович
ИТМО
8261.34 uint millions/s
OpenCL
PR #680 comment
3
Тяньшэн Цю
ИТМО
7648.75 uint millions/s
OpenCL
PR #647 comment
Place
Participant
Team
Result
API
Link
1
Тяньшэн Цю
ITMO Team
40183 coolness = 139 MTris/s x 290 MRays/s
OpenCL
PR #812
2
Ostapenko Vladislav
HSE Team
34832 coolness = 165 MTris/s x 212 MRays/s
OpenCL
PR #803
3
Sanan Kornyakov
HSE Team
19683 coolness = 83 MTris/s x 238 MRays/s
OpenCL
PR #813