We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
There was an error while loading. Please reload this page.
1 parent 919a26d commit bc1a86aCopy full SHA for bc1a86a
docs/06_impl_matmul/README.md
@@ -12,7 +12,7 @@
12
13
同样,网格中的块数可以使用 `gridDim` 变量进行配置。当我们从主机启动一个新的内核时,它会创建一个包含按照指定方式排列的块和线程的单一网格。
14
15
-对于我们的第一个内核,我们将使用 `grid`、`block` 和 `threa` 的层次结构,每个线程计算结果矩阵 C 中的一个元素。该线程将计算矩阵 A 相应行和矩阵 B 相应列的点积,并将结果写入矩阵 C。由于矩阵 C 的每个位置仅由一个线程写入,我们无需进行同步。我们将以以下方式启动内核:
+对于我们的第一个内核,我们将使用 `grid`、`block` 和 `thread` 的层次结构,每个线程计算结果矩阵 C 中的一个元素。该线程将计算矩阵 A 相应行和矩阵 B 相应列的点积,并将结果写入矩阵 C。由于矩阵 C 的每个位置仅由一个线程写入,我们无需进行同步。我们将以以下方式启动内核:
16
17
```cpp
18
#define CEIL_DIV(M, N) (((M) + (N)-1) / (N))
0 commit comments