From 525ba3790092bbed3b40d765c8befda5fd036950 Mon Sep 17 00:00:00 2001
From: zhangjin12138 <33372298+zhangjin12138@users.noreply.github.com>
Date: Fri, 11 Feb 2022 14:05:15 +0800
Subject: [PATCH 1/8] Update ParamsCounter.md

---
 docs/tutorials/CNN/ParamsCounter.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/docs/tutorials/CNN/ParamsCounter.md b/docs/tutorials/CNN/ParamsCounter.md
index dc964dccf..24281a082 100644
--- a/docs/tutorials/CNN/ParamsCounter.md
+++ b/docs/tutorials/CNN/ParamsCounter.md
@@ -16,7 +16,7 @@ shape of weight:  (4, 2, 3, 3)
 shape of bias:  (4,)
 ```
 这里解释一下上面的代码，我们先定义了一个卷积层cv2d，然后输出了这个卷积层的参数的形状，参数包含两部分，分别是weight和bias，这两部分相加才是整个卷积的参数量。因此，可以看到，我们定义的cv2d的参数量为：$4*2*3*3+4 = 76$, 4对应的是输出的通道数，2对应的是输入的通道数，两个3是卷积核的尺寸，最后的4就是bias的数量了， 值得注意的是， bias是数量与输出的通道数保持一致。因此，我们可以得出，一个卷积层的参数量的公式，如下：
-$$ Param_{conv2d} = C_{in} * C_{out} * K_h * K_w + C_{out} $$
+$$Param_{conv2d} = C_{in} * C_{out} * K_h * K_w + C_{out}$$
 其中，$C_{in}$ 表示输入的通道数，$C_{out}$ 表示输出的通道数, $K_h$, $K_w$ 表示卷积核的大小。当然了，有些卷积会将bias设置为False，那么我们不加最后的$C_{out}$即可。
 
 ### 1.2 卷积层FLOPs计算
@@ -86,7 +86,7 @@ moving_variance_initializer $\sigma^2$ 移动方差的初始值设定项。
 ### 2.2 归一化层FLOPs计算
 因为只有两个可以学习的权重，$\beta$ 和 $\gamma$，所以FLOPs只需要2乘以输出通道数和输入的尺寸即可。
 归一化的FLOPs计算公式则为:
-$$ FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw} $$
+$$FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw}$$
 与1.3相似，欢迎大家使用上面的代码进行验证。
 
 ## 3. 线性层

From 32b4d07e2951e704872b3b7e7e26fe69a86b14db Mon Sep 17 00:00:00 2001
From: zhangjin12138 <33372298+zhangjin12138@users.noreply.github.com>
Date: Fri, 11 Feb 2022 14:09:30 +0800
Subject: [PATCH 2/8] Update ParamsCounter.md

---
 docs/tutorials/CNN/ParamsCounter.md | 14 +++++++++++++-
 1 file changed, 13 insertions(+), 1 deletion(-)

diff --git a/docs/tutorials/CNN/ParamsCounter.md b/docs/tutorials/CNN/ParamsCounter.md
index 24281a082..c85ae566e 100644
--- a/docs/tutorials/CNN/ParamsCounter.md
+++ b/docs/tutorials/CNN/ParamsCounter.md
@@ -16,12 +16,16 @@ shape of weight:  (4, 2, 3, 3)
 shape of bias:  (4,)
 ```
 这里解释一下上面的代码，我们先定义了一个卷积层cv2d，然后输出了这个卷积层的参数的形状，参数包含两部分，分别是weight和bias，这两部分相加才是整个卷积的参数量。因此，可以看到，我们定义的cv2d的参数量为：$4*2*3*3+4 = 76$, 4对应的是输出的通道数，2对应的是输入的通道数，两个3是卷积核的尺寸，最后的4就是bias的数量了， 值得注意的是， bias是数量与输出的通道数保持一致。因此，我们可以得出，一个卷积层的参数量的公式，如下：
+
 $$Param_{conv2d} = C_{in} * C_{out} * K_h * K_w + C_{out}$$
+
 其中，$C_{in}$ 表示输入的通道数，$C_{out}$ 表示输出的通道数, $K_h$, $K_w$ 表示卷积核的大小。当然了，有些卷积会将bias设置为False，那么我们不加最后的$C_{out}$即可。
 
 ### 1.2 卷积层FLOPs计算
 参数量会计算了，那么FLOPs其实也是很简单的，就一个公式：
+
 $$FLOP_{conv2d} = Param_{conv2d} * M_{outh} * M_{outw}$$
+
 这里，$M_{outh}$，$M_{outw}$ 为输出的特征图的高和宽，而不是输入的，这里需要注意一下。
 
 ### 1.3 卷积层参数计算示例
@@ -73,7 +77,9 @@ $\quad\quad\quad y_i\gets\gamma\hat{x}_i+\beta\equiv BN_{\gamma}$,$\beta(x_i)$
 
 ### 2.1 归一化层参数量计算
 由于归一化层较为简单，这里直接写出公式：
+
 $$Param_{bn2d} = 4 * C_{out} $$
+
 其中4表示四个参数值，每个特征图对应一组四个元素的参数组合；
 
 beta_initializer $\beta$ 权重的初始值设定项。
@@ -86,14 +92,19 @@ moving_variance_initializer $\sigma^2$ 移动方差的初始值设定项。
 ### 2.2 归一化层FLOPs计算
 因为只有两个可以学习的权重，$\beta$ 和 $\gamma$，所以FLOPs只需要2乘以输出通道数和输入的尺寸即可。
 归一化的FLOPs计算公式则为:
+
 $$FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw}$$
+
 与1.3相似，欢迎大家使用上面的代码进行验证。
 
 ## 3. 线性层
 线性层也是常用的分类层了，我们以飞桨的Linear为例来介绍。
 ### 3.1 线性层参数量计算
 其实线性层是比较简单的，它就是相当于卷积核为1的卷积层，线性层的每一个参数与对应的数据进行矩阵相乘，再加上偏置项bias，线性层没有类似于卷积层的“卷”的操作的，所以计算公式如下：
-$$Param_{linear} = C_{in} * C_{out}  + C_{out} $$。我们这里打印一下线性层参数的形状看看。
+
+$$Param_{linear} = C_{in} * C_{out}  + C_{out} $$。
+
+我们这里打印一下线性层参数的形状看看。
 ```python
 import paddle
 import numpy as np
@@ -108,6 +119,7 @@ shape of bias:  (4,)
 可以看到，线性层相较于卷积层还是简单的，这里我们直接计算这个定义的线性层的参数量为 $2 * 4 + 4 = 12$。具体对不对，我们在下面的实例演示中检查。
 ### 3.2 线性层FLOPs计算
 与卷积层不同的是，线性层没有”卷“的过程，所以线性层的FLOPs计算公式为:
+
 $$ FLOP_{linear} = C_{in} * C_{out}$$
 
 ## 4. 实例演示

From 3dee46d36291c39b4a746dc75f3f3bdb42f300ba Mon Sep 17 00:00:00 2001
From: zhangjin12138 <33372298+zhangjin12138@users.noreply.github.com>
Date: Fri, 11 Feb 2022 14:10:54 +0800
Subject: [PATCH 3/8] Update ParamsCounter.md

---
 docs/tutorials/CNN/ParamsCounter.md | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/docs/tutorials/CNN/ParamsCounter.md b/docs/tutorials/CNN/ParamsCounter.md
index c85ae566e..017f95c99 100644
--- a/docs/tutorials/CNN/ParamsCounter.md
+++ b/docs/tutorials/CNN/ParamsCounter.md
@@ -17,14 +17,14 @@ shape of bias:  (4,)
 ```
 这里解释一下上面的代码，我们先定义了一个卷积层cv2d，然后输出了这个卷积层的参数的形状，参数包含两部分，分别是weight和bias，这两部分相加才是整个卷积的参数量。因此，可以看到，我们定义的cv2d的参数量为：$4*2*3*3+4 = 76$, 4对应的是输出的通道数，2对应的是输入的通道数，两个3是卷积核的尺寸，最后的4就是bias的数量了， 值得注意的是， bias是数量与输出的通道数保持一致。因此，我们可以得出，一个卷积层的参数量的公式，如下：
 
-$$Param_{conv2d} = C_{in} * C_{out} * K_h * K_w + C_{out}$$
+$Param_{conv2d} = C_{in} * C_{out} * K_h * K_w + C_{out}$
 
 其中，$C_{in}$ 表示输入的通道数，$C_{out}$ 表示输出的通道数, $K_h$, $K_w$ 表示卷积核的大小。当然了，有些卷积会将bias设置为False，那么我们不加最后的$C_{out}$即可。
 
 ### 1.2 卷积层FLOPs计算
 参数量会计算了，那么FLOPs其实也是很简单的，就一个公式：
 
-$$FLOP_{conv2d} = Param_{conv2d} * M_{outh} * M_{outw}$$
+$FLOP_{conv2d} = Param_{conv2d} * M_{outh} * M_{outw}$
 
 这里，$M_{outh}$，$M_{outw}$ 为输出的特征图的高和宽，而不是输入的，这里需要注意一下。
 
@@ -78,7 +78,7 @@ $\quad\quad\quad y_i\gets\gamma\hat{x}_i+\beta\equiv BN_{\gamma}$,$\beta(x_i)$
 ### 2.1 归一化层参数量计算
 由于归一化层较为简单，这里直接写出公式：
 
-$$Param_{bn2d} = 4 * C_{out} $$
+$Param_{bn2d} = 4 * C_{out}$
 
 其中4表示四个参数值，每个特征图对应一组四个元素的参数组合；
 
@@ -93,7 +93,7 @@ moving_variance_initializer $\sigma^2$ 移动方差的初始值设定项。
 因为只有两个可以学习的权重，$\beta$ 和 $\gamma$，所以FLOPs只需要2乘以输出通道数和输入的尺寸即可。
 归一化的FLOPs计算公式则为:
 
-$$FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw}$$
+$FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw}$
 
 与1.3相似，欢迎大家使用上面的代码进行验证。
 
@@ -102,7 +102,7 @@ $$FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw}$$
 ### 3.1 线性层参数量计算
 其实线性层是比较简单的，它就是相当于卷积核为1的卷积层，线性层的每一个参数与对应的数据进行矩阵相乘，再加上偏置项bias，线性层没有类似于卷积层的“卷”的操作的，所以计算公式如下：
 
-$$Param_{linear} = C_{in} * C_{out}  + C_{out} $$。
+$Param_{linear} = C_{in} * C_{out}  + C_{out}$。
 
 我们这里打印一下线性层参数的形状看看。
 ```python
@@ -120,7 +120,7 @@ shape of bias:  (4,)
 ### 3.2 线性层FLOPs计算
 与卷积层不同的是，线性层没有”卷“的过程，所以线性层的FLOPs计算公式为:
 
-$$ FLOP_{linear} = C_{in} * C_{out}$$
+$FLOP_{linear} = C_{in} * C_{out}$
 
 ## 4. 实例演示
 这里我们就以LeNet为例子，计算出LeNet的所有参数量和计算量。LeNet的结构如下。输入的图片大小为28 * 28

From af0cde3b2a9acd8c12e618d0ef0f5313935876ca Mon Sep 17 00:00:00 2001
From: zhangjin12138 <33372298+zhangjin12138@users.noreply.github.com>
Date: Fri, 11 Feb 2022 14:12:41 +0800
Subject: [PATCH 4/8] Update ParamsCounter.md


From a792fc238fd07566c8152800a8e47af4a598e1d6 Mon Sep 17 00:00:00 2001
From: zhangjin12138 <33372298+zhangjin12138@users.noreply.github.com>
Date: Fri, 11 Feb 2022 16:32:29 +0800
Subject: [PATCH 5/8] Update ParamsCounter.md
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

修改部分显示错误的bug

From bf0285e5aa1368e78ce9b7e474d9746b63e3f31d Mon Sep 17 00:00:00 2001
From: zhangjin12138 <33372298+zhangjin12138@users.noreply.github.com>
Date: Sun, 13 Feb 2022 14:08:14 +0800
Subject: [PATCH 6/8] Update ParamsCounter.md

---
 docs/tutorials/CNN/ParamsCounter.md | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/docs/tutorials/CNN/ParamsCounter.md b/docs/tutorials/CNN/ParamsCounter.md
index 017f95c99..eb080002d 100644
--- a/docs/tutorials/CNN/ParamsCounter.md
+++ b/docs/tutorials/CNN/ParamsCounter.md
@@ -17,14 +17,14 @@ shape of bias:  (4,)
 ```
 这里解释一下上面的代码，我们先定义了一个卷积层cv2d，然后输出了这个卷积层的参数的形状，参数包含两部分，分别是weight和bias，这两部分相加才是整个卷积的参数量。因此，可以看到，我们定义的cv2d的参数量为：$4*2*3*3+4 = 76$, 4对应的是输出的通道数，2对应的是输入的通道数，两个3是卷积核的尺寸，最后的4就是bias的数量了， 值得注意的是， bias是数量与输出的通道数保持一致。因此，我们可以得出，一个卷积层的参数量的公式，如下：
 
-$Param_{conv2d} = C_{in} * C_{out} * K_h * K_w + C_{out}$
+$$ Param_{conv2d} = C_{in} * C_{out} * K_h * K_w + C_{out} $$
 
 其中，$C_{in}$ 表示输入的通道数，$C_{out}$ 表示输出的通道数, $K_h$, $K_w$ 表示卷积核的大小。当然了，有些卷积会将bias设置为False，那么我们不加最后的$C_{out}$即可。
 
 ### 1.2 卷积层FLOPs计算
 参数量会计算了，那么FLOPs其实也是很简单的，就一个公式：
 
-$FLOP_{conv2d} = Param_{conv2d} * M_{outh} * M_{outw}$
+$$ FLOP_{conv2d} = Param_{conv2d} * M_{outh} * M_{outw} $$
 
 这里，$M_{outh}$，$M_{outw}$ 为输出的特征图的高和宽，而不是输入的，这里需要注意一下。
 
@@ -78,7 +78,7 @@ $\quad\quad\quad y_i\gets\gamma\hat{x}_i+\beta\equiv BN_{\gamma}$,$\beta(x_i)$
 ### 2.1 归一化层参数量计算
 由于归一化层较为简单，这里直接写出公式：
 
-$Param_{bn2d} = 4 * C_{out}$
+$$ Param_{bn2d} = 4 * C_{out} $$
 
 其中4表示四个参数值，每个特征图对应一组四个元素的参数组合；
 
@@ -93,7 +93,7 @@ moving_variance_initializer $\sigma^2$ 移动方差的初始值设定项。
 因为只有两个可以学习的权重，$\beta$ 和 $\gamma$，所以FLOPs只需要2乘以输出通道数和输入的尺寸即可。
 归一化的FLOPs计算公式则为:
 
-$FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw}$
+$$ FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw} $$
 
 与1.3相似，欢迎大家使用上面的代码进行验证。
 
@@ -102,7 +102,7 @@ $FLOP_{bn2d} = 2 * C_{out} * M_{outh} * M_{outw}$
 ### 3.1 线性层参数量计算
 其实线性层是比较简单的，它就是相当于卷积核为1的卷积层，线性层的每一个参数与对应的数据进行矩阵相乘，再加上偏置项bias，线性层没有类似于卷积层的“卷”的操作的，所以计算公式如下：
 
-$Param_{linear} = C_{in} * C_{out}  + C_{out}$。
+$$ Param_{linear} = C_{in} * C_{out}  + C_{out} $$
 
 我们这里打印一下线性层参数的形状看看。
 ```python
@@ -120,7 +120,7 @@ shape of bias:  (4,)
 ### 3.2 线性层FLOPs计算
 与卷积层不同的是，线性层没有”卷“的过程，所以线性层的FLOPs计算公式为:
 
-$FLOP_{linear} = C_{in} * C_{out}$
+$$ FLOP_{linear} = C_{in} * C_{out} $$
 
 ## 4. 实例演示
 这里我们就以LeNet为例子，计算出LeNet的所有参数量和计算量。LeNet的结构如下。输入的图片大小为28 * 28

From 6872f16c10c24dee720e224444a6c69ee255b60b Mon Sep 17 00:00:00 2001
From: zhangjin12138 <33372298+zhangjin12138@users.noreply.github.com>
Date: Sun, 13 Feb 2022 14:13:16 +0800
Subject: [PATCH 7/8] Update ParamsCounter.md

change according the suggestions

From 3e7b879bd6e47c684a0ff9777c8f097e99fe0c79 Mon Sep 17 00:00:00 2001
From: zhangjin12138 <33372298+zhangjin12138@users.noreply.github.com>
Date: Sun, 13 Feb 2022 14:16:17 +0800
Subject: [PATCH 8/8] Update ParamsCounter.md
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

127行去掉python
---
 docs/tutorials/CNN/ParamsCounter.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/tutorials/CNN/ParamsCounter.md b/docs/tutorials/CNN/ParamsCounter.md
index eb080002d..2c08cc27a 100644
--- a/docs/tutorials/CNN/ParamsCounter.md
+++ b/docs/tutorials/CNN/ParamsCounter.md
@@ -124,7 +124,7 @@ $$ FLOP_{linear} = C_{in} * C_{out} $$
 
 ## 4. 实例演示
 这里我们就以LeNet为例子，计算出LeNet的所有参数量和计算量。LeNet的结构如下。输入的图片大小为28 * 28
-```python
+```
 LeNet(
   (features): Sequential(
     (0): Conv2D(1, 6, kernel_size=[3, 3], padding=1, data_format=NCHW)