Skip to content

Commit 6c490d4

Browse files
committed
Update public notes
1 parent 2ed1b82 commit 6c490d4

File tree

3 files changed

+38
-0
lines changed

3 files changed

+38
-0
lines changed

content/YOLO 论文阅读笔记.md

Lines changed: 34 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -10,5 +10,39 @@ YOLO很快,更快的速度换来的是更多的定位错误——但是很少
1010

1111
有一定的开放性(比DPM和R-CNN更能表示图像)
1212

13+
## Introduction
14+
Current detection systems repurpose classifiers to per-
15+
form detection. To detect an object, these systems take a
16+
classifier for that object and evaluate it at various locations
17+
and scales in a test image. Systems like deformable parts
18+
models (DPM) use a sliding window approach where the
19+
classifier is run at evenly spaced locations over the entire
20+
image [10].
21+
先前的目标检测有两种办法。一种是以**滑动窗口在均匀间隔上分类**来实现的DPM模型,另一种是以**区域启发算法(region proposal method)** 来实现的R-CNN。
22+
23+
YOLO采用了不同的思路:将目标检测任务看成回归问题,直接从图片像素上定位出边框和类别(而不是采用多个模型)。
24+
25+
## Unified Detection
26+
*simultaneously adv.同时*
27+
28+
妈耶,这么简单,我竟然看懂了。
29+
30+
YOLO的设计是支持[[端到端学习:End To End Learning|端到端学习]]的,并且达到实时的同时还能获得高平均准确度。
31+
32+
YOLO的方法是这样的:
33+
34+
首先将输入图片切分成 $S \times S$ 网格。如果物体的中心落在网格内,则说**物体是落在网格内的**
35+
36+
其次,对网格中每个单元格都预测$B$个边框和这些边框的可信度(Confidence)。可信度反应了边框中是否有物体(注意和类型无关)以及边框是否和实际的标签的边框相符合。通常将可信度定义为$Pr(Object)*IOU_{pred}^{truth}$。如果单元格没有物体,则可信度应该0。
37+
38+
每个边框可以用五个特征描述:$x,y,w,h$还有可信度。$x,y$代表框中心的坐标,$w,h$代表框的宽度和高度。可信度代表预测框和实际标签框的IOU。
39+
40+
此外,每个单元格还预测了C个类别的概率(分类器)$Pr(Class_i|Object)$。**这些概率都是基于单元格是否含有这个物体这一条件,而不是和上面预测的边框有关。**
41+
42+
在测试时,将连续的某类类别概率$Pr(Class_{i}|Object)$乘上边框的可信度预测$Pr(Object)*IOU_{pred}^{truth}$,可以得到:
43+
$$Pr(Class_{i}|Object) * Pr(Object) * IOU^{truth}_{pred} = Pr(Class_{i}) * IOU^{truth}_{pred}$$
44+
45+
……
46+
1347
## Conclusion
1448
结构简单。可以直接在整张图上训练。检测和分类直接在一个损失函数上训练。Fast YOLO很快,模型推广性很好。
File renamed without changes.
Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,4 @@
1+
2+
3+
## 参考资料
4+
[深度学习笔记:What is End To End Learning ? - 知乎](https://zhuanlan.zhihu.com/p/364907546

0 commit comments

Comments
 (0)