Skip to content

Commit edcbcf3

Browse files
📝 更新计算机视觉文档,增加混合方向和算法介绍
- 在计算机视觉章节中新增了关于视觉与自然语言处理、运动控制、生物医学、三维重建等混合方向的应用场景和核心技术的详细说明。 - 删除了冗余的闲来无事和ROS 2相关文档,优化了文档结构。 - 更新了算法指路部分,增加了HDR、全景拼接、对象检测、跟踪、人体检测等算法的应用场景和技术细节,提升了文档的实用性和可读性。
1 parent 979f191 commit edcbcf3

File tree

9 files changed

+999
-794
lines changed

9 files changed

+999
-794
lines changed

blog/2025-7-30.md

Lines changed: 961 additions & 0 deletions
Large diffs are not rendered by default.

docs/docs/机器学习/计算机视觉/index.mdx

Lines changed: 38 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -5,6 +5,15 @@ title: 计算机视觉
55

66
计算机视觉(Computer Vision)是人工智能的一个重要分支,它研究如何让计算机“看”和“理解”图像和视频。也叫机器视觉(Machine Vision)。
77

8+
除了纯视觉方向外,还有有很多令人兴奋的混合方向!
9+
10+
| 混合方向 | 应用场景 | 核心技术 | 典型案例 |
11+
|---------|---------|---------|---------|
12+
| **视觉 + 自然语言处理** | 图像描述生成、视觉问答、多模态搜索 | Vision Transformer、CLIP、GPT-4V、LLaVA | ChatGPT视觉功能、Google Lens、图片搜索 |
13+
| **视觉 + 运动控制** | 自动驾驶、机器人导航、无人机飞行控制 | SLAM、视觉里程计、路径规划 | 特斯拉FSD、波士顿动力机器人、大疆无人机 |
14+
| **视觉 + 生物医学** | 疾病诊断、手术导航、药物发现 | CT/MRI图像分析、病理切片分析、三维重建 | 肺结节检测、皮肤癌诊断、眼底病变分析 |
15+
| **视觉 + 三维重建** | 建筑建模、文物保护、虚拟旅游 | 立体视觉、结构光、NeRF、3D Gaussian Splatting | iPhone激光雷达、Matterport 3D扫描 |
16+
817
早在深度学习之前,人们就开始探索图像的处理了,OpenCV 诞生于深度学习之前,是功能最全面的开源库。它提供了从最基础的图像读写、处理到复杂的特征匹配、目标跟踪、校准等一系列工具。其核心优势在于传统的计算机视觉算法,如图像处理、滤波、形态学操作等。
918

1019
它向前承接传统以数组为单位的图像处理,向后允许你加载一些现成的算法、模型,是传统图像处理与深度学习之间重要的桥梁。
@@ -1152,24 +1161,52 @@ cv2.destroyAllWindows()
11521161

11531162
## 算法指路
11541163

1164+
下面是Opencv常用的算法,每个算法都比较复杂且可能随时间变化出现新的算法,因此随用随学即可。
1165+
11551166
### HDR
11561167

1168+
HDR(高动态范围)技术主要应用于摄影、监控系统和医学影像中,通过多次曝光融合提升图像细节表现。
1169+
11571170
HDR 是一种图像处理技术,用于提高图像的动态范围,使得图像中的高光和阴影细节更加清晰。给定多张不同曝光的图像,通过算法将这些图像融合成一张高动态范围的图像。
11581171

11591172
### 全景拼接
11601173

1174+
全景拼接技术广泛应用于虚拟旅游、房地产展示、地图服务和VR/AR场景构建中。
1175+
11611176
可以实现多张图片的拼接,形成一张完整的全景图。支持拼接为环形
11621177

11631178
### 对象检测
11641179

1180+
对象检测算法主要用于自动驾驶、安防监控、零售分析、医疗诊断和工业质检等领域。
1181+
11651182
### 对象跟踪
11661183

1184+
对象跟踪技术应用于视频监控、体感交互、体育分析、无人机导航和增强现实等场景。
1185+
11671186
### 人体检测
11681187

1188+
人体检测算法广泛应用于智能安防、客流统计、健身应用、体感游戏和自动驾驶系统中。
1189+
11691190
#### 人体姿态估计
11701191

1192+
人体姿态估计主要用于健身指导、医疗康复、运动分析、动作捕捉和人机交互界面。
1193+
1194+
#### 手势识别
1195+
1196+
手势识别技术应用于智能家居控制、手语翻译、VR/AR交互、游戏控制和辅助残障人士交流。
1197+
1198+
#### 动作识别
1199+
1200+
动作识别算法用于视频内容理解、体育比赛分析、异常行为检测、健身应用和人机交互。
1201+
1202+
#### 行为识别
1203+
1204+
行为识别技术主要应用于安防监控、智慧城市、客户行为分析、老人看护和异常事件预警。
1205+
11711206
#### 人脸检测
11721207

1208+
人脸检测算法广泛应用于身份验证、考勤系统、社交媒体标记、美颜相机和安防监控中。
1209+
11731210

11741211
- 这段程序首先会读取摄像头,并自动截取一定数量的人脸用作训练。
11751212
- 然后将截取的人脸进行训练,生成一个训练模型。
@@ -1297,10 +1334,4 @@ if __name__ == "__main__":
12971334
get_face(id="1")
12981335
trainer_face(path="dataSet")
12991336
recognizer()
1300-
```
1301-
1302-
#### 手势识别
1303-
1304-
#### 动作识别
1305-
1306-
#### 行为识别
1337+
```

docs/docs/闲来无事/ROS 2/index.md

Lines changed: 0 additions & 168 deletions
This file was deleted.

0 commit comments

Comments
 (0)