@@ -5,6 +5,15 @@ title: 计算机视觉
55
66计算机视觉(Computer Vision)是人工智能的一个重要分支,它研究如何让计算机“看”和“理解”图像和视频。也叫机器视觉(Machine Vision)。
77
8+ 除了纯视觉方向外,还有有很多令人兴奋的混合方向!
9+
10+ | 混合方向 | 应用场景 | 核心技术 | 典型案例 |
11+ | ---------| ---------| ---------| ---------|
12+ | ** 视觉 + 自然语言处理** | 图像描述生成、视觉问答、多模态搜索 | Vision Transformer、CLIP、GPT-4V、LLaVA | ChatGPT视觉功能、Google Lens、图片搜索 |
13+ | ** 视觉 + 运动控制** | 自动驾驶、机器人导航、无人机飞行控制 | SLAM、视觉里程计、路径规划 | 特斯拉FSD、波士顿动力机器人、大疆无人机 |
14+ | ** 视觉 + 生物医学** | 疾病诊断、手术导航、药物发现 | CT/MRI图像分析、病理切片分析、三维重建 | 肺结节检测、皮肤癌诊断、眼底病变分析 |
15+ | ** 视觉 + 三维重建** | 建筑建模、文物保护、虚拟旅游 | 立体视觉、结构光、NeRF、3D Gaussian Splatting | iPhone激光雷达、Matterport 3D扫描 |
16+
817早在深度学习之前,人们就开始探索图像的处理了,OpenCV 诞生于深度学习之前,是功能最全面的开源库。它提供了从最基础的图像读写、处理到复杂的特征匹配、目标跟踪、校准等一系列工具。其核心优势在于传统的计算机视觉算法,如图像处理、滤波、形态学操作等。
918
1019它向前承接传统以数组为单位的图像处理,向后允许你加载一些现成的算法、模型,是传统图像处理与深度学习之间重要的桥梁。
@@ -1152,24 +1161,52 @@ cv2.destroyAllWindows()
11521161
11531162## 算法指路
11541163
1164+ 下面是Opencv常用的算法,每个算法都比较复杂且可能随时间变化出现新的算法,因此随用随学即可。
1165+
11551166### HDR
11561167
1168+ HDR(高动态范围)技术主要应用于摄影、监控系统和医学影像中,通过多次曝光融合提升图像细节表现。
1169+
11571170HDR 是一种图像处理技术,用于提高图像的动态范围,使得图像中的高光和阴影细节更加清晰。给定多张不同曝光的图像,通过算法将这些图像融合成一张高动态范围的图像。
11581171
11591172### 全景拼接
11601173
1174+ 全景拼接技术广泛应用于虚拟旅游、房地产展示、地图服务和VR/AR场景构建中。
1175+
11611176可以实现多张图片的拼接,形成一张完整的全景图。支持拼接为环形
11621177
11631178### 对象检测
11641179
1180+ 对象检测算法主要用于自动驾驶、安防监控、零售分析、医疗诊断和工业质检等领域。
1181+
11651182### 对象跟踪
11661183
1184+ 对象跟踪技术应用于视频监控、体感交互、体育分析、无人机导航和增强现实等场景。
1185+
11671186### 人体检测
11681187
1188+ 人体检测算法广泛应用于智能安防、客流统计、健身应用、体感游戏和自动驾驶系统中。
1189+
11691190#### 人体姿态估计
11701191
1192+ 人体姿态估计主要用于健身指导、医疗康复、运动分析、动作捕捉和人机交互界面。
1193+
1194+ #### 手势识别
1195+
1196+ 手势识别技术应用于智能家居控制、手语翻译、VR/AR交互、游戏控制和辅助残障人士交流。
1197+
1198+ #### 动作识别
1199+
1200+ 动作识别算法用于视频内容理解、体育比赛分析、异常行为检测、健身应用和人机交互。
1201+
1202+ #### 行为识别
1203+
1204+ 行为识别技术主要应用于安防监控、智慧城市、客户行为分析、老人看护和异常事件预警。
1205+
11711206#### 人脸检测
11721207
1208+ 人脸检测算法广泛应用于身份验证、考勤系统、社交媒体标记、美颜相机和安防监控中。
1209+
11731210
11741211- 这段程序首先会读取摄像头,并自动截取一定数量的人脸用作训练。
11751212- 然后将截取的人脸进行训练,生成一个训练模型。
@@ -1297,10 +1334,4 @@ if __name__ == "__main__":
12971334 get_face(id = " 1" )
12981335 trainer_face(path = " dataSet" )
12991336 recognizer()
1300- ```
1301-
1302- #### 手势识别
1303-
1304- #### 动作识别
1305-
1306- #### 行为识别
1337+ ```
0 commit comments