English | [中文]
本项目旨在为瑞芯微(Rockchip)系列开发板提供工业级、高性能的计算机视觉(CV)应用方案。目前已支持 RK3588 和 RK3576 平台,主要集成了 YOLOv11 目标检测模型。
项目采用多平台适配架构,各平台代码和环境配置独立管理:
reComputer-RK-CV/
├── docker/ # Docker 镜像配置文件
│ ├── rk3576/ # RK3576 专属 Dockerfile
│ └── rk3588/ # RK3588 专属 Dockerfile
├── src/ # 源码目录
│ ├── rk3576/ # RK3576 源码、模型及依赖库
│ └── rk3588/ # RK3588 源码、模型及依赖库
└── .github/workflows/ # GitHub Actions 自动化构建脚本
| 平台 | 芯片 | 算力 | 镜像名称 |
|---|---|---|---|
| RK3588 | RK3588/RK3588S | 6 TOPS | rk3588-yolo |
| RK3576 | RK3576 | 6 TOPS | rk3576-yolo |
在开发板上执行以下命令安装 Docker:
# 下载安装脚本
curl -fsSL https://get.docker.com -o get-docker.sh
# 使用阿里云镜像源安装
sudo sh get-docker.sh --mirror Aliyun
# 启动 Docker 并设置开机自启
sudo systemctl enable docker
sudo systemctl start docker本项目支持 本地 GUI 与 Web 浏览器 双模式同时预览。程序会自动检测显示器环境,无显示器时自动降级为 Web 模式。
如果您连接了显示器并希望在本地看到窗口:
xhost +local:dockersudo docker pull ghcr.io/seeed-projects/recomputer-rk-cv/rk3588-yolo11:latest
sudo docker pull ghcr.io/seeed-projects/recomputer-rk-cv/rk3576-yolo11:latest
sudo docker pull ghcr.io/seeed-projects/recomputer-rk-cv/rk3588-yolov8-obb:latest
sudo docker pull ghcr.io/seeed-projects/recomputer-rk-cv/rk3576-yolov8-obb:latest针对 RK3588:
sudo docker run --rm --privileged --net=host \
-e PYTHONUNBUFFERED=1 \
-e RKNN_LOG_LEVEL=0 \
--device /dev/video1:/dev/video1 \
--device /dev/dri/renderD129:/dev/dri/renderD129 \
-v /proc/device-tree/compatible:/proc/device-tree/compatible \
ghcr.io/seeed-projects/recomputer-rk-cv/rk3588-yolo11:latest \
python web_detection.py --model_path model/yolo11n.rknn --camera_id 1针对 RK3576:
sudo docker run --rm --privileged --net=host \
-e PYTHONUNBUFFERED=1 \
-e RKNN_LOG_LEVEL=0 \
--device /dev/video0:/dev/video0 \
--device /dev/dri/renderD128:/dev/dri/renderD128 \
-v /proc/device-tree/compatible:/proc/device-tree/compatible \
ghcr.io/seeed-projects/recomputer-rk-cv/rk3576-yolo11:latest \
python web_detection.py --model_path model/yolo11n.rknn --camera_id 0访问方式:http://<开发板IP>:8000
注意: 如果需要自定义类别,可以增加
-v $(pwd)/class_config.txt:/app/class_config.txt \挂载和--class_path参数,程序默认使用 COCO 80 类。
例如:
sudo docker run --rm --privileged --net=host \
-e PYTHONUNBUFFERED=1 \
-e RKNN_LOG_LEVEL=0 \
-v $(pwd)/class_config.txt:/app/class_config.txt \
--device /dev/video1:/dev/video1 \
--device /dev/dri/renderD129:/dev/dri/renderD129 \
-v /proc/device-tree/compatible:/proc/device-tree/compatible \
ghcr.io/seeed-projects/recomputer-rk-cv/rk3588-yolo11:latest \
python web_detection.py --model_path model/yolo11n.rknn --camera_id 1 --class_path class_config.txt本项目提供了兼容 Ultralytics Cloud API 标准的 RESTful 接口,支持通过 HTTP POST 请求上传图片进行目标检测。
Endpoint: POST /api/models/yolo11/predict
file: (可选) 待检测的图片文件。video: (可选) 待检测的 MP4 视频文件。timestamp: (可选) 视频文件的时间戳(单位:秒),返回该时间点的视频帧检测结果。默认为 0。realtime: (可选) 布尔值。若为true或未提供file/video参数,则返回摄像头当前帧的检测结果。conf: (可选) 单次请求的置信度阈值,范围 0.0-1.0。iou: (可选) 单次请求的 NMS IOU 阈值,范围 0.0-1.0。
1. 图片检测:
curl -X POST "http://127.0.0.1:8000/api/models/yolo11/predict" -F "file=@/home/cat/001.jpg"2. 视频特定时间帧检测:
curl -X POST "http://127.0.0.1:8000/api/models/yolo11/predict" -F "video=@/home/cat/test.mp4" -F "timestamp=5.5"3. 获取摄像头当前帧检测:
curl -X POST "http://127.0.0.1:8000/api/models/yolo11/predict" -F "realtime=true"
# 或者不传文件参数
curl -X POST "http://127.0.0.1:8000/api/models/yolo11/predict"{
"success": true,
"source": "video frame at 5.5s",
"predictions": [
{
"class": "person",
"confidence": 0.92,
"box": { "x1": 100, "y1": 200, "x2": 300, "y2": 500 }
}
],
"image": { "width": 1280, "height": 720 }
}用于动态调整实时视频流和默认推理的阈值。
- Endpoint:
GET /api/config - 响应:
{"obj_thresh": 0.25, "nms_thresh": 0.45}
- Endpoint:
POST /api/config - 请求体 (JSON):
{"obj_thresh": 0.3, "nms_thresh": 0.5} - 响应:
{"status": "success"}
运行 web_detection.py 时支持以下参数:
| 参数 | 说明 | 默认值 |
|---|---|---|
--model_path |
RKNN 模型文件路径 | (必填) |
--camera_id |
摄像头设备 ID (如 /dev/video1 则填 1) |
1 |
--video_path |
视频文件路径 (若提供则忽略 camera_id) | None |
--class_path |
自定义类别配置文件路径 (class_config.txt) | None (默认 COCO 80类) |
--host |
Web 服务器监听地址 | 0.0.0.0 |
--port |
Web 服务器端口 | 8000 |
使用双引号命名分类,不同分类之间使用逗号隔开,例如:
"person", "bicycle", "car", "motorbike"
获取带有检测框绘制的实时 MJPEG 视频流,可直接嵌入 HTML <img> 标签。
- Endpoint:
GET /api/video_feed - 使用示例:
<img src="http://<开发板IP>:8000/api/video_feed">
本项目支持通过 GitHub Actions 自动构建多平台镜像。
- 当修改
src/rk3588/目录时,会自动触发rk3588-yolo镜像的构建。 - 当修改
src/rk3576/目录时,会自动触发rk3576-yolo镜像的构建。 - 支持手动触发构建,并可指定
image_tag。
web_detection.py:- 双模支持: 集成 FastAPI,同时支持本地渲染和 MJPEG 流式输出。
- 环境自适应: 自动检测
DISPLAY环境变量,无环境时静默跳过 GUI 初始化。 - RKNN 推理: 封装了 RKNN 初始化、加载模型、多核推理逻辑。
- 动态加载: 支持通过
--class_path动态加载类别配置。 - 后处理: YOLOv11 专用的 Box 解码与 NMS 逻辑。
- 将训练好并转换完成的 .rknn 模型放入相应平台的
model/目录。 - 运行命令时可添加
--model_path参数指向新模型(默认已在 Dockerfile 中配置)。