OCR C API

基于 ocr-rs 库的 C 语言接口，提供简单易用的 OCR 功能。

特性

三层 API 设计：从底层到高层，满足不同需求
零重复初始化：模型只需加载一次，可重复使用
高性能：原生 Rust 实现，支持多线程和 GPU 加速
跨平台：支持 macOS、Linux、Windows、iOS、Android

API 层级

1. 便捷 API（推荐）

最简单的使用方式，直接传入图片路径：

// 创建引擎（只需一次）
OcrEngineHandle* engine = ocr_engine_create(
    "det.mnn", "rec.mnn", "keys.txt", NULL);

// 识别图片
OcrResultList result = ocr_engine_recognize_file(engine, "test.jpg");

// 遍历结果
for (size_t i = 0; i < result.count; i++) {
    printf("文本: %s, 置信度: %.2f%%\n",
           result.items[i].text,
           result.items[i].confidence * 100);
    printf("位置: (%d, %d, %u, %u)\n",
           result.items[i].bbox.x,
           result.items[i].bbox.y,
           result.items[i].bbox.width,
           result.items[i].bbox.height);
}

// 释放资源
ocr_result_list_free(&result);
ocr_engine_destroy(engine);

2. 普通 API

接收 RGB/RGBA 原始数据：

// 从图片库获取 RGB 数据
unsigned char* rgb_data = load_image_as_rgb("test.jpg", &width, &height);

// 识别
OcrResultList result = ocr_engine_recognize_rgb(engine, rgb_data, width, height);

// 或者 RGBA 数据
OcrResultList result = ocr_engine_recognize_rgba(engine, rgba_data, width, height);

3. 底层 API

分别控制检测和识别模型：

// 创建检测模型
DetModelHandle* det = ocr_det_model_create("det.mnn", NULL);

// 检测文本区域
DetResultList det_result = ocr_det_model_detect(det, rgb_data, width, height);

// 创建识别模型
RecModelHandle* rec = ocr_rec_model_create("rec.mnn", "keys.txt", NULL);

// 对每个检测到的区域进行识别
for (size_t i = 0; i < det_result.count; i++) {
    // 裁剪区域...
    RecResult rec_result = ocr_rec_model_recognize(rec, cropped_rgb, w, h);
    printf("文本: %s\n", rec_result.text);
    ocr_rec_result_free(&rec_result);
}

// 释放资源
ocr_det_result_free(&det_result);
ocr_det_model_destroy(det);
ocr_rec_model_destroy(rec);

配置选项

// 默认配置
OcrConfig config = ocr_config_default();

// 快速模式（牺牲一些精度换取速度）
OcrConfig config = ocr_config_fast();

// GPU 模式
OcrConfig config = ocr_config_gpu();

// 自定义配置
OcrConfig config = ocr_config_default();
config.backend = OCR_BACKEND_METAL;  // macOS GPU
config.thread_count = 8;
config.det_max_side_len = 1280;
config.min_result_confidence = 0.7;

编译

编译库

cd ocr_capi
cargo build --release

生成的动态库位于 target/release/:

macOS: libocr_capi.dylib
Linux: libocr_capi.so
Windows: ocr_capi.dll
iOS: libocr_capi.a (静态库) / OcrCapi.xcframework (XCFramework)
Android: libocr_capi.so (位于对应 ABI 目录下)

iOS 交叉编译

# 设备 (arm64)
cargo build --release --target aarch64-apple-ios

# 模拟器 (arm64)
cargo build --release --target aarch64-apple-ios-sim

# 模拟器 (x86_64)
cargo build --release --target x86_64-apple-ios

如需支持 Metal GPU 加速：

cargo build --release --target aarch64-apple-ios --features metal

CI 会自动打包 XCFramework，可以直接拖入 Xcode 项目使用。

Android 交叉编译

需要 Android NDK，设置 ANDROID_NDK_ROOT 环境变量后：

# arm64-v8a
cargo build --release --target aarch64-linux-android

# armeabi-v7a
cargo build --release --target armv7-linux-androideabi

# x86_64
cargo build --release --target x86_64-linux-android

# x86
cargo build --release --target i686-linux-android

生成的 .so 文件放入 Android 项目的 jniLibs/<abi>/ 目录中使用。

GPU 加速特性

# iOS/macOS Metal 加速
cargo build --release --features metal

# iOS/macOS CoreML 加速
cargo build --release --features coreml

# Android/Linux OpenCL 加速
cargo build --release --features opencl

# Vulkan 加速 (跨平台)
cargo build --release --features vulkan

编译示例

# macOS/Linux
gcc -o example examples/example.c -L../target/release -locr_capi -Iinclude

# 运行
./example models/det.mnn models/rec.mnn models/keys.txt test.jpg

内存管理

所有返回的指针都需要手动释放：

函数	释放函数
`ocr_engine_create`	`ocr_engine_destroy`
`ocr_det_model_create`	`ocr_det_model_destroy`
`ocr_rec_model_create`	`ocr_rec_model_destroy`
`ocr_engine_recognize_*`	`ocr_result_list_free`
`ocr_det_model_detect`	`ocr_det_result_free`
`ocr_rec_model_recognize`	`ocr_rec_result_free`
`ocr_get_last_error`	`ocr_free_string`

错误处理

OcrEngineHandle* engine = ocr_engine_create(...);
if (!engine) {
    char* error = ocr_get_last_error();
    fprintf(stderr, "创建引擎失败: %s\n", error);
    ocr_free_string(error);
    return -1;
}

线程安全

每个 Handle（引擎/模型）在单线程内使用是安全的
多线程使用时，建议每个线程创建独立的 Handle
或者使用外部锁保护共享的 Handle

性能建议

复用引擎：创建一次 OcrEngineHandle，多次调用识别函数
批量处理：多张图片使用同一个引擎
GPU 加速：在支持的平台使用 ocr_config_gpu()
调整参数：根据实际需求调整 det_max_side_len 和 min_result_confidence

完整 API 参考

参见 include/ocr_capi.h

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.cargo		.cargo
.github/workflows		.github/workflows
examples		examples
include		include
src		src
.gitignore		.gitignore
Cargo.toml		Cargo.toml
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OCR C API

特性

API 层级

1. 便捷 API（推荐）

2. 普通 API

3. 底层 API

配置选项

编译

编译库

iOS 交叉编译

Android 交叉编译

GPU 加速特性

编译示例

内存管理

错误处理

线程安全

性能建议

完整 API 参考

About

Uh oh!

Releases 3

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

OCR C API

特性

API 层级

1. 便捷 API（推荐）

2. 普通 API

3. 底层 API

配置选项

编译

编译库

iOS 交叉编译

Android 交叉编译

GPU 加速特性

编译示例

内存管理

错误处理

线程安全

性能建议

完整 API 参考

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 3

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages