Skip to content

引入其他开源PDF OCR项目用于扫描件PDF的识别 #634

@HonorWater

Description

@HonorWater

MaxKB 版本

v1.2.0

请描述您的需求或者改进建议

首先感谢开发者开源这么好的项目!
有很多的PDF文档都是扫描件,MaxKB是无法正常识别的。

请描述你建议的实现方案

希望可以加入PDF的OCR功能,可以对PDF导入后先进行OCR识别:一般都是把PDF每一页转换为图片,然后进行识别。
可以参考这个开源项目:https://github.com/hiroi-sora/Umi-OCR
他的OCR识别效果还是很好的

附加信息

No response

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions