Replies: 1 comment 1 reply
-
Il semble que le modèle PaddleOCR que vous utilisez ne reconnaît pas correctement le caractère 1. Vérifier l'utilisation du bon modèle linguistiqueAssurez-vous d'utiliser le modèle français correctement en précisant Exemple : paddleocr --image_dir votre_image.jpg --lang=fr Ou en Python : from paddleocr import PaddleOCR
ocr = PaddleOCR(lang="fr")
result = ocr.ocr("votre_image.jpg")
print(result) 2. Vérifier le dictionnaire utiliséLe modèle français utilise un dictionnaire spécifique qui peut être trouvé ici : 3. Personnaliser l'entraînement du modèleSi le modèle ne reconnaît toujours pas 4. Post-traitement des résultatsSi le modèle reconnaît Exemple en Python : corrections = {"eil": "œil"} # Ajouter d'autres mots si nécessaire
for line in result:
recognised_text = line[1][0]
if recognised_text in corrections:
recognised_text = corrections[recognised_text]
print(recognised_text) 5. Tester avec une autre version du modèlePaddleOCR a récemment mis à jour ses modèles ( pip install --upgrade paddleocr Si le problème persiste, il peut être utile de signaler l'anomalie sur le dépôt officiel de PaddleOCR en fournissant des exemples d'images problématiques. J'espère que cela vous aidera ! 😊 Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
So my images are simple one lined text in french and also numbers. So far it is really good and doesn't make a lot of errors, but whenever there are any
œ
either lowercase or uppercase, it doesn't detect them even though the character is in the dict used...So for example when it should detect
œil
, it detectseil
which is wrong.What can I do about that, I have no experience in OCR and also with Paddle.
Thanks =)
Beta Was this translation helpful? Give feedback.
All reactions