Skip to content

the-cataloger/Gemini-OCR-Arabic

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📄 GemOCR - Arabic OCR Tool (Powered by Gemini)

Python Gemini API

أداة سطح مكتب (Desktop App) لاستخراج النصوص العربية من الصور وملفات PDF بدقة عالية جداً، مع الحفاظ على تنسيق الفقرات والجداول، باستخدام تقنيات Google Gemini AI.

✨ المميزات (Features)

  • دقة عالية: دعم ممتاز للغة العربية والتشكيل.
  • معالجة الكتب: إمكانية تحويل ملفات PDF كاملة أو نطاق محدد من الصفحات.
  • الجداول: تحويل الجداول في الصور إلى جداول CSV/Excel (عبر Markdown).
  • فلترة مسبقة: استخدام خوارزميات (Otsu Binarization) لتحسين الصور القديمة قبل إرسالها.
  • توفير: استخدام مجاني عبر مفتاح API الشخصي.

🚀 طريقة الاستخدام للمستخدم العادي (User Guide)

  1. قم بتحميل البرنامج (ملف exe) من قسم Releases على يمين الصفحة.
  2. احصل على مفتاح API مجاني من Google AI Studio.
  3. افتح البرنامج وأدخل المفتاح.
  4. اختر الصور أو ملف PDF واضغط "إرسال".

💻 للمطورين: تشغيل الكود المصدري (For Developers)

إذا كنت ترغب في تشغيل الكود المصدري (.py) أو التعديل عليه:

  1. استنساخ المستودع:

    git clone [https://github.com/the-cataloger/Gemini-OCR-Arabic.git](https://github.com/the-cataloger/Gemini-OCR-Arabic.git)
    cd Gemini-OCR-Arabic
  2. تثبيت المكتبات المطلوبة:

    pip install -r requirements.txt
  3. تشغيل البرنامج:

    python GemOCR-v2.py

⚙️ كيف تعمل الأداة؟

تعتمد الأداة على Google Gemini API كواجهة خلفية (Backend) للمعالجة:

  1. يقوم البرنامج بمعالجة الصور محلياً (OpenCV) لتحسين الجودة.
  2. يتم إرسال البيانات بشكل آمن إلى سيرفرات Google.
  3. يستخدم موديل gemini-1.5-flash أو pro لفهم المحتوى وإعادة النص المنسق.

⚠️ ملاحظة هامة

هذا المشروع يستخدم Google Gemini API، وهو يتطلب اتصالاً بالإنترنت ليعمل. تأكد من استخدام مفتاح API خاص بك لضمان الخصوصية والسرعة.

About

"أداة لاستخراج النصوص العربية من الصور وملفات PDF باستخدام Gemini API

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages