أداة سطح مكتب (Desktop App) لاستخراج النصوص العربية من الصور وملفات PDF بدقة عالية جداً، مع الحفاظ على تنسيق الفقرات والجداول، باستخدام تقنيات Google Gemini AI.
- دقة عالية: دعم ممتاز للغة العربية والتشكيل.
- معالجة الكتب: إمكانية تحويل ملفات PDF كاملة أو نطاق محدد من الصفحات.
- الجداول: تحويل الجداول في الصور إلى جداول CSV/Excel (عبر Markdown).
- فلترة مسبقة: استخدام خوارزميات (Otsu Binarization) لتحسين الصور القديمة قبل إرسالها.
- توفير: استخدام مجاني عبر مفتاح API الشخصي.
- قم بتحميل البرنامج (ملف
exe) من قسم Releases على يمين الصفحة. - احصل على مفتاح API مجاني من Google AI Studio.
- افتح البرنامج وأدخل المفتاح.
- اختر الصور أو ملف PDF واضغط "إرسال".
إذا كنت ترغب في تشغيل الكود المصدري (.py) أو التعديل عليه:
-
استنساخ المستودع:
git clone [https://github.com/the-cataloger/Gemini-OCR-Arabic.git](https://github.com/the-cataloger/Gemini-OCR-Arabic.git) cd Gemini-OCR-Arabic -
تثبيت المكتبات المطلوبة:
pip install -r requirements.txt
-
تشغيل البرنامج:
python GemOCR-v2.py
تعتمد الأداة على Google Gemini API كواجهة خلفية (Backend) للمعالجة:
- يقوم البرنامج بمعالجة الصور محلياً (OpenCV) لتحسين الجودة.
- يتم إرسال البيانات بشكل آمن إلى سيرفرات Google.
- يستخدم موديل
gemini-1.5-flashأوproلفهم المحتوى وإعادة النص المنسق.
هذا المشروع يستخدم Google Gemini API، وهو يتطلب اتصالاً بالإنترنت ليعمل. تأكد من استخدام مفتاح API خاص بك لضمان الخصوصية والسرعة.