Skip to content

Hamed-Gharghi/Persian-OCR-App

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Persian OCR App 🇮🇷🖼️🔍📝

GitHub stars GitHub issues GitHub forks

License: MIT Python PySide6 Platform


Persian OCR App — Convert Persian (Farsi) images and PDFs to editable text using Tesseract and PySide6. Fast, accurate, and easy-to-use desktop OCR for Persian documents.

برنامه OCR فارسی — تبدیل عکس و PDF فارسی به متن قابل ویرایش با استفاده از Tesseract و PySide6. سریع، دقیق و آسان برای اسناد فارسی.


🪟 Download for Windows

No installation or Python required!

  • Download the latest ready-to-use Windows executable (PersianOCR.exe) from the Releases page.
  • Just download, double-click, and start using Persian OCR on Windows.

🪟 دانلود برای ویندوز

بدون نیاز به نصب یا پایتون!

  • آخرین نسخه اجرایی ویندوز (PersianOCR.exe) را از صفحه انتشارها دانلود کنید.
  • فقط دانلود کنید، دوبار کلیک کنید و بلافاصله از برنامه OCR فارسی روی ویندوز استفاده کنید.

📑 Navigation | ناوبری


🇬🇧 English

🔑 Key Features & Highlights | نکات کلیدی و ویژگی‌ها

  • Persian (Farsi) OCR | تشخیص متن فارسی: Extract text from Persian images and PDFs | استخراج متن از عکس و PDF فارسی
  • Easy to Use | استفاده آسان: Simple drag-and-drop interface | رابط کاربری ساده و کشیدن و رها کردن
  • PDF & Image Support | پشتیبانی از PDF و عکس: Works with both formats | کار با هر دو فرمت
  • No Internet Needed | بدون نیاز به اینترنت: All processing is local | تمام پردازش‌ها به صورت محلی
  • Modern GUI | رابط کاربری مدرن: Built with PySide6 (Qt for Python) | ساخته شده با PySide6
  • Bundled Tesseract | Tesseract همراه: No separate installation required | بدون نیاز به نصب جداگانه
  • English & Persian UI | رابط کاربری فارسی و انگلیسی: Switchable interface | قابل تغییر

🚀 Quick Start

  1. Clone the repository:
    git clone https://github.com/Hamed-Gharghi/Persian-OCR-App.git
    cd Persian-OCR-App/Persian\ OCR
  2. Install Python 3.10+ (Recommended: 3.10, 3.11, or 3.12)
  3. Install dependencies:
    pip install -r requirements.txt
  4. Run the app:
    python main.py

🖼️ Screenshots | اسکرین‌شات

Persian OCR App Screenshot


❓ What is Persian OCR? | OCR فارسی چیست؟

Persian OCR (Optical Character Recognition) is the technology to convert scanned Persian (Farsi) documents, images, or PDFs into editable and searchable text. This app makes it easy to extract Persian text from images and PDFs on your computer.

تشخیص نوری حروف (OCR) فارسی، فناوری تبدیل اسناد، تصاویر یا PDF اسکن‌شده فارسی به متن قابل ویرایش و جستجو است. این برنامه استخراج متن فارسی از عکس و PDF را روی کامپیوتر شما آسان می‌کند.


🇮🇷 فارسی

🚀 شروع سریع

۱. کلون کردن مخزن:

git clone https://github.com/Hamed-Gharghi/Persian-OCR-App.git
cd Persian-OCR-App/Persian\ OCR

۲. نصب پایتون ۳.۱۰ یا بالاتر (پیشنهادی: ۳.۱۰، ۳.۱۱ یا ۳.۱۲) ۳. نصب وابستگی‌ها:

pip install -r requirements.txt

۴. اجرای برنامه:

python main.py

✨ ویژگی‌ها

  • 🖥️ رابط کاربری ساده، کاربرپسند و مدرن (حالت تیره/روشن خودکار)
  • 🌐 رابط کاربری فارسی و انگلیسی (قابل تغییر)
  • 📂 امکان کشیدن و رها کردن یا انتخاب تصویر/PDF
  • ⏳ نوار پیشرفت و لاگ لحظه‌ای
  • 🖼️ پیش‌نمایش تصویر یا PDF قبل از OCR
  • 💾 ذخیره خروجی OCR در فایل متنی
  • 📦 بدون نیاز به نصب جداگانه Tesseract (همراه برنامه)

📝 نکات

  • 📦 برنامه از موتور Tesseract همراه (در پوشه Tesseract) برای بیشترین قابلیت حمل استفاده می‌کند.
  • 🔒 تمام پردازش‌ها به صورت محلی انجام می‌شود و داده‌ای ارسال نمی‌گردد.

🤝 Contributing

Contributions, issues, and feature requests are welcome! Feel free to open an issue or submit a pull request.


❓ FAQ / Troubleshooting

Q: Why is the OCR not accurate for some images?

  • A: OCR accuracy depends on image quality, resolution, and clarity. For best results, use high-resolution, well-lit, and straight images. Avoid blurry or skewed scans.

Q: How do I add more languages?

  • A: Download the desired language data file (traineddata) for Tesseract and place it in the tessdata folder. Then select the language in the app settings or code.

Q: What to do if Tesseract is not detected?

  • A: Make sure the Tesseract executable is included in the app's Tesseract folder or installed on your system. Check that the app's settings point to the correct Tesseract path.

📄 License

MIT


🙏 Thanks / تشکر

This project uses the amazing Tesseract OCR engine — thank you to the Tesseract team and contributors!

این پروژه از موتور قدرتمند Tesseract OCR استفاده می‌کند — از تیم و توسعه‌دهندگان Tesseract سپاسگزاریم!


🏷️ Keywords | کلیدواژه‌ها

Persian OCR Farsi OCR Image to Text PDF OCR Tesseract PySide6 Qt for Python Persian Text Recognition فارسی تشخیص متن فارسی OCR فارسی تبدیل عکس به متن تبدیل PDF به متن


📬 Contact

For questions, suggestions, or collaboration, feel free to reach out:

About

Convert Persian (Farsi) images and PDFs to editable text using Tesseract OCR and PySide6. Fast, accurate, and user-friendly desktop OCR for Persian documents.

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages