Persian OCR App — Convert Persian (Farsi) images and PDFs to editable text using Tesseract and PySide6. Fast, accurate, and easy-to-use desktop OCR for Persian documents.
برنامه OCR فارسی — تبدیل عکس و PDF فارسی به متن قابل ویرایش با استفاده از Tesseract و PySide6. سریع، دقیق و آسان برای اسناد فارسی.
No installation or Python required!
- Download the latest ready-to-use Windows executable (
PersianOCR.exe) from the Releases page. - Just download, double-click, and start using Persian OCR on Windows.
بدون نیاز به نصب یا پایتون!
- آخرین نسخه اجرایی ویندوز (
PersianOCR.exe) را از صفحه انتشارها دانلود کنید. - فقط دانلود کنید، دوبار کلیک کنید و بلافاصله از برنامه OCR فارسی روی ویندوز استفاده کنید.
- Persian (Farsi) OCR | تشخیص متن فارسی: Extract text from Persian images and PDFs | استخراج متن از عکس و PDF فارسی
- Easy to Use | استفاده آسان: Simple drag-and-drop interface | رابط کاربری ساده و کشیدن و رها کردن
- PDF & Image Support | پشتیبانی از PDF و عکس: Works with both formats | کار با هر دو فرمت
- No Internet Needed | بدون نیاز به اینترنت: All processing is local | تمام پردازشها به صورت محلی
- Modern GUI | رابط کاربری مدرن: Built with PySide6 (Qt for Python) | ساخته شده با PySide6
- Bundled Tesseract | Tesseract همراه: No separate installation required | بدون نیاز به نصب جداگانه
- English & Persian UI | رابط کاربری فارسی و انگلیسی: Switchable interface | قابل تغییر
- Clone the repository:
git clone https://github.com/Hamed-Gharghi/Persian-OCR-App.git cd Persian-OCR-App/Persian\ OCR
- Install Python 3.10+ (Recommended: 3.10, 3.11, or 3.12)
- Install dependencies:
pip install -r requirements.txt
- Run the app:
python main.py
Persian OCR (Optical Character Recognition) is the technology to convert scanned Persian (Farsi) documents, images, or PDFs into editable and searchable text. This app makes it easy to extract Persian text from images and PDFs on your computer.
تشخیص نوری حروف (OCR) فارسی، فناوری تبدیل اسناد، تصاویر یا PDF اسکنشده فارسی به متن قابل ویرایش و جستجو است. این برنامه استخراج متن فارسی از عکس و PDF را روی کامپیوتر شما آسان میکند.
۱. کلون کردن مخزن:
git clone https://github.com/Hamed-Gharghi/Persian-OCR-App.git
cd Persian-OCR-App/Persian\ OCR۲. نصب پایتون ۳.۱۰ یا بالاتر (پیشنهادی: ۳.۱۰، ۳.۱۱ یا ۳.۱۲) ۳. نصب وابستگیها:
pip install -r requirements.txt۴. اجرای برنامه:
python main.py- 🖥️ رابط کاربری ساده، کاربرپسند و مدرن (حالت تیره/روشن خودکار)
- 🌐 رابط کاربری فارسی و انگلیسی (قابل تغییر)
- 📂 امکان کشیدن و رها کردن یا انتخاب تصویر/PDF
- ⏳ نوار پیشرفت و لاگ لحظهای
- 🖼️ پیشنمایش تصویر یا PDF قبل از OCR
- 💾 ذخیره خروجی OCR در فایل متنی
- 📦 بدون نیاز به نصب جداگانه Tesseract (همراه برنامه)
- 📦 برنامه از موتور Tesseract همراه (در پوشه
Tesseract) برای بیشترین قابلیت حمل استفاده میکند. - 🔒 تمام پردازشها به صورت محلی انجام میشود و دادهای ارسال نمیگردد.
Contributions, issues, and feature requests are welcome! Feel free to open an issue or submit a pull request.
Q: Why is the OCR not accurate for some images?
- A: OCR accuracy depends on image quality, resolution, and clarity. For best results, use high-resolution, well-lit, and straight images. Avoid blurry or skewed scans.
Q: How do I add more languages?
- A: Download the desired language data file (traineddata) for Tesseract and place it in the
tessdatafolder. Then select the language in the app settings or code.
Q: What to do if Tesseract is not detected?
- A: Make sure the Tesseract executable is included in the app's
Tesseractfolder or installed on your system. Check that the app's settings point to the correct Tesseract path.
MIT
This project uses the amazing Tesseract OCR engine — thank you to the Tesseract team and contributors!
این پروژه از موتور قدرتمند Tesseract OCR استفاده میکند — از تیم و توسعهدهندگان Tesseract سپاسگزاریم!
Persian OCR Farsi OCR Image to Text PDF OCR Tesseract PySide6 Qt for Python Persian Text Recognition فارسی تشخیص متن فارسی OCR فارسی تبدیل عکس به متن تبدیل PDF به متن
For questions, suggestions, or collaboration, feel free to reach out:
- 🌐 Website
- 💬 Telegram
- 🐙 GitHub
- 📧 Email: hamed.gharghi@gmail.com
