استخراج هاردساب های فارسی:
با این برنامه میتونید زیرنویس هایی که به صورت هاردساب نوشته شدن رو با فرمت srt استخراج کنین. خودم زیرنویس های زرد رنگ رو تست کردم دو ورژن مختلف برای ocr داره که ورژن اول با tesseract کار میکنه و ورژن دوم با paddleocr که برای زبان فارسی ترین داده شده ولی خب باید بیشتر ترین بشه. برای استفاده ازش توی ویندوز یه سری پیش نیازا لازمه که با اجرای installer.py نصب میشن.
ورژن سه رو میخواستم با استفاده از easyocr انجام بدم. ولی خب چون کند بود بیخیال شدم.. احتمالا در اینده paddleocr رو بیشتر برای زبان فارسی و فونت زیرنویس ها ترین کنم میتونید از نسخه ی ترین شده ی paddleocr هم به طور جدا استفاده کنید چون نسخه ی اصلی خودش گ چ پ رو نداره
با یکی دوتا تغییر کوچیک میتونید انگلیسی رو هم باهاش انجام بدین ولی خب چون فکر نمیکردم نیاز باشه خودم انجام ندادم
