Text-Image-Extractor

This package helps to extract text from clear images such as screenshots, scanned pictures etc.

The following steps demonstrate how to use this package:

Prerequisites

Pytesseract must be installed on your local devices.
For Linux users, you must install pytesseract OCR using sudo

Install package

To install, use the code below.

pip install extract-img-txt

Python dependencies

On Ubuntu or Debian Linux:

$ sudo apt-get install tesseract-ocr libtesseract-dev libleptonica-dev

Extract text

To extract the text into your terminal, run the following

from image_extract.ext import ImgExt

#uncomment if you are a window user 

#pytesseract.tesseract_cmd = path_to_tesseract_on _your_device 

img = ImgExt(image_path="image_path",file_name="test")

# To return text

text=img.get_text()

print(text)

# To convert text to docx
img.convert_to_word()

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
dist		dist
examples		examples
extract_img_txt.egg-info		extract_img_txt.egg-info
image_extract		image_extract
README.txt		README.txt
LICENSE.txt		LICENSE.txt
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Text-Image-Extractor

Prerequisites

Install package

Python dependencies

Extract text

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

steelthedev/text-extractor-package

Folders and files

Latest commit

History

Repository files navigation

Text-Image-Extractor

Prerequisites

Install package

Python dependencies

Extract text

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages