Bezpłatne programy OCR

ocr maj 20, 2020

Przepisywanie tekstów bywa żmudnym zajęciem. Na szczęście z pomocą przychodzi nam technologia, a konkretnie oprogramowanie OCR.

OCR (ang. optical character recognition), czyli optyczne rozpoznawanie znaków to technologia pozwalająca na zamianę tekstu istniejącego w formie pliku graficznego na tekst, który można potem np. edytować.

Programy OCR opierają swoje działanie na rozpoznawaniu wzorców. Najprościej mówiąc - dzielą obraz na mniejsze fragmenty, a następnie porównują je do znaków liter występujących w danym języku. Zazwyczaj, by uniknąć błędów, sprawdzają też poprawność ortograficzną oraz gramatyczną poszczególnych słów i fragmentów tekstu.

Obecnie najpopularniejszymi programami OCR są Abbyy Fine Reader, Adobe Acrobat DC i Readiris.

Istnieje również wiele stron internetowych, na których można przetworzyć swoje pliki za darmo i bez instalowania dodatkowego oprogramowania.

Poniżej znajdziecie krótkie opisy niektórych z nich.

1. OnlineOCR.net

Wyodrębnia tekst z plików PDF oraz obrazów (.jpg, .bmp, .tiff, .gif) i konwertuje go do edytowalnych formatów wyjściowych .doc(x), .xls(x), .txt. Serwis obsługuje 46 języków, w tym chiński, japoński i koreański.

Bez rejestracji możliwe jest przetworzenie 15 plików (lub 15 stron w przypadku plików wielostronicowych) na godzinę. Maksymalny rozmiar przesyłanego pliku to 15 MB.

2. Convertio

Obsługuje kilkanaście formatów plików - w tym najpopularniejsze (.pdf, .jpg, .bmp, .gif). Pliki można przesłać bezpośrednio z komputera, lub z dysku Google. Można również skorzystać z usługi Dropbox lub podać adres URL.

Pliki wyjściowe dostępne są również w kilkunastu formatach (m.in. .txt, .doc(x), .xls(x), .pdf, .ppt(x), .epub, .djvu).

Usługa dostępna jest w ponad 70 językach. Bez rejestracji możliwe jest przetworzenie 10 plików (lub 10 stron w przypadku plików wielostronicowych) na dobę.

3. PDF 24

Wyodrębnia tekst z plików PDF oraz z obrazów. Format plików docelowych to PDF lub PDF/A. Umożliwia modyfikację podstawowych ustawień OCR (usuń tło, obróć stronę, wyprostuj stronę itp.). Obsługuje wiele języków. Rozpoznaje również równania matematyczne.

Nie wymaga rejestracji i nie ma ograniczeń co do liczby przetwarzanych stron.

4. LightPDF

Obsługiwane formaty plików: .pdf lub obrazy (.jpg, .png). Rozmiar przesyłanego pliku nie może przekraczać 30 MB. Wyniki zapisywane są w formacie .txt (inne formaty dostępne po rejestracji). Program obsługuje ponad 20 języków. Brak rejestracji nie powoduje ograniczenia liczby plików, które można przetworzyć.

5. NewOCR

Przetwarza pliki w formatach: .jpg, .png, .pdf i wiele innych, również skompresowane (np. zarchiwizowane w .zip). Obsługuje 122 języki. Rozpoznaje równania matematyczne. Pliki wyjściowe można pobrać w formacie: .txt, .pdf, .docx lub edytować w Dokumentach Google.

Oprócz opisanych powyżej programów do OCR, możecie również skorzystać z opcji OCR na Dysku Google. Jak to zrobić, dowiecie się z następnego posta.

Należy pamiętać, że OCR nigdy nie będzie tak samo skuteczny jak człowiek. Jeśli więc decydujecie się na skorzystanie z oprogramowania do optycznego rozpoznawania znaków, koniecznie sprawdźcie później tekst, aby wyłapać błędy. A jeżeli nie macie czasu albo ochoty się tym zajmować - dajcie nam znać. Zrobimy to za Was!

Zapraszamy do kontaktu.