Bezpłatne programy OCR
Przepisywanie tekstów bywa żmudnym zajęciem. Na szczęście z pomocą przychodzi nam technologia, a konkretnie oprogramowanie OCR.
OCR (ang. optical character recognition), czyli optyczne rozpoznawanie znaków to technologia pozwalająca na zamianę tekstu istniejącego w formie pliku graficznego na tekst, który można potem np. edytować.
Programy OCR opierają swoje działanie na rozpoznawaniu wzorców. Najprościej mówiąc - dzielą obraz na mniejsze fragmenty, a następnie porównują je do znaków liter występujących w danym języku. Zazwyczaj, by uniknąć błędów, sprawdzają też poprawność ortograficzną oraz gramatyczną poszczególnych słów i fragmentów tekstu.
Obecnie najpopularniejszymi programami OCR są Abbyy Fine Reader, Adobe Acrobat DC i Readiris.
Istnieje również wiele stron internetowych, na których można przetworzyć swoje pliki za darmo i bez instalowania dodatkowego oprogramowania.
Poniżej znajdziecie krótkie opisy niektórych z nich.
Wyodrębnia tekst z plików PDF oraz obrazów (.jpg, .bmp, .tiff, .gif) i konwertuje go do edytowalnych formatów wyjściowych .doc(x), .xls(x), .txt. Serwis obsługuje 46 języków, w tym chiński, japoński i koreański.
Bez rejestracji możliwe jest przetworzenie 15 plików (lub 15 stron w przypadku plików wielostronicowych) na godzinę. Maksymalny rozmiar przesyłanego pliku to 15 MB.
2. Convertio
Obsługuje kilkanaście formatów plików - w tym najpopularniejsze (.pdf, .jpg, .bmp, .gif). Pliki można przesłać bezpośrednio z komputera, lub z dysku Google. Można również skorzystać z usługi Dropbox lub podać adres URL.
Pliki wyjściowe dostępne są również w kilkunastu formatach (m.in. .txt, .doc(x), .xls(x), .pdf, .ppt(x), .epub, .djvu).
Usługa dostępna jest w ponad 70 językach. Bez rejestracji możliwe jest przetworzenie 10 plików (lub 10 stron w przypadku plików wielostronicowych) na dobę.
3. PDF 24
Wyodrębnia tekst z plików PDF oraz z obrazów. Format plików docelowych to PDF lub PDF/A. Umożliwia modyfikację podstawowych ustawień OCR (usuń tło, obróć stronę, wyprostuj stronę itp.). Obsługuje wiele języków. Rozpoznaje również równania matematyczne.
Nie wymaga rejestracji i nie ma ograniczeń co do liczby przetwarzanych stron.
4. LightPDF
Obsługiwane formaty plików: .pdf lub obrazy (.jpg, .png). Rozmiar przesyłanego pliku nie może przekraczać 30 MB. Wyniki zapisywane są w formacie .txt (inne formaty dostępne po rejestracji). Program obsługuje ponad 20 języków. Brak rejestracji nie powoduje ograniczenia liczby plików, które można przetworzyć.
5. NewOCR
Przetwarza pliki w formatach: .jpg, .png, .pdf i wiele innych, również skompresowane (np. zarchiwizowane w .zip). Obsługuje 122 języki. Rozpoznaje równania matematyczne. Pliki wyjściowe można pobrać w formacie: .txt, .pdf, .docx lub edytować w Dokumentach Google.
Oprócz opisanych powyżej programów do OCR, możecie również skorzystać z opcji OCR na Dysku Google. Jak to zrobić, dowiecie się z następnego posta.
Należy pamiętać, że OCR nigdy nie będzie tak samo skuteczny jak człowiek. Jeśli więc decydujecie się na skorzystanie z oprogramowania do optycznego rozpoznawania znaków, koniecznie sprawdźcie później tekst, aby wyłapać błędy. A jeżeli nie macie czasu albo ochoty się tym zajmować - dajcie nam znać. Zrobimy to za Was!
Zapraszamy do kontaktu.