Czasami zdarza się, że chcemy skopiować tekst z jakiegoś źródła. Gdy źródłem tym jest obrazek (plik graficzny) sytuacja nam się komplikuje. Możemy oczywiście ręcznie przepisywać tekst, który nas interesuje… Ale co w przypadku, gdy tekst jest bardzo długi? Jak skopiować tekst z obrazka? W tej sytuacji przychodzą nam z pomocą programy/systemy OCR.
Spis treści
Czym jest OCR?
OCR (ang. Optical Character Recognition) – jest to zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Taki system automatycznie rozpoznaje znak po znaku i odtwarza dany ciąg. Inteligentniejsze systemy OCR sprawdzają również, czy teksty są poprawne ortograficznie itd.
Kopiowanie tekstu z obrazka w przeglądarce internetowej
Pierwszym narzędziem, jakie pokażemy jest wtyczka do przeglądarki Google Chrome: Project Naptha
Jest to darmowa i bardzo wygodna wtyczka, dzięki której bez problemu (bez uruchamiania innych programów) w każdej chwili możemy skopiować jakiś tekst z pliku graficznego.
Po instalacji (Ustawienie -> Rozszerzenia -> …) wtyczka jest cały czas aktywna i w każdym momencie możemy z niej skorzystać. Po najechaniu na obrazek wtyczka już wyszukuje i rozpoznaje w nim teksty.
Wtyczka rozpoznaje praktycznie wszystkie czcionki. Niestety posiada jedną wadę, nie radzi sobie z polskimi znakami. W przypadku, gdy kopiujemy tekst z polskimi znakami wyskakują nam „krzaczki” albo komunikaty z błędami.
Oprócz wtyczki takiej jak Project Naptha, możemy użyć programu desktopowego.
Inne programy OCR
Jednym z takich programów jest ABBYY FineReader Professional 12. Nie jest on niestety darmowy, ale można zainstalować wersję demo, z której możemy korzystać za darmo przez 15 dni.
Program ten dostarcza dużo więcej funkcji niż wcześniej wspomniana wtyczka. Można dzięki niemu konwertować między innymi także pliki PDF do plików DOC. Program radzi sobie także z polskimi znakami.
Innym programem tego typu jest:
Free Image OCR – jest to podobny program, posiadający trochę mniej funkcji niż program poprzedni, ale za to jest całkowicie darmowy.
Narzędzia OCR online
Kolejnym sposobem na kopiowanie i edycję tekstu z plików graficznych jest użycie narzędzi online.
Jednym z takich narzędzi jest strona: newocr.com
Używanie tego narzędzia jest banalnie proste, wystarczy wybrać plik graficzny, wybrać język tekstu i załadować obrazek. Po załadowaniu obrazka klikamy przycisk „OCR” i program zaczyna już konwertować nasz obrazek.
Jak widać na zrzucie ekranu powyżej, konwertowany tekst nie jest idealny. Program gubi czasami polskie znaki itd. Na szczęście sam podkreśla nam takie błędy i w miarę szybko możemy poprawić wszystkie błędy.
Po sprawdzeniu pisowni pozostaje nam tylko skopiowanie uzyskanego tekstu. Narzędzie to daje nam również możliwość między innymi przetłumaczenia tekstu za pomocą tłumacza google. Gdy tekst jest już gotowy możemy go zapisać w postaci pliku PDF, TXT lub DOC.
Jak skopiować tekst z obrazka za pomocą Google Docs?
W bardzo prosty sposób możemy przekonwertować obrazek/zdjęcie na tekst za pomocą Google Docs. Opisaliśmy to w artykule: Jak kopiować tekst z obrazka w Google Docs
Powyżej przedstawiłem kilka narzędzi typu OCR, które mogą być bardzo przydatne dla wielu użytkowników. Jeżeli znacie inne, sprawdzone narzędzia tego typu, zachęcam do podzielenia się nimi w komentarzu!
fajna opcja, można zaoszczędzić trochę czasu. Ale problemem często są polskie znaki. Zna ktoś dobry ocr online, który dobrze zczytuje polskie znaki?