Jak przekonwertować zeskanowane dokumenty na Word - The Happy Android

Jeśli chcesz zdigitalizować książkę w formacie tekstowym, możesz mieć kilka pytań. Czy można to zrobić? A co z jakością, czy jest dobra? Nie tylko można to zrobić, ale istnieje również kilka sposobów konwersji zeskanowanego dokumentu do programu Word. Zobaczmy:

  • Skanując dokument w formacie PDF i edytując go później w programie Adobe Acrobat XI Pro, aby zapisać go w formacie Word. Wersja Pro programu Acrobat jest płatna, ale można kupić bezpłatną 30-dniową licencję próbną.
  • Ze strony OnlineOCR.net . Ta aplikacja internetowa umożliwia konwersję dokumentów w formatach PDF, JPG, TIFF i GIF do formatu Word, Excel i tekstu. W wersji darmowej możemy konwertować do 15 stron na godzinę i dokumentów nie więcej niż jednej strony.
  • Skanując dokument w formacie (OCR) i zapisując go jako tekst. Następnie możemy otworzyć Worda i edytować lub zapisać go w formacie .doc.
  • Korzystanie z programu do optycznego rozpoznawania znaków :
    •  VueScan (dostępny dla systemów Windows, Mac OS X i Linux)
    • Kooka  (dla systemu Linux)
    • Office Lens (dla systemu Android i iOS )
    • CamScanner (dla Androida i iOS )

Najbardziej wydajnym sposobem ze wszystkiego, co możemy powiedzieć, jest Adobe Acrobat Pro, ale tylko wtedy, gdy skan jest bardzo, bardzo czysty i wysokiej jakości. Aplikacje do optycznego rozpoznawania znaków przeszły długą drogę, ale nadal wykazują pewne luki, takie jak pogrubienie lub kursywa, a transkrypcja niektórych słów w zależności od typu czcionki oryginalnego dokumentu może być błędna.

Spróbuj zeskanować i przekazać ten dokument do programu Word, aby zobaczyć, co się stanie

Z samego skanera

Niektóre skanery zawierają funkcję rozpoznawania optycznego (OCR) we własnym programie do skanowania. Aby zeskanować dokument do tekstu, wystarczy ustawić format digitalizacji i spojrzeć na taki, który odnosi się do OCR lub podobnego (zależy to od marki / modelu skanera).

Przejdź z formatu PDF do programu Word za pomocą programu Adobe Acrobat XI Pro

Po pobraniu i zainstalowaniu programu Adobe Acrobat XI Pro ( masz bezpłatną 30-dniową wersję próbną TUTAJ ) przejdź do „ Narzędzia -> Rozpoznawanie tekstu -> W tym pliku ”.

W oknie „ Rozpoznaj tekst ” kliknij „ Edytuj ” i wybierz język tekstu, styl wyniku oraz rozdzielczość.

Na koniec wróć do „ Narzędzia -> Edycja treści -> Edytuj tekst i obrazy ” i zmodyfikuj tekst, jeśli chcesz poprawić jakiekolwiek słowo. Aby zakończyć, kliknij „ Plik -> Zapisz jako ” i zapisz w formacie Word.

OnlineOCR

OnlineOCR to aplikacja internetowa do przesyłania obrazów lub plików PDF do programu Word i jest bardzo łatwa w użyciu. Wyjaśnię, jak to działa: wprowadź //www.onlineocr.net/ i kliknij „ Wybierz plik ”. Wybierz zeskanowany dokument, a następnie wybierz język i format wyjściowy z 2 rozwijanych menu, które znajdują się na środku ekranu.

Aby zakończyć, kliknij „ Konwertuj ”. Tuż pod nim pojawi się zwykły podgląd tekstu, który możesz edytować, jeśli chcesz poprawić jakiekolwiek słowa. Na koniec kliknij „ Pobierz plik wyjściowy ” i możesz pobrać plik w formacie Word. Oto przykład pliku PDF przekonwertowanego na Word za pomocą OnlineOCR:

  • Oryginalny plik PDF:

  • Przekonwertowany dokument:

Jeśli ta aplikacja internetowa Cię nie satysfakcjonuje, możesz wypróbować inne podobne rozwiązania, takie jak FreeOCR lub Free-Online-OCR .

Programy do optycznego rozpoznawania znaków (OCR)

Jeśli nie chcesz modyfikować swoich dokumentów online i potrzebujesz aplikacji komputerowej, możesz skorzystać z aplikacji takich jak VueScan (która jest również dostępna dla komputerów Mac i Linux oprócz wszechobecnego systemu Windows).

Inną możliwością jest użycie urządzenia z systemem Android lub iOS do zeskanowania dokumentu i bezpośredniej konwersji na tekst. Istnieją aplikacje, takie jak Office Lens (na Androida i iOS ) lub CamScanner (na Androida i iOS ), które wykonują cały proces z tej samej aplikacji. W takich przypadkach zaleca się wyczyszczenie obrazu przed konwersją go na tekst. Jeśli chcesz dowiedzieć się więcej o tej metodzie, zajrzyj do TEGO POSTU .

Moim zdaniem technika optycznego rozpoznawania znaków, mimo że znacznie się poprawiła w ostatnich latach, wciąż dzieli lata świetlne od bycia doskonałą techniką. Wiele szczegółów, wiele słów, które „tłumaczy” za pomocą niewłaściwych liter i symboli zaśmiecających tekst. Nadal brakuje mu dodatkowej inteligencji, która sprawia, że ​​widzi, że „ t &! $ Olog1a ” nie może być poprawnym tłumaczeniem żadnego słowa w tekście. Nadal nie widzę czytania ze zrozumieniem, ale proste wizualne rozpoznawanie pojedynczych liter, które tworzą słowa, bez integracji ich z resztą tekstu. Jestem jednak przekonany, że moment, w którym dokonamy tego ostatniego wielkiego skoku, zbliża się z każdym dniem.

Czy masz zainstalowany Telegram ? Otrzymuj najlepsze wiadomości każdego dnia na naszym kanale . Lub, jeśli wolisz, dowiedz się wszystkiego z naszej strony na Facebooku .