Pomozte vývoji webu a sdílení článku s přáteli!

Dříve nebo později se každý, kdo často pracuje s kancelářskými programy, setká s typickým úkolem - skenovat text z knihy, časopisu, novin, pouze letáky a pak tyto obrázky přeložit do textového formátu, například v dokumentu aplikace Word.

Chcete-li to provést, potřebujete skener a speciální program pro rozpoznávání textu. V tomto článku budeme hovořit o bezplatném analogovém programu FineReader - CuneiForm (o rozpoznávání ve FineReader - viz tento článek).

Začneme …

Obsah

  • 1. Funkce funkce CuneiForm
  • 2 2. Příklad rozpoznávání textu
  • 3 3. Dávkové rozpoznávání textu
  • 4 4. Závěry

1. Funkce funkce CuneiForm

CuneiForm

Můžete si je stáhnout z webu vývojáře: http://cognitiveforms.com/

Program pro rozpoznávání textu s otevřeným zdrojem. Navíc funguje ve všech verzích systému Windows: XP, Vista, 7, 8, které potěší. Navíc přidejte celý ruský překlad programu!

Výhody:

- uznání textu v 20 nejpopulárnějších jazycích světa (v tomto čísle je zahrnuto anglické a ruské označení);

- obrovská podpora různých tištěných písem;

- zkontrolovat slovník rozpoznaného textu;

- možnost zachránit výsledky práce v několika variantách;

- zachování struktury dokumentu;

- vynikající podpora a uznání tabulek.

Nevýhody:

- nepodporuje příliš velké dokumenty a soubory (více než 400 dpi);

- přímo nepodporuje některé typy skenerů (no, není to děsivé, ovladač skeneru je dodáván se speciálním programem pro skenování);

- Návrh nesvítí (ale kdo to potřebuje, pokud program plně řeší problém).

2. Příklad rozpoznávání textu

Budeme předpokládat, že jste již obdrželi potřebné obrázky pro rozpoznání (naskenované tam, nebo si stáhli knihu ve formátu pdf / djvu na internetu a extrahovali potřebné obrázky z nich.) Prohlédněte si tento článek.)

1) Otevřete požadovaný obrázek v programu CuineForm (soubor / otevřený nebo "Cntrl + O").

2) Chcete-li začít rozpoznávat - musíte nejprve vybrat různé oblasti: text, obrázky, tabulky apod. V Klínovec to může být provedeno nejen ručně, ale také automaticky ! Chcete-li to provést, klikněte na tlačítko "značení" v horním panelu okna.

3) Po 10-15 sekundách. program automaticky zvýrazní všechny oblasti s různými barvami. Oblast textu je například zvýrazněna modře. Mimochodem, správně a poměrně rychle vyzdvihla všechny oblasti. Upřímně řečeno, neočekával jsem od ní tak rychlou a správnou reakci …

4) Pro ty, kteří nedůvěřují automatickému značkování, můžete použít manuál. K tomu slouží panel nástrojů (viz obrázek níže), díky kterému můžete vybrat: text, tabulku, obrázek. Posun, zvýšení / snížení počátečního obrazu, oříznutí okrajů. Obecně platí, že dobrý set.

5) Po vyznačení všech oblastí můžete začít rozpoznávat . Chcete-li to provést, stačí kliknout na tlačítko se stejným názvem jako na obrázku níže.

6) Doslova za 10-20 sekund. před otevřením dokumentu v aplikaci Word s rozpoznaným textem. Je zajímavé, že v textu pro tento příklad byly samozřejmě chyby, ale z nich není příliš mnoho! Zvláště, vzhledem k tomu, co je nepopsatelná kvalita, byl zdrojový materiál - obraz.

Podle rychlosti a kvality je s FineReaderem poměrně srovnatelná!

3. Dávkové rozpoznávání textu

Tato funkce programu může být užitečná, když potřebujete rozpoznat více než jeden snímek, ale několik najednou. Popisek pro spuštění rozpoznávání paketů je většinou skrytý v nabídce "start".

1) Po otevření programu je třeba vytvořit nový balíček nebo otevřít dříve uložený program. V našem příkladu vytvořte nový.

2) V dalším kroku mu dáváme jméno, nejlépe tak, že za půl roku si pamatujeme, co je v něm uloženo.

3) Pak zvolte jazyk dokumentu (rusko-angličtina), zadejte, zda jsou v naskenovaném materiálu obrázky a tabulky.

4) Nyní musíte zadat složku, ve které jsou umístěny soubory pro rozpoznávání. Mimochodem, je zajímavé, že program sám nalezne všechny obrázky a další grafické soubory, které dokáže rozpoznat a přidá je k projektu. Budete muset odstranit další.

5) Dalším krokem není důležité, rozhodněte se, co dělat se zdrojovými soubory po rozpoznání. Doporučuji vybrat zaškrtávací políčko "nedělat nic".

6) Zbývá pouze zvolit formát, ve kterém bude uložen uznávaný dokument. Existuje několik možností:

- rtf - soubor ze slovního dokumentu, otevírá se všemi oblíbenými kancelářemi (včetně volných, odkaz na programy);

- txt - textový formát, v něm můžete ukládat pouze text, obrázky a tabulky;

- htm - hypertextová stránka, je vhodné, pokud skenujete a rozpoznáte soubory webu. Vybíráme to v našem příkladu.

7) Po klepnutí na tlačítko "připraven" se spustí zpracování vašeho projektu.

8) Program funguje velmi rychle. Po rozpoznání se před vámi zobrazí karta s htm soubory. Pokud klepnete na takový soubor, spustí se prohlížeč, kde můžete vidět výsledky. Mimochodem, balíček může být uložen pro další práci s ním.

9) Jak vidíte, výsledky práce jsou velmi působivé. Program byl program snadno rozpoznán a pod ním bylo snadné rozpoznat text. Se skutečností, že program je zdarma - je to obecně super!

4. Závěry

Pokud často nerozpoznáváte a nerozpoznáváte dokumenty, nemá smysl koupit FineReader. U většiny úkolů se CuneiForm snadno zpracovává.

Na druhou stranu má také nevýhody.

Za prvé, existuje příliš málo nástrojů pro editaci a ověřování výsledku. Za druhé, když musíte rozpoznat spoustu obrázků, pak je v aplikaci FineReader výhodnější okamžitě vidět vše, co se do projektu přidalo do sloupce vpravo: rychle odstraňte zbytečné, proveďte opravy atd. A za třetí, na dokumentech s velmi špatnou kvalitou ztrácí CuneiForm jako uznání: Je třeba vzít na vědomí dokument - opravit chyby, umístit interpunkční znaménka, invertované čárky atd.

To je všechno. Znáte nějaký jiný hodný bezplatný program pro rozpoznávání textu?

Pomozte vývoji webu a sdílení článku s přáteli!

Kategorie: