Pomozte vývoji webu a sdílení článku s přáteli!

Pozdravy všem čtenářům blogu!

Myslím, že ti, kteří často pracují na počítači (nehraje, tedy pracují), se museli zabývat rozpoznáním textu. Například jste skenovali průchod z knihy a nyní musíte tuto část vložit do dokumentu. Ale naskenovaný dokument je obrázek a potřebujeme text - pro to je zapotřebí speciálních programů a služeb online, které rozpoznávají text z obrázků.

O programu pro uznání jsem již napsal v předchozích příspěvcích:

- skenování textu a rozpoznávání v programu FineReader (placený program);

- práci v analogovém programu FineReader - CuneiForm (bezplatný program).

Ve stejném článku bych se rád soustředil na online služby pro rozpoznávání textu. Koneckonců, pokud potřebujete rychle dostat text s 1-2 obrázky - nemá smysl trápit instalací různých programů …

Důležité! Kvalita rozpoznávání (počet chyb, čitelnost atd.) Velmi závisí na původní kvalitě obrazu. Proto při skenování (fotografování atd.) Vyberte kvalitu co nejvyšší. Ve většině případů bude postačovat kvalita 300-400 dpi (parametr charakterizující kvalitu obrazu). V nastavení téměř všech skenerů je tento parametr obvykle indikován.

Online služby

Abych ukázal práci služeb, vytvořil jsem screenshot jednoho z mých článků. Tato obrazovka bude stažena ke všem službám popsaným níže.

1) http://www.ocrconvert.com/

Tato služba se mi líbí velmi pro svou jednoduchost. Stránky jsou ale také anglicky, ale dobře pracují a rusky. Nemusíte se registrovat. Chcete-li začít rozpoznávat, musíte provést 3 kroky:

- nahrát obrázek;

- vyberte jazyk textu, který je na obrázku;

- Stiskněte tlačítko rozpoznání.

Podporované formáty: PDF, GIF, BMP, JPEG.

Výsledek je uveden níže na obrázku. Musím říci, že text byl dobře znám. Navíc, velmi rychle - čekal jsem doslova 5-10 sekund.

2) http://www.i2ocr.com/

Tato služba funguje podobně jako výše. Zde také musíte stáhnout soubor, vybrat jazyk rozpoznávání a klepnout na tlačítko extrahovat text. Služba je velmi rychlá: 5-6 s. pro jednu stránku.

Podporuje formáty: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Výsledkem této online služby je mnohem pohodlnější: okamžitě vidíte dvě okna - první je výsledkem rozpoznání, ve druhém - původní obrázek. Proto je snadné provádět úpravy v průběhu editace. Mimochodem, nemusíte se registrovat ani pro službu.

3) http://www.newocr.com/

Tato služba je jedinečná několika způsoby. Nejprve podporuje formát formátu DJVU "newfangled" (mimochodem, úplný seznam formátů: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Zadruhé podporuje výběr textových oblastí na obrázku. To je velmi užitečné, když máte v obraze nejen textové oblasti, ale také grafiku, kterou nepotřebujete rozpoznat.

Kvalita uznání je nadprůměrná, nemusíte se registrovat.

4) http://www.free-ocr.com/

Velmi jednoduchá služba pro rozpoznávání: stahování obrázku, zadání jazyka, zadání captcha (mimochodem, jediná služba v tomto článku, kde by měla být provedena) a stisknutím tlačítka přeneste obrázek do textu. Vlastně všechno!

Podporované formáty: PDF, JPG, GIF, TIFF, BMP.

Výsledek rozpoznávání je průměrný. Tam jsou chyby, ale není mnoho z nich. Nicméně pokud by kvalita původní obrazovky byla vyšší - chyby by měly být řádově menší.

PS

To je vše pro dnešek. Pokud znáte více zajímavých služeb pro rozpoznávání textu - podělte se o komentáře, budu vám vděčný. Jedna podmínka: je žádoucí, aby nebylo nutné se registrovat a služba byla zdarma.

Všechno nejlepší!

Pomozte vývoji webu a sdílení článku s přáteli!

Kategorie: