Pomozte vývoji webu a sdílení článku s přáteli!
Pozdravy všem čtenářům blogu!
Myslím, že ti, kteří často pracují na počítači (nehraje, tedy pracují), se museli zabývat rozpoznáním textu. Například jste skenovali průchod z knihy a nyní musíte tuto část vložit do dokumentu. Ale naskenovaný dokument je obrázek a potřebujeme text - pro to je zapotřebí speciálních programů a služeb online, které rozpoznávají text z obrázků.
O programu pro uznání jsem již napsal v předchozích příspěvcích:
- skenování textu a rozpoznávání v programu FineReader (placený program);
- práci v analogovém programu FineReader - CuneiForm (bezplatný program).
Ve stejném článku bych se rád soustředil na online služby pro rozpoznávání textu. Koneckonců, pokud potřebujete rychle dostat text s 1-2 obrázky - nemá smysl trápit instalací různých programů …
Důležité! Kvalita rozpoznávání (počet chyb, čitelnost atd.) Velmi závisí na původní kvalitě obrazu. Proto při skenování (fotografování atd.) Vyberte kvalitu co nejvyšší. Ve většině případů bude postačovat kvalita 300-400 dpi (parametr charakterizující kvalitu obrazu). V nastavení téměř všech skenerů je tento parametr obvykle indikován.
Online služby
Abych ukázal práci služeb, vytvořil jsem screenshot jednoho z mých článků. Tato obrazovka bude stažena ke všem službám popsaným níže.
1) http://www.ocrconvert.com/
Tato služba se mi líbí velmi pro svou jednoduchost. Stránky jsou ale také anglicky, ale dobře pracují a rusky. Nemusíte se registrovat. Chcete-li začít rozpoznávat, musíte provést 3 kroky:
- nahrát obrázek;
- vyberte jazyk textu, který je na obrázku;
- Stiskněte tlačítko rozpoznání.
Podporované formáty: PDF, GIF, BMP, JPEG.
Výsledek je uveden níže na obrázku. Musím říci, že text byl dobře znám. Navíc, velmi rychle - čekal jsem doslova 5-10 sekund.
2) http://www.i2ocr.com/
Tato služba funguje podobně jako výše. Zde také musíte stáhnout soubor, vybrat jazyk rozpoznávání a klepnout na tlačítko extrahovat text. Služba je velmi rychlá: 5-6 s. pro jednu stránku.
Podporuje formáty: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Výsledkem této online služby je mnohem pohodlnější: okamžitě vidíte dvě okna - první je výsledkem rozpoznání, ve druhém - původní obrázek. Proto je snadné provádět úpravy v průběhu editace. Mimochodem, nemusíte se registrovat ani pro službu.
3) http://www.newocr.com/
Tato služba je jedinečná několika způsoby. Nejprve podporuje formát formátu DJVU "newfangled" (mimochodem, úplný seznam formátů: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Zadruhé podporuje výběr textových oblastí na obrázku. To je velmi užitečné, když máte v obraze nejen textové oblasti, ale také grafiku, kterou nepotřebujete rozpoznat.
Kvalita uznání je nadprůměrná, nemusíte se registrovat.
4) http://www.free-ocr.com/
Velmi jednoduchá služba pro rozpoznávání: stahování obrázku, zadání jazyka, zadání captcha (mimochodem, jediná služba v tomto článku, kde by měla být provedena) a stisknutím tlačítka přeneste obrázek do textu. Vlastně všechno!
Podporované formáty: PDF, JPG, GIF, TIFF, BMP.
Výsledek rozpoznávání je průměrný. Tam jsou chyby, ale není mnoho z nich. Nicméně pokud by kvalita původní obrazovky byla vyšší - chyby by měly být řádově menší.
PS
To je vše pro dnešek. Pokud znáte více zajímavých služeb pro rozpoznávání textu - podělte se o komentáře, budu vám vděčný. Jedna podmínka: je žádoucí, aby nebylo nutné se registrovat a služba byla zdarma.
Všechno nejlepší!