3 најбоља онлајн ОЦР алата за издвајање текста из слика

Транскрибовање текста са слика може бити права мука. Када се текст представи као слика или неки други формат који се не може бирати, школа и посао постају тешки. Једино решење је да ставите те очи и прсте на посао и почнете да куцате – или јесте?

Оптимално препознавање карактера(Character Recognition) , или ОЦР(OCR) , је процес претварања откуцаног или руком писаног текста са медија као што су скенирани документи или фотографије у обичан текст.

Иако је подложан грешкама, у зависности од јасноће текста, коришћење ОЦР(OCR) - а за издвајање текста из слика може вам уштедети сате монотоног рада. Један случај употребе ОЦР(OCR) - а био би ако сте студент коме је потребна одређена страница из уџбеника. Ако би вам пријатељ послао фотографију странице, можете користити ОЦР(OCR) да издвојите сав текст са слике да бисте је лако прочитали и копирали.

У овом чланку, хајде да истражимо три најбоља ОЦР алата на мрежи за издвајање текста из слика, од којих ниједан не захтева никакав ОЦР софтвер(OCR software) или додатке за преузимање.

ОнлинеОЦР(OnlineOCR)(OnlineOCR)

ОнлинеОЦР(OnlineOCR) је један од најједноставнијих и најбржих начина за претварање слике или ПДФ(PDF) датотеке у више различитих текстуалних формата.

Без налога, ОнлинеОЦР.нет(OnlineOCR.net) ће вам омогућити да конвертујете до 15 датотека у текст на сат. Регистровањем налога добијате приступ функцијама као што је претварање ПДФ(PDF) докумената са више страница и још много тога.

ОнлинеОЦР.нет(OnlineOCR.net) подржава конверзију из ПДФ(PDF) , ЈПГ(JPG) , БМП(BMP) , ТИФФ(TIFF) и ГИФ(GIF) формата, излазећи као ДОЦКС(DOCX) , КСЛСКС(XLSX) или ТКСТ(TXT) .

ОнлинеОЦР.нет може да препозна текст на енглеском(English) , афричком(Afrikaans) , албанском(Albanian) , баскијском(Basque) , бразилском(Brazilian) , бугарском(Bulgarian) , каталонском(Catalan) , кинеском(Chinese) , хрватском(Croatian) , чешком(Czech) , данском(Danish) , холандском(Dutch) , есперантском(Esperanto) , естонском(Estonian) , финском(Finnish) , француском(French) , галицијском(Galician) , немачком(German) , грчком(Greek) , мађарском(Hungarian) , исландском(Icelandic) , индонежанском(Indonesian) , италијански(Italian), јапански(Japanese) , корејски(Korean) , латински(Latin) , летонски(Latvian) , литвански(Lithuanian) , македонски(Macedonian) , малајски(Malay) , молдавски(Moldavian) , норвешки(Norwegian) , пољски(Polish) , португалски(Portuguese) , румунски(Romanian) , руски(Russian) , српски(Serbian) , словачки(Slovak) , словеначки(Slovenian) , шпански(Spanish) , шведски(Swedish) , тагалошки(Tagalog) , турски(Turkish) и украјински.

Процес конверзије захтева три једноставна корака. Учитавате датотеку, ограничену на 15 МБ, бирате свој језик и излазни формат и кликните на дугме Конвертуј(Convert) .

Без обзира на формат излаза који изаберете, преглед обичан текстуални приказ конверзије ће се појавити у пољу испод везе за преузимање датотеке у изабраном формату. Ово помаже у спречавању корисника да троше преузимање на екстракцију која може бити нетачна.

НевОЦР(NewOCR)(NewOCR)

НевОЦР(NewOCR) тренутно нуди само екстракцију текста из сликовних датотека, али подржава неколико других занимљивих функција које многи добављачи ОЦР(OCR) -а на мрежи немају.

Да бисте почели да користите НевОЦР(NewOCR) , једноставно кликните на дугме Изабери датотеку(Choose File) , изаберите слику из које желите да издвојите текст, а затим кликните на плаво дугме Преглед(Preview) . Ово ће затим приказати преглед ваше слике и представити неколико додатних опција.

За разлику од већине других онлајн претварача слике у текст, НевОЦР(NewOCR) ће вам заправо омогућити да подесите више језика за препознавање. Ово може бити од велике помоћи ако нисте сигурни на ком језику је написан текст на слици, али имате добру претпоставку и желите да добијете исправан превод из његовог обичног текста.

Ако је ваша слика искошена на једну страну, можете је и динамички ротирати. Када примените неопходне опције, можете да кликнете на плаво дугме ОЦР(OCR) да бисте издвојили текст слике.

Одавде можете преузети извучени текст у ТКСТ(TXT) , ДОЦ(DOC) или ПДФ(PDF) формату или га послати директно у Гоогле преводилац(Google Translate) или Гоогле документе(Google Docs) ради даљег уређивања.

ОЦР.простор(OCR.space)(OCR.space)

На крају, али не и најмање важно, ОЦР.спаце(OCR.space) је дефинитивно једна од најснажнијих опција које смо пронашли, и требало би да вас покрије за скоро сваку операцију слика-у-текст.

ОЦР.спаце је један од најбољих ОЦР алата који подржава ВЕБП(WEBP) формат датотеке. Осим тога, ПНГ(PNG) , ЈПГ(JPG) и ПДФ(PDF) су такође подржани. Поред тога, не морате да отпремате датотеку — можете даљински да се повежете са њом ако је доступна негде на мрежи.

Друге нишне карактеристике укључују аутоматско ротирање(auto-rotation) , скенирање рачуна(receipt scanning) , препознавање табеле(table recognition) и аутоматско скалирање(auto-scaling) . ОЦР(OCR) .спаце је један од јединих алата за ОЦР(OCR) на мрежи који подржава излаз датотека као ПДФ(searchable PDFs) -ова који се могу претраживати (са видљивим или невидљивим текстом), а чак можете бирати између једног од два различита ОЦР механизма(OCR engines) за најбоље могуће издвајање.

Све што треба да урадите је да отпремите или повежете датотеку, кликните на Start OCR!дугме, а затим ће се преглед ваших резултата динамички учитавати на истој страници. Ако сте свој резултат изабрали као ПДФ(PDF) који се може претраживати , биће доступна и дугмад Преузми(Download) и Прикажи преклапање .(Show Overlay)

Једна од најзанимљивијих и јединствених карактеристика ОЦР.спаце-(OCR.space) а је то што може да прикаже вашу екстракцију као ЈСОН(JSON) . Овај ЈСОН(JSON) ће имати поља која укључују сваку реч у тексту и њихове координате на самој слици. Ово је веома цењена функција ако сте кодер који покушава програмски да издвоји текст из слика(extract text from images) .

Уз горенаведена три веб алата, издвајање текста из готово сваке јасне и читљиве слике требало би да буде лако. Чак и ако сте брзи куцач са више монитора, нема потребе да патите због тога што сами преписујете текстуалне слике. ОЦР(OCR) је направљен са разлогом, а ове веб странице вам помажу да га на најбољи начин искористите!

Ако имате неке друге савете за најбоље ОЦР алате или услуге које бисте желели да поделите, или желите помоћ у коришћењу неког од горе наведених, слободно нам пошаљите поруку у коментарима испод.



About the author

Ја сам професионални рачунарски техничар и имам преко 10 година искуства у овој области. Специјализовао сам се за развој Виндовс 7 и Виндовс апликација, као и за дизајн цоол веб локација. Изузетно сам образован и искусан у овој области, и био бих драгоцена предност за сваку организацију која жели да унапреди своје пословање.



Related posts