Што такое аптычнае распазнаванне сімвалаў (OCR)?

Аптычнага распазнавання сімвалаў (OCR) адносіцца да праграмнага забеспячэння, якое стварае лічбавую версію друкаванага, надрукаванага або рукапіснага дакумента, што кампутары могуць чытаць без неабходнасці ўручную ўводзіць або ўвесці тэкст. OCR , як правіла , выкарыстоўваецца на адсканаваных дакументах у PDF - фармаце, але таксама можа ствараць машыначытэльную версію тэксту ў межах файла малюнка.

Што такое OCR?

OCR, таксама згадваецца як распазнаванне тэксту, гэта праграмная тэхналогія, якая пераўтворыць сімвалы, такія як лікі, літары і знакі прыпынку (таксама званыя глифов) з друкаваных або пісьмовых дакументаў у электронным выглядзе больш лёгка пазнаюцца і чытаць з дапамогай кампутараў і іншых праграм. Некаторыя праграмы OCR зрабіць гэта як дакумент скануецца або фатаграфавалі з дапамогай лічбавай камеры і іншыя могуць прымяняць гэты працэс да дакументаў, якія былі раней адсканаваных ці сфатаграфаваных без OCR. OCR дазваляе карыстальнікам ажыццяўляць пошук у PDF-дакументах, рэдагаванне тэксту і дакументаў перафарматаваць.

Што такое OCR выкарыстоўваецца?

Для хуткага, кожны дзень сканавання патрэбаў, OCR не можа быць вялікім справай. Калі вы робіце вялікую колькасць сканавання, магчымасць пошуку ў PDF-файлах, каб знайсці дакладную адно вам можа зэканоміць нямала часу і робяць функцыянальнасць OCR у праграме сканэра больш важнай. Вось некаторыя іншыя рэчы OCR дапамагае з:

Навошта выкарыстоўваць OCR?

Чаму б не проста сфатаграфаваць, ці не так? Таму што вы не змаглі б змяніць што-небудзь ці шукаць тэкст, таму што гэта будзе проста малюнак. Сканаванне дакумента і запуск праграмнага забеспячэння ОРС можна ўключыць гэты файл у тое, што вы можаце рэдагаваць і быць у стане пошуку.

гісторыя OCR

У той час як самы ранні выкарыстанне распазнання тэксту ўзыходзіць да 1914 году, развіццё шырокага распаўсюджвання і выкарыстанне OCR-тэхналогіі, звязаным пачаліся ў 1950-х гадах, у прыватнасці, са стварэннем вельмі спрошчаных шрыфтоў, якія былі лягчэй пераўтварыць у лічбавы чытаны тэксце. Першы з гэтых спрошчаных шрыфтоў была створана Дэвідам Шепарда і шырока вядомы як OCR-7В. OCR-7В ўсё яшчэ выкарыстоўваецца сёння ў фінансавай сферы для стандартнага шрыфта, які выкарыстоўваецца па крэдытных картах і дэбетавых карт. У 1960-я гады, паштовыя паслугі ў шэрагу краін пачалі выкарыстоўваць тэхналогію OCR, каб значна паскорыць сартаванне пошты, у тым ліку ЗША, Вялікабрытаніі, Канадзе і Германіі. OCR-ранейшаму з'яўляецца асноўнай тэхналогіяй, якая выкарыстоўваецца для сартавання пошты для паштовых паслуг па ўсім свеце. У 2000 годзе , ключ веданне абмежаванняў і магчымасцяў тэхналогіі OCR была выкарыстаная для распрацоўкі праграмы CAPTCHA , якія выкарыстоўваюцца , каб спыніць ботаў і спамераў.

На працягу дзесяцігоддзяў, OCR стала больш дакладным і больш складаным з - за дасягненні ў сумежных галінах тэхналогіі , такія як штучны інтэлект , машыннае навучанне і камп'ютэрнае зрок. Сёння праграмнае забеспячэнне OCR выкарыстоўвае распазнаванне вобразаў, функцыю выяўленне і выманне тэксту для пераўтварэння дакументаў хутчэй і дакладней, чым калі-небудзь раней.