Аптычнага распазнавання сімвалаў (OCR) адносіцца да праграмнага забеспячэння, якое стварае лічбавую версію друкаванага, надрукаванага або рукапіснага дакумента, што кампутары могуць чытаць без неабходнасці ўручную ўводзіць або ўвесці тэкст. OCR , як правіла , выкарыстоўваецца на адсканаваных дакументах у PDF - фармаце, але таксама можа ствараць машыначытэльную версію тэксту ў межах файла малюнка.
Што такое OCR?
OCR, таксама згадваецца як распазнаванне тэксту, гэта праграмная тэхналогія, якая пераўтворыць сімвалы, такія як лікі, літары і знакі прыпынку (таксама званыя глифов) з друкаваных або пісьмовых дакументаў у электронным выглядзе больш лёгка пазнаюцца і чытаць з дапамогай кампутараў і іншых праграм. Некаторыя праграмы OCR зрабіць гэта як дакумент скануецца або фатаграфавалі з дапамогай лічбавай камеры і іншыя могуць прымяняць гэты працэс да дакументаў, якія былі раней адсканаваных ці сфатаграфаваных без OCR. OCR дазваляе карыстальнікам ажыццяўляць пошук у PDF-дакументах, рэдагаванне тэксту і дакументаў перафарматаваць.
Што такое OCR выкарыстоўваецца?
Для хуткага, кожны дзень сканавання патрэбаў, OCR не можа быць вялікім справай. Калі вы робіце вялікую колькасць сканавання, магчымасць пошуку ў PDF-файлах, каб знайсці дакладную адно вам можа зэканоміць нямала часу і робяць функцыянальнасць OCR у праграме сканэра больш важнай. Вось некаторыя іншыя рэчы OCR дапамагае з:
- Аўтаматызаваная апрацоўка дадзеных і ўвод дадзеных (прыклад: Праца заяўніка сістэм адсочвання для рэзюмэ)
- Стварэнне адсканаваных кніг для пошуку
- Пераўтварэнне рукапіснага сканавання ў машыначытальны тэксту
- Стварэнне дакументаў больш зручнага шляхам чытання праграм, якія дапамагаюць карыстальнікам з дрэнным зрокам
- Захоўваючы гістарычныя дакументы і газеты, а таксама зрабіць іх даступнымі для пошуку
- Выманне дадзеных і перадача бухгалтарскіх праграм (напрыклад, квітанцый і рахункаў-фактур)
- Індэксаванне дакументаў для выкарыстання пошукавых сістэм
- Прызнанне правоў кіроўцы пласцін хуткасці камера і праграмнае забеспячэнне камеры чырвонага святла
- Маўленчыя сінтэзатары для людзей, якія не могуць гаварыць - фізік-тэарэтык Стывен Хокінга, мабыць, самы вядомы карыстальнік праграмы сінтэзатара гаворкі
Навошта выкарыстоўваць OCR?
Чаму б не проста сфатаграфаваць, ці не так? Таму што вы не змаглі б змяніць што-небудзь ці шукаць тэкст, таму што гэта будзе проста малюнак. Сканаванне дакумента і запуск праграмнага забеспячэння ОРС можна ўключыць гэты файл у тое, што вы можаце рэдагаваць і быць у стане пошуку.
гісторыя OCR
У той час як самы ранні выкарыстанне распазнання тэксту ўзыходзіць да 1914 году, развіццё шырокага распаўсюджвання і выкарыстанне OCR-тэхналогіі, звязаным пачаліся ў 1950-х гадах, у прыватнасці, са стварэннем вельмі спрошчаных шрыфтоў, якія былі лягчэй пераўтварыць у лічбавы чытаны тэксце. Першы з гэтых спрошчаных шрыфтоў была створана Дэвідам Шепарда і шырока вядомы як OCR-7В. OCR-7В ўсё яшчэ выкарыстоўваецца сёння ў фінансавай сферы для стандартнага шрыфта, які выкарыстоўваецца па крэдытных картах і дэбетавых карт. У 1960-я гады, паштовыя паслугі ў шэрагу краін пачалі выкарыстоўваць тэхналогію OCR, каб значна паскорыць сартаванне пошты, у тым ліку ЗША, Вялікабрытаніі, Канадзе і Германіі. OCR-ранейшаму з'яўляецца асноўнай тэхналогіяй, якая выкарыстоўваецца для сартавання пошты для паштовых паслуг па ўсім свеце. У 2000 годзе , ключ веданне абмежаванняў і магчымасцяў тэхналогіі OCR была выкарыстаная для распрацоўкі праграмы CAPTCHA , якія выкарыстоўваюцца , каб спыніць ботаў і спамераў.
На працягу дзесяцігоддзяў, OCR стала больш дакладным і больш складаным з - за дасягненні ў сумежных галінах тэхналогіі , такія як штучны інтэлект , машыннае навучанне і камп'ютэрнае зрок. Сёння праграмнае забеспячэнне OCR выкарыстоўвае распазнаванне вобразаў, функцыю выяўленне і выманне тэксту для пераўтварэння дакументаў хутчэй і дакладней, чым калі-небудзь раней.