Што такое распазнаванне прамовы?

Выкарыстанне галасы ў якасці метаду ўводу

Распазнаванне прамовы з'яўляецца тэхналогіяй, якая дазваляе казаць ўваход у сістэмы. Вы кажаце з вашым кампутарам, тэлефонам або прыладай, і ён выкарыстоўвае тое, што вы сказалі, у якасці ўваходных дадзеных, каб выклікаць хоць нешта зрабілі. Тэхналогія выкарыстоўваецца для замены іншых метадаў уводу, як ўводзіць, націснуўшы або выбраўшы іншымі спосабамі. Гэта сродак, каб зрабіць прылады і праграмнае забеспячэнне больш зручным для карыстальнікаў і павысіць прадукцыйнасць працы.

Ёсць шмат прыкладанняў і абласцей, у якіх выкарыстоўваецца распазнанне прамовы, у тым ліку ваенных, у якасці дапамогі для асоб з дэфектамі гледжання (уявіце сабе чалавека з калекай або без рук або пальцаў), у медыцынскай сферы, у галіне робататэхнікі і г.д. У бліжэйшай будучыні, амаль усе будуць падвяргацца распазнання прамовы з-за яго распаўсюджвання сярод звычайных прылад, такіх як кампутары і мабільныя тэлефоны.

Некаторыя смартфоны робяць цікавае прымяненне распазнання прамовы. Прылады iPhone і Android з'яўляюцца прыкладамі гэтага. Праз іх вы можаце ініцыяваць выклік кантакту, проста атрымліваючы вусную інструкцыю, як «Call-офіс». Іншыя каманды могуць быць таксама забаўлялі, як «Уключыць Bluetooth».

Праблемы распазнання прамовы

Распазнаванне прамовы, у яго версіі, вядомай як прамовы ў тэкст (STT), таксама выкарыстоўваецца на працягу доўгага часу, каб перавесці вымаўленыя словы ў тэкст. «Вы кажаце, гэта тыпы», а ViaVoice сказаў бы на сваім полі. Але ёсць адна праблема з STT, як мы яго ведаем. Больш за 10 гадоў таму, я паспрабаваў ViaVoice і гэта не падоўжылася тыдні на маім кампутары. Чаму? Гэта было груба недакладнай і я ў канчатковым выніку марнуюць больш часу і энергіі, гаваркімі і карэкцыі, чым друкаваць усё. ViaVoice з'яўляецца адным з лепшых у галіны, так сабе ўсё астатняе. Тэхналогія саспела і палепшылася, але гаворка ў тэкст ўсё яшчэ прымушае людзей задаваць пытанні. Адной з асноўных цяжкасцяў з'яўляюцца вялізнымі адрозненнямі паміж людзьмі ў вымаўленні слоў.

Не ўсе мовы, як мяркуецца, у распазнанні прамовы, і тыя, якія часта не падтрымліваюцца, а таксама на англійскай мове. У выніку, большасць прылад, якія працуюць праграмы распазнання прамовы выконваць дастаткова толькі на англійскай мове.

Набор патрабаванняў да апаратных робіць распазнаванне прамовы цяжка разгарнуць у пэўных выпадках. Вам патрэбен мікрафон, які досыць, каб адфільтраваць фонавы шум інтэлектуальныя, але ў той жа час досыць магутным, каб захапіць голас натуральна.

Гаворачы аб фонавым шуме, гэта можа выклікаць цэлы збой сістэмы. У выніку распазнаванне прамовы не можа ў многіх выпадках з-за шумы, якія знаходзяцца па-за кантролем карыстальніка.

Распазнаванне прамовы аказваецца лепш у якасці метаду ўводу для новых тэлефонаў і камунікацыйных тэхналогій, такіх як VoIP, чым як інструмент для павышэння прадукцыйнасці для масавага ўводу тэксту.

Прымяненне распазнання прамовы

Тэхналогія набірае папулярнасць у многіх галінах і быў паспяховым у наступным:

- Упраўленне прылад. Проста сказаць «OK Google» на Android тэлефона пажары сістэмы, якая з'яўляецца усімі вушамі галасавых каманд.

- сістэмы аўтамабіля Bluetooth. Шматлікія аўтамабілі аснашчаны сістэмай, якая злучае яго механізм радыё на свой смартфон праз Bluetooth. Вы можаце рабіць і прымаць званкі, не крануўшы вашага смартфона, і нават можа набіраць нумары, проста кажучы іх.

- Голас транскрыпцыі. У тых раёнах, дзе людзі павінны набраць шмат, некаторы інтэлектуальнае праграмнае забеспячэнне захоплівае іх вымаўленыя словы і прайграў іх у тэкст. Гэта ток у пэўнай праграме апрацоўкі тэкстаў. Голас транскрыпцыя таксама працуе з візуальнай галасавой поштай .