Kaj je prepoznavanje govora?

Uporaba vašega glasu kot način vnosa

Prepoznavanje govora je tehnologija, ki omogoča govorne vnose v sisteme. Pogovorite se z računalnikom, telefonom ali napravo in uporablja to, kar ste rekli kot vhod, da sprožite nekaj dejanj. Tehnologija se uporablja za zamenjavo drugih metod vnosov, kot so tipkanje, klicanje ali izbiranje na druge načine. To je sredstvo, s katerim pripomočke in programsko opremo naredite bolj prijazno uporabnikom in povečate produktivnost.

Obstaja veliko aplikacij in področij, kjer se uporablja prepoznavanje govora, vključno z vojsko, kot pomoč za oslabljene osebe (zamislite osebo s pohabljenimi ali brez rok ali prstov), ​​na medicinskem področju, v robotiki itd. V bližnji prihodnosti, skoraj vsi bodo izpostavljeni prepoznavanju govora zaradi razširjanja med običajnimi napravami, kot so računalniki in mobilni telefoni.

Nekateri pametni telefoni zanimivo uporabljajo prepoznavanje govora. Primeri tega so naprave iPhone in Android. Prek njih lahko pokličete stik, tako da preprosto dobite govorna navodila, kot je "Klicni urad". Lahko se zabavajo tudi drugi ukazi, na primer "Vključi Bluetooth".

Težave z prepoznavanjem govora

Prepoznavanje govora, v svoji različici, znani kot Govor v besedilo (STT), je bilo že dolgo časa uporabljeno za prevajanje izgovorjenih besed v besedilo. "Govoriš, to tipi", kot bi rekel ViaVoice na svojem okencu. Ampak obstaja ena težava s STT, kot jo poznamo. Več kot 10 let nazaj sem poskusil ViaVoice in ni trajal teden dni na mojem računalniku. Zakaj? Bilo je zelo nenatančno in na koncu sem porabil več časa in energije, ki so govorili in popravljali, kot pa tipkali vse. ViaVoice je eden najboljših v industriji, zato si predstavljajte ostalo. Tehnologija je dozorela in izboljšala, vendar govor v besedilo še vedno ljudi postavlja vprašanja. Ena od njenih glavnih težav je ogromna razlika med ljudmi pri izgovarjanju besed.

V prepoznavanju govora naj ne bi bili vsi jeziki, pogosto pa ne podpirajo tudi angleščine. Kot rezultat, večina naprav, ki upravljajo program za prepoznavanje govora, opravljajo razumno le z angleščino.

V nizu zahtev strojne opreme je v določenih primerih prepoznavanje govora težko razporediti. Potrebujete mikrofon, ki je dovolj inteligenten za filtriranje hrupa v ozadju, hkrati pa dovolj močan za glasovno naravo glasu.

Ko govorimo o ozadju hrupa, lahko povzroči, da celoten sistem ne uspe. Posledica tega je, da prepoznavanje govora v mnogih primerih ni uspelo zaradi hrupa, ki je zunaj uporabnika.

Pripoznavanje govora je boljše kot vhodna metoda za nove telefone in komunikacijske tehnologije, kot je VoIP, kot orodje za produktivnost za množični vnos besedila.

Uporaba prepoznavanja govora

Tehnologija postaja priljubljena na številnih področjih in je bila uspešna v naslednjih primerih:

- Nadzor naprave. Pravi, da »OK Google« na telefon s sistemom Android sproži sistem, ki je vse ušesa vašim glasovnim ukazom.

- Avtomobilski sistemi Bluetooth. Mnogi avtomobili so opremljeni s sistemom, ki povezuje svoj radijski mehanizem s svojim pametnim telefonom prek povezave Bluetooth. Nato lahko kličete in sprejemate klice, ne da bi se dotaknili vašega pametnega telefona, in lahko celo pokličete številke, tako da jih preprosto izgovorite.

- Prenos govora. Na področjih, kjer ljudje veliko vnašajo, nekatere inteligentne programske opreme zajebejo svoje izgovorjene besede in jih prepisujejo v besedilo. To je trenutno v določeni programski opremi za obdelavo besedil. Prenos govora deluje tudi z vizualno glasovno pošto .