Kalbos atpažinimo „Python“: kaip išversti kalbą į tekstą?



Šiame tinklaraštyje kalbų atpažinimas python'e apima pavyzdinę programą, kuri kalbą paverčia tekstu, naudojant kalbos atpažinimą.

Kalba yra labiausiai paplitusi bendravimo priemonė visame pasaulyje. Dauguma pasaulio gyventojų remiasi kalba, kad galėtų bendrauti vieni su kitais. Tarkime, kad mes kuriame modelį ir vietoj rašytinio požiūrio norime, kad mūsų sistema reaguotų į kalbą, jis tampa gana sunkus ir reikalauja daug duomenų apdorojimo. Kalbos atpažinimo sistema įveikia šią kliūtį, versdama kalbą į tekstą. Šiame tinklaraštyje patirsime kalbos atpažinimo funkciją modulis python . Čia yra tas pats sąrašas:

Kaip veikia kalbos atpažinimas?

Kalbos atpažinimo sistema iš esmės verčia sakomus pasakymus į tekstą. Yra įvairių kalbų atpažinimo sistemos pavyzdžių realiame gyvenime. Pavyzdžiui, „siri“, kuris kalbą laiko įvestimi ir paverčia tekstu.





Kalbos atpažinimo sistemos naudojimo pranašumas yra tas, kad ji įveikia raštingumo barjerą. Kalbos atpažinimo modelis gali tarnauti tiek raštingai, tiek neraštingai auditorijai, nes jis orientuotas į sakomus pasakymus.

Mes taip pat galime inventorizuoti visas nykstančias kalbas visame pasaulyje, naudodami kalbos atpažinimo sistemą. Nors kalbų atpažinimo sistema atrodo gana intriguojanti ir visiškai nesudėtinga, ji susiduria su daugybe iššūkių.



Iššūkiai, su kuriais susiduria kalbos atpažinimas Sistema

Kalbos atpažinimo sistemą tampa sunku sukurti, nes kalbant turime tiek daug kintamumo šaltinių.

antrosios pakopos diplomas ir magistrai

Kalbėjimo stilius

Kiekvienas žmogus turi įvairų kalbėjimo stilių, įskaitant akcentus. Kaip visi žinome, mes taip pat turime skirtingus akcentus kalbėdami angliškai. Kalbant apie labiausiai paplitusią kalbą pasaulyje, yra amerikiečių anglų, britų anglų ir tiek daug kitų akcentų. Tarimas taip pat apsunkina kalbos atpažinimo sistemos vertimą iš viso.



Aplinka

Aplinka taip pat suteikia daug foninio triukšmo sistemai. Izoliuotoje patalpoje, palyginti su auditorija, bus labai įvairūs foniniai triukšmai. Net aidas gali sukelti daug triukšmo sistemoje.

Garsiakalbio charakteristikos

Seno žmogaus balsas gali būti ne toks pat kaip kūdikio. Asmens kalbos savybės priklauso nuo daugelio veiksnių, įskaitant griežtumą ir aiškumą.

Kalbos apribojimai

Kai kurie sakomi pasakymai gali neturėti perspektyvios reikšmės vertimo atžvilgiu.

Įveikęs šiuos iššūkius, bet kurią kalbos atpažinimo sistemą yra gana įmanoma versti kalbą į tekstą. Dabar, kai žinome, kaip veikia kalbos atpažinimas, galime pažvelgti į skirtingus dalykus kuriuos galima atpažinti kalbą python.

Galimi kalbos atpažinimo python paketai

  • apiai

  • Kalbos atpažinimas

  • „Google_speech_cloud“

  • assemblyai

  • Pocketphinx

  • Watson_developer_cloud

  • baltas

Šiame tinklaraštyje apžvelgsime „SpeechRecognition“ paketo detales, taip pat galime pažvelgti žemyn į atminties juostą, kad suprastume, kaip per daugelį metų vystėsi kalbos atpažinimo sistemos.

Pats pirmasis kalbos atpažinimo prototipas iš tikrųjų buvo žaislas, pavadintas radijo reksas kuris atsirado apie 1920-uosius. Šunyje sėdėjo šuo, kuris pasirodys iškart, kai kas nors ištars žodį „reksas“.

Vienintelė modelio problema buvo ta, kad spyruoklė buvo pritvirtinta prie elektromagneto, kuris jautrus maždaug 500 Hz energijai. Būdamas grynai dažnio detektorius, jį galima nuotoliniu būdu vadinti kalbos atpažinimo modeliu.

1962 m. IBM sugalvojo a batų dėžutė modelis, kuris sugebėjo atpažinti pavienius žodžius ir atlikti keletą aritmetinių operacijų.

Tada atėjo HARPY iš CMU, kuris sugebėjo atpažinti susietą kalbą iš 1000 žodžių žodyno. Apie devintąjį dešimtmetį žmonės pradėjo naudoti statistinius modelius, o viena iš dažniausiai naudojamų mašininio mokymosi paradigmų buvo paslėptas markovo modelis.

Įvedus giliuosius neuroninius tinklus, dauguma kalbos atpažinimo modelių veikia neuroniniuose tinkluose. Su neuroniniais tinklais galimybės neįsivaizduojamos, žodynas gali sudaryti iki 10 tūkstančių žodžių.

dvejetainis paieškos algoritmas Java

Kaip įdiegti „SpeechRecognition“ į „Python“?

Norėdami įdiegti „SpeechRecognition“ paketą yra „python“, terminale paleiskite šią komandą ir ji bus įdiegta jūsų sistemoje.

diegimas-kalbos atpažinimas python-edureka

Kitas būdas tai padaryti gali būti paketo pridėjimas iš projekto vertėjo, jei naudojate

Pakete yra „Recognizer“ klasė, kurioje iš esmės vyksta magija. Iš esmės tai yra klasė, naudojama kalbai atpažinti. Toliau pateikiami septyni metodai, kuriais galima skaityti įvairius garso šaltinius naudojant skirtingas API.

  • atpažinti_bing ()
  • atpažinti_google ()
  • atpažinti_google_cloud ()
  • atpažinti_houndify ()
  • atpažinti_ibm ()
  • atpažinti wit ()
  • atpažinti_sfinksą ()

Dabar „atpazinti_sphinx“ galima naudoti kalbos atpažinimo sistemai paleisti ir neprisijungus. Tam reikia įdiegti „Pocketsphinx“.

importuoti kalbos atpažinimą kaip sr # atpažinimo klasės klasė r = sr. Atpažintuvas ()

Mikrofonų įvesties paėmimas

Norėdami naudoti mikrofonus, turėsime įdiegti ir pyaudio modulį. Mes naudojame mikrofono klasę, kad gautume įvesties kalbą iš mikrofono, o ne bet kurį kitą įvesties metodą, pvz., Garso failą.

Daugumoje projektų galime naudoti numatytuosius mikrofonus. Bet jei nenorite naudoti numatytojo mikrofono,mikrofonų pavadinimų sąrašą galite gauti naudodami „list_microphone_names“ metodą.

Norėdami užfiksuoti įvestį iš mikrofono, naudojame klausymo metodą.

importuoti kalbos atpažinimą kaip sr r = sr. Atpažintuvas () su sr. Mikrofonas () kaip šaltinis: garsas = sr. klausykite (šaltinis)

Kaip įdiegti „Pyaudio“ į „Python“?

Norėdami įdiegti „Pyaudio“ python, vykdykite šią komandą terminale arba, jei naudojate pycharm, pridėkite paketą iš projekto vertėjo nustatymuose.

Naudojimo atvejis

Mes sukursime programą, naudodamiesi kalbos atpažinimo moduliu python, kad atpažintume kalbą ir atliktume šiuos veiksmus:

  1. konvertuoti kalbą į tekstą
  2. atidarykite URL naudodami žiniatinklio naršyklės modulį
  3. perduokite užklausą naudodamiesi kalbos atpažinimo funkcija, kad atliktumėte paiešką URL

Toliau pateikiama aukščiau nurodyto problemos sprendimo programa:

importuoti kalbos_atpažinimą kaip sr importuoti žiniatinklio naršyklę kaip wb r1 = sr. spausdinti ('kalbėti dabar') audio = r3.klausyti (šaltinis), jei 'edureka' yra r2.recognize_google (audio): r2 = sr.Recognizer () url = 'https://www.edureka.co/' with sr .Mikrofonas () kaip šaltinis: spausdinti ('ieškoti užklausos') audio = r2.klausyti (šaltinis) bandyti: get = r2.atpažinti_google (garso) spausdinti (gauti) wb.get (). Open_new (url + get) išskyrus sr.UnknownValueError: spausdinti („klaida“), išskyrus sr.RequestError kaip e: print („nepavyko“. formatas (e)), jei „video“ r1.recognize_google (audio): r1 = sr.Recognizer () url = ' https://www.youtube.com/results?search_query= 'su sr.Microphone () kaip šaltinį: print (' search for a video ') audio = r2.klausykite (source) try: get = r1.recognize_google (audio) ) print (get) wb.get (). open_new (url + get), išskyrus sr.UnknownValueError: print („negalėjo suprasti“), išskyrus sr.RequestError kaip e: print (nepavyko gauti rezultatų). formatas (e) )

Išvestį gausite taip, kaip parodyta paveikslėlyje. Jei sakote „edureka“, tai paragins jus pasakyti užklausą, kurios norite ieškoti „edureka“ URL, kurį parašėme kintamajame URL. Jei pasakysite „python“, naršyklėje atidarysite šį tinklalapį.

Šiame tinklaraštyje aptarėme, kaip mes galime naudoti kalbos atpažinimą „python“ programoje, norėdami išversti kalbą į tekstą naudodami kalbos atpažinimo paketą. tapo valandos poreikiu tokioms sąvokoms kaip kalbos atpažinimas ar objekto atmetimas, su tai suteikia neįsivaizduojamas galimybes kalbos atpažinimo sistemoms, kuriose mes galime mokyti ir išbandyti didžiulius kalbos duomenis, kad sukurtume sistemą. Galite užsiregistruoti giliems neuroniniams tinklams įvaldyti savo įgūdžius ir pradėti mokymąsi.

turite klausimų? paminėkite juos komentaruose, mes susisieksime su jumis.