Mašīna valoda: kā Siri paceļ savu balsi?
Makradar Tehnoloģijas / / December 19, 2019
Google, Apple, Microsoft, un pat Amazon aktīvi attīstīt savu balss pakalpojumus. Svaigi ceptu iOS 7 ir tas pats Siri tikai jaunie funkcijas un... balss. Vai jūs zināt, kā tas ir process? Tā kā datori tiek mācīts runu? šis īsta māksla.
Par katru no pauž Siri - jūsu aktieris. Kad tas ir pabeigusi savu lomu artikulācijas, tad darbs ir tikai sācies... Vīra balss turpina ceļu. Šī ceļojuma stāsts, gan cilvēka un robots - viens no visvairāk sarežģītu tehnoloģisko procesu, kas varētu nenotikt pirms desmit gadiem.
Iepazīsimies ar direktors dizaina un attīstības balss Nuance, tas ir viens no lielākajiem neatkarīgajiem uzņēmumiem pasaulē, kas nodarbojas ar runas atpazīšanas un teksta runas. Brant Ward (J. Brant Ward), ko izmanto, lai būt komponists, sacerēt pusi, stīgu kvartetiem uz sintezatoriem, un tagad viņš komponē to, izmantojot sintētisko balsis. Viņš strādā runas sintēzes nozares Silīcija ielejā vairāk nekā desmit gadus.
Text to Speech - ļoti konkurētspējīgu nozari, un tās darbiniekiem ir ļoti noslēpumains. Lai gan pasaulē, un uzskata, ka Nianse rada balss Siri par, Ward un viņa kolēģis Deivids Vasquez (David Vazquez) novērstu tiešu atbildi. Neskatoties uz to, viņi piekrita, lai izskaidrotu, vismaz kopumā, kā process radīt pārsteidzošu mašīna balsis.
Lieki piebilst, ka nav nepieciešams skaidrot un rakstīt katru vārdu no vārdnīcas. Bet, kad runa ir par pieteikumu, kas jālasa nekādas ziņas jūsu biļetenu, vai atrast kaut ko jums internetā, tas ir vienkārši pienākums runāt katru vārdu vārdnīcā.
Lielākā daļa no priekšlikumiem ir atlasīti, pamatojoties uz "turīguma fonētika", - tas ir, tie satur daudz dažādu fonēmu. "Fakts ir, jo vairāk datu mums ir, jo reāli rezultāts būs," - saka Ward.
Pēc tam, kad teksts ir ierakstīts dzīvā balss aktieris (nogurdinošs process var ilgt vairākus mēnešus), kas ir ļoti smags darbs sākas. Vārdi un teikumi tiek analizēti, sadalīti pēc kategorijām un ierakstīts lielā datu bāzē. Šajā sarežģītajā darbā iesaistīti komandas veltīta valodnieki, kā arī lietot dzimto valodu programmatūru.
Kad tas viss ir izdarīts, tad vienība Nuance tulkot tekstu runas rada bitu vārdus un frāzes, ko aktieris var Es nekad tiešām izteicis, bet tas izklausās ļoti līdzīgs runas aktieris, jo tehniski tas ir balss aktieris.
Process speaking ir bezsamaņā. Mēs to nedomājot par to, kā šis process notiek: situācija, kas ir mūsu valoda, kas attiecības tiek būvētas starp fonēmu, un tā tālāk - lai viegli un efektīvi izteikt sarežģītas idejas un emocijas. Bet lai dators paņēma skaņu cilvēku balsis, ir jāņem vērā visi šie faktori. Kā viens profesors valodniecības, ir uzdevums "Titānika".
Jums nevajadzētu domāt: "Es runāju ar datoru." Tu vispār nav nepieciešams domāt par to.
"Mani bērni mijiedarbojas ar Siri, it kā tas būtu dzīva būtne... Viņi nejūt atšķirību," - saka Ward.
Līdz šim, un draudzībai starp cilvēkiem un robotiem - piemēram, cilvēkiem. Daudzi cilvēki gribētu, ja Siri var atpazīt emocionālo stāvokli runātājs, un kaut kā reaģēt uz to (piemēram, ietvert nomierinošas balss režīmā). Iedomājieties - runāt ar robots, kas ir morāli Pat jums uz galvas. Varbūt, Nuance jau domā par to, ...