Modeliranje spontanega govora in zelo pregibnih jezikov za podporo vodenim telekomunikacijskim storitvam

Raziskovalna dejavnost

Koda	Veda	Področje	Podpodročje
2.08.00	Tehnika	Telekomunikacije

Koda	Veda	Področje
T180	Tehnološke vede	Telekomunikacijsko inženirstvo

Ključne besede

telekomunikacijske storitve, uporabniški vmesnik, avtomatsko razpoznavanje govora, modeliranje spontanega govora, modeliranje zelo pregibnih jezikov

Vrednotenje (metodologija)

Vrednotenje bibliografskih kazalcev raziskovalne uspešnosti po metodologiji ARIS

Citiranost Citiranost bibliografskih zapisov v COBIB.SI, ki so povezani z zapisi citatnih baz

Organizacije (1) , Raziskovalci (5)

0796 Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko

št.	Evidenčna št.	Ime in priimek	Razisk. področje	Vloga	Obdobje	Štev. publikacijŠtev. publikacij
1.	27896	dr. Matej Grašič	Telekomunikacije	Mladi raziskovalec	2007 - 2008	59
2.	06821	dr. Zdravko Kačič	Telekomunikacije	Raziskovalec	2007 - 2008	717
3.	21304	dr. Tomaž Rotovnik	Elektronske komponente in tehnologije	Raziskovalec	2007 - 2008	121
4.	18168	dr. Mirjam Sepesy Maučec	Telekomunikacije	Raziskovalec	2007 - 2008	270
5.	20032	dr. Andrej Žgank	Telekomunikacije	Vodja	2007 - 2008	255

Povzetek

Z razvojem telekomunikacijskih omrežij pričakujejo uporabniki tudi razvoj na področju telekomunikacijskih storitev. Eden izmed zelo pomembnih kriterije sodobnih telekomunikacijskih rešitev so prijazni uporabniški vmesniki. Kadar storitev uporablja govorno vodeni vmesnik je tako smiselna uporaba avtomatskega razpoznavanja spontanega govora. Le-to predstavlja na področju jezikovnih tehnologij zelo kompleksen problem, z dokaj visokimi napakami razpoznavanja besed. V projektu se bomo tako osredotočili na raziskave s področja modeliranja spontanega govora. Glavne kategorije efektov spontanega govora, ki jih bomo vključili v modeliranje so: mašila, ponovitve besed, ponovni začetek stavka in delno izgovorjene besede. Glavni cilj projekta je izboljšati rezultate razpoznavanja spontanega govora. Na področju avtomatskega razpoznavanja govora predstavljajo poseben izziv zelo pregibni jeziki (slovenski, ruski,…), ki imajo visok delež besed izven slovarja. V drugem delu projekta se bomo osredotočili na izboljšavo akustičnega modeliranja zelo pregibnih jezikov na osnovi podbesednih enot osnova – končnica. Tudi tukaj je glavni cilj izboljšati rezultate razpoznavanja govora. V zadnjem delu bomo izvedli integracijo novih metod v skupni sistem, ter razvili demonstrator telekomunikacijske storitve.

Pomen za razvoj znanosti

Rezultati projekta so pomembno doprinesli k dvema področjema avtomatskega razpoznavanja govora, ki ga med drugim uporabljamo tudi na področju razvoja telekomunikacijskih storitev. Dosegli smo pomembno izboljšanje rezultatov razpoznavanja spontanega govora, predvsem na področju modeliranja mašil in onomatopej. Predlagano metodo smo sicer eksperimentalno ovrednotili na govornih virih za slovenski jezik, vendar je zaradi uporabe podatkovno vodenih metod modeliranja jezikovno neodvisna.  Predlagano metodo bo tako možno prenesti tudi na modeliranje spontanega govora v drugih svetovnih jezikih. Avtomatsko razpoznavanje govora je vključeno tudi v druga področja informacijsko-komunikacijskih tehnologij (npr.: strojno prevajanje iz govora v govor, uporabniški vmesniki), tako da lahko posledično pričakujemo vpliv tudi na njih. Analiza rezultatov modeliranja spontanega govora je pokazala, da predstavlja izredno kompleksen problem modeliranje delno izgovorjenih besed, tako da bo smiselno temu področju posvetiti dodatno pozornost v prihodnjih raziskavah, kar potrjujejo tudi tematike aktualnih objav na mednarodnih konferencah.

Rezultati raziskav o kombiniranju govornih virov so pokazali, da je na takšen način možno izboljšati tako akustično modeliranje spontanega govora kot tudi modeliranje močno pregibnih jezikov. To je bilo še posebej opazno pri učenju na osnovi nepopolnih transkripcij. Smernice o možnostih kombiniranja različnih govornih virov so še posebej pomembno za jezike s slabše razvitimi govornimi viri. V to kategorijo sodi velika večina današnjih živih jezikov, saj je razvoj novih govornih virov povezan z zelo velikimi časovnimi in finančnimi vložki.

Opravljene raziskave na področju modeliranja pregibnih jezikov so zmanjšale zaostanek teh jezikov za zahodnoevropskimi jeziki na področju razpoznavanja govora. Rezultati raziskav vzpodbujajo nadaljnje delo na raziskovalnem področju dekodiranja s podbesednimi enotami, ki še vedno predstavlja eno izmed glavnih metod modeliranja močno pregibnih jezikov.

Skupni vpliv raziskav v okviru izvedenega projekta je pomembno doprinesel k povečanju sposobnosti performanc razpoznavalnika spontanega govora. Eksperimentalni sistem za slovenski jezik je tako že uporaben za indeksiranje različnih avdio-vizualnih vsebin ter posledično na takšen način izboljšano možnost dostopa do informacij za nadaljnje procesiranje. Hkrati je pomemben rezultat projekta tudi interdisciplinarni doprinos k področju raziskav o diskurznih označevalcev, izsledke česar smo objavili v reviji kategorije A1'' po metodologiji ARRS.

Pomen za razvoj Slovenije

V okviru projekta predlagane metode so jezikovno neodvisne, vendar še posebej primerne za modeliranje močno pregibnih jezikov, med katere sodi tudi slovenski jezik. Tako so rezultati projekta izrednega pomena za ohranjanje slovenskega jezika v obdobju razmaha digitalizacije. Podpora za razpoznavanje spontanega govora v materinem jeziku namreč posredno vzpodbuja razmah različnih informacijsko-komunikacijskih tehnologij z govorno podporo v slovenskem prostoru. Na ta način se zmanjšuje digitalna ločnica pri dostopu do različnih virov informacij, saj je tako možno uporabljati uporabnikom prijaznejše vmesnike za dostop do virov.

Izsledke o možnostih kombiniranja govornih virov za razpoznavanje spontanega govora bo možno v prihodnje uporabljati pri snovanju novih govornih virov za slovenski jezik, kjer lahko pričakujemo večji poudarek na razvoju cenejših govornih virov z nepopolnimi transkripcijami. To je še posebej pomembno, če upoštevamo, da se je v zadnjem obdobju s porastom prenosnih hitrosti bistveno povečala dostopnost različnih avdio-vizualnih vsebin na spletu (npr: seje DZ RS). Za avdio-vizualne vsebine, kjer transkripcije niso na voljo na spletu, je možno nepopolne transkripcije tvoriti tako ročno kot tudi avtomatsko z uporabo avtomatskega razpoznavalnika govora v načinu nenadzorovanega učenja.

Rezultati eksperimentalnega sistema nakazujejo tudi možnosti prihodnjega prenosa izsledkov raziskave v okviru aplikacijskih projektov v slovensko telekomunikacijsko industrijo, predvsem na področju indeksiranja avdio-vizualnih vsebin. Možnosti uporabe takšnega sistema so predvsem v arhivih različnih medijskih hiš.

S stališča skrbi za slovenski jezik so še posebej pomembni rezultati interdisciplinarnih raziskav o diskurznih označevalcih, saj so bile te raziskave prve takšne vrste za slovenski jezik. Opravljena je bila analiza vpliva validatorjev na ročno označevanje diskurznih označevalcev, pogostost pojavljanja diskurznih označevalcev v različnih zvrsteh govora ter vpliv kontekstnih lastnosti na diskurzne označevalce. Ti rezultati bodo pomembno vplivali na prihodnje znanstveno delo na področju diskurza.

Najpomembnejši znanstveni rezultati

Zaključno poročilo, celotno poročilo na dLib.si

Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati

Zaključno poročilo, celotno poročilo na dLib.si

Modeliranje spontanega govora in zelo pregibnih jezikov za podporo vodenim telekomunikacijskim storitvam

Zgodovina ogledov

Priljubljeno

Modeliranje spontanega govora in zelo pregibnih jezikov za podporo vodenim telekomunikacijskim storitvam

Klasifikacija ARIS

Klasifikacija CERIF

Zahtevana je potrditev

Zgodovina ogledov

Priljubljeno