Nalaganje ...
Projekti / Programi vir: ARIS

Modeliranje spontanega govora in zelo pregibnih jezikov za podporo vodenim telekomunikacijskim storitvam

Raziskovalna dejavnost

Koda Veda Področje Podpodročje
2.08.00  Tehnika  Telekomunikacije   

Koda Veda Področje
T180  Tehnološke vede  Telekomunikacijsko inženirstvo 
Ključne besede
telekomunikacijske storitve, uporabniški vmesnik, avtomatsko razpoznavanje govora, modeliranje spontanega govora, modeliranje zelo pregibnih jezikov
Vrednotenje (pravilnik)
vir: COBISS
Raziskovalci (5)
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  27896  dr. Matej Grašič  Telekomunikacije  Mladi raziskovalec  2007 - 2008  59 
2.  06821  dr. Zdravko Kačič  Telekomunikacije  Raziskovalec  2007 - 2008  705 
3.  21304  dr. Tomaž Rotovnik  Elektronske komponente in tehnologije  Raziskovalec  2007 - 2008  115 
4.  18168  dr. Mirjam Sepesy Maučec  Telekomunikacije  Raziskovalec  2007 - 2008  249 
5.  20032  dr. Andrej Žgank  Telekomunikacije  Vodja  2007 - 2008  241 
Organizacije (1)
št. Evidenčna št. Razisk. organizacija Kraj Matična številka Štev. publikacijŠtev. publikacij
1.  0796  Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko  Maribor  5089638003  27.407 
Povzetek
Z razvojem telekomunikacijskih omrežij pričakujejo uporabniki tudi razvoj na področju telekomunikacijskih storitev. Eden izmed zelo pomembnih kriterije sodobnih telekomunikacijskih rešitev so prijazni uporabniški vmesniki. Kadar storitev uporablja govorno vodeni vmesnik je tako smiselna uporaba avtomatskega razpoznavanja spontanega govora. Le-to predstavlja na področju jezikovnih tehnologij zelo kompleksen problem, z dokaj visokimi napakami razpoznavanja besed. V projektu se bomo tako osredotočili na raziskave s področja modeliranja spontanega govora. Glavne kategorije efektov spontanega govora, ki jih bomo vključili v modeliranje so: mašila, ponovitve besed, ponovni začetek stavka in delno izgovorjene besede. Glavni cilj projekta je izboljšati rezultate razpoznavanja spontanega govora. Na področju avtomatskega razpoznavanja govora predstavljajo poseben izziv zelo pregibni jeziki (slovenski, ruski,…), ki imajo visok delež besed izven slovarja. V drugem delu projekta se bomo osredotočili na izboljšavo akustičnega modeliranja zelo pregibnih jezikov na osnovi podbesednih enot osnova – končnica. Tudi tukaj je glavni cilj izboljšati rezultate razpoznavanja govora. V zadnjem delu bomo izvedli integracijo novih metod v skupni sistem, ter razvili demonstrator telekomunikacijske storitve.
Pomen za razvoj znanosti
Rezultati projekta so pomembno doprinesli k dvema področjema avtomatskega razpoznavanja govora, ki ga med drugim uporabljamo tudi na področju razvoja telekomunikacijskih storitev. Dosegli smo pomembno izboljšanje rezultatov razpoznavanja spontanega govora, predvsem na področju modeliranja mašil in onomatopej. Predlagano metodo smo sicer eksperimentalno ovrednotili na govornih virih za slovenski jezik, vendar je zaradi uporabe podatkovno vodenih metod modeliranja jezikovno neodvisna. Predlagano metodo bo tako možno prenesti tudi na modeliranje spontanega govora v drugih svetovnih jezikih. Avtomatsko razpoznavanje govora je vključeno tudi v druga področja informacijsko-komunikacijskih tehnologij (npr.: strojno prevajanje iz govora v govor, uporabniški vmesniki), tako da lahko posledično pričakujemo vpliv tudi na njih. Analiza rezultatov modeliranja spontanega govora je pokazala, da predstavlja izredno kompleksen problem modeliranje delno izgovorjenih besed, tako da bo smiselno temu področju posvetiti dodatno pozornost v prihodnjih raziskavah, kar potrjujejo tudi tematike aktualnih objav na mednarodnih konferencah. Rezultati raziskav o kombiniranju govornih virov so pokazali, da je na takšen način možno izboljšati tako akustično modeliranje spontanega govora kot tudi modeliranje močno pregibnih jezikov. To je bilo še posebej opazno pri učenju na osnovi nepopolnih transkripcij. Smernice o možnostih kombiniranja različnih govornih virov so še posebej pomembno za jezike s slabše razvitimi govornimi viri. V to kategorijo sodi velika večina današnjih živih jezikov, saj je razvoj novih govornih virov povezan z zelo velikimi časovnimi in finančnimi vložki. Opravljene raziskave na področju modeliranja pregibnih jezikov so zmanjšale zaostanek teh jezikov za zahodnoevropskimi jeziki na področju razpoznavanja govora. Rezultati raziskav vzpodbujajo nadaljnje delo na raziskovalnem področju dekodiranja s podbesednimi enotami, ki še vedno predstavlja eno izmed glavnih metod modeliranja močno pregibnih jezikov. Skupni vpliv raziskav v okviru izvedenega projekta je pomembno doprinesel k povečanju sposobnosti performanc razpoznavalnika spontanega govora. Eksperimentalni sistem za slovenski jezik je tako že uporaben za indeksiranje različnih avdio-vizualnih vsebin ter posledično na takšen način izboljšano možnost dostopa do informacij za nadaljnje procesiranje. Hkrati je pomemben rezultat projekta tudi interdisciplinarni doprinos k področju raziskav o diskurznih označevalcev, izsledke česar smo objavili v reviji kategorije A1'' po metodologiji ARRS.
Pomen za razvoj Slovenije
V okviru projekta predlagane metode so jezikovno neodvisne, vendar še posebej primerne za modeliranje močno pregibnih jezikov, med katere sodi tudi slovenski jezik. Tako so rezultati projekta izrednega pomena za ohranjanje slovenskega jezika v obdobju razmaha digitalizacije. Podpora za razpoznavanje spontanega govora v materinem jeziku namreč posredno vzpodbuja razmah različnih informacijsko-komunikacijskih tehnologij z govorno podporo v slovenskem prostoru. Na ta način se zmanjšuje digitalna ločnica pri dostopu do različnih virov informacij, saj je tako možno uporabljati uporabnikom prijaznejše vmesnike za dostop do virov. Izsledke o možnostih kombiniranja govornih virov za razpoznavanje spontanega govora bo možno v prihodnje uporabljati pri snovanju novih govornih virov za slovenski jezik, kjer lahko pričakujemo večji poudarek na razvoju cenejših govornih virov z nepopolnimi transkripcijami. To je še posebej pomembno, če upoštevamo, da se je v zadnjem obdobju s porastom prenosnih hitrosti bistveno povečala dostopnost različnih avdio-vizualnih vsebin na spletu (npr: seje DZ RS). Za avdio-vizualne vsebine, kjer transkripcije niso na voljo na spletu, je možno nepopolne transkripcije tvoriti tako ročno kot tudi avtomatsko z uporabo avtomatskega razpoznavalnika govora v načinu nenadzorovanega učenja. Rezultati eksperimentalnega sistema nakazujejo tudi možnosti prihodnjega prenosa izsledkov raziskave v okviru aplikacijskih projektov v slovensko telekomunikacijsko industrijo, predvsem na področju indeksiranja avdio-vizualnih vsebin. Možnosti uporabe takšnega sistema so predvsem v arhivih različnih medijskih hiš. S stališča skrbi za slovenski jezik so še posebej pomembni rezultati interdisciplinarnih raziskav o diskurznih označevalcih, saj so bile te raziskave prve takšne vrste za slovenski jezik. Opravljena je bila analiza vpliva validatorjev na ročno označevanje diskurznih označevalcev, pogostost pojavljanja diskurznih označevalcev v različnih zvrsteh govora ter vpliv kontekstnih lastnosti na diskurzne označevalce. Ti rezultati bodo pomembno vplivali na prihodnje znanstveno delo na področju diskurza.
Najpomembnejši znanstveni rezultati Zaključno poročilo, celotno poročilo na dLib.si
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati Zaključno poročilo, celotno poročilo na dLib.si
Zgodovina ogledov
Priljubljeno