Loading...
Projekti / Programi vir: ARRS

OptiLEX: Raziskave in optimizacija predstavitve leksikalnih jezikovnih virov za implementacijo govornih tehnologij na vgrajenih sistemih

Raziskovalna dejavnost

Koda Veda Področje Podpodročje
2.06.00  Tehnika  Sistemi in kibernetika   

Koda Veda Področje
P176  Naravoslovno-matematične vede  Umetna inteligenca 
Ključne besede
jezikovni viri, govorne tehnologije, sporazumevanje človek-stroj, vgrajeni sistemi
Vrednotenje (pravilnik)
vir: COBISS
Raziskovalci (16)
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacij
1.  23505  dr. Kozma Ahačič  Jezikoslovje  Raziskovalec  2018 - 2021  626 
2.  36709  Igor Bizjak  Meroslovje  Raziskovalec  2019 - 2021 
3.  11805  dr. Simon Dobrišek  Računalništvo in informatika  Raziskovalec  2018 - 2021  258 
4.  13144  dr. Stanislav Gruden  Elektronske komponente in tehnologije  Raziskovalec  2019 - 2020  36 
5.  28160  dr. Peter Holozan  Računalništvo in informatika  Raziskovalec  2018 - 2021  57 
6.  53879  Marija Ivanovska  Sistemi in kibernetika  Raziskovalec  2020 - 2021  14 
7.  31985  dr. Janez Križaj  Sistemi in kibernetika  Raziskovalec  2018 - 2021  32 
8.  34592  dr. Tanja Mirtič  Jezikoslovje  Raziskovalec  2018 - 2021  92 
9.  36688  Klemen Pečnik  Telekomunikacije  Raziskovalec  2019 - 2020  29 
10.  28792  Miroslav Romih  Računalništvo in informatika  Raziskovalec  2018 - 2021  30 
11.  24772  mag. Simon Rozman  Računalništvo in informatika  Raziskovalec  2018 - 2021 
12.  39512  Robert Sedevčič    Tehnični sodelavec  2019 - 2020 
13.  39513  Simona Škrlj    Tehnični sodelavec  2018 
14.  28458  dr. Vitomir Štruc  Sistemi in kibernetika  Raziskovalec  2018 - 2021  310 
15.  11380  dr. Mario Žganec  Meroslovje  Raziskovalec  2018 - 2021  97 
16.  12000  dr. Jerneja Žganec Gros  Računalništvo in informatika  Vodja projekta/programa  2018 - 2021  285 
Organizacije (4)
št. Evidenčna št. Razisk. organizacija Kraj Matična številka Štev. publikacij
1.  0618  Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti  Ljubljana   5105498000  58.435 
2.  1538  Univerza v Ljubljani, Fakulteta za elektrotehniko  Ljubljana  1626965  25.954 
3.  1986  ALPINEON razvoj in raziskave, d.o.o.  Ljubljana  1820931  398 
4.  8333  AMEBIS programska oprema, d.o.o. Kamnik  Kamnik  5512930  82 
Povzetek
Kljub dejstvu, da obstaja precej raziskav in literature na temo računalniške predstavitve leksikalnih jezikovnih virov, njihova implementacija v celovitih sistemih za prepoznavanje ali sintezo govora na vgrajenih platformah predstavlja netrivialen problem, ki ga še dodatno otežujejo omejitve zaradi uporabljene strojne opreme. Pregled znanstvene literature pokaže, da pri izgradnji govornih tehnologij za jezike z velikim številom pregibnih oblik uporaba postopkov, ki so bili razviti za angleški jezik, ni učinkovita. Zaradi velikega števila pregibnih oblik besed pri istem številu leksemov se obsežnost prepoznavalnika slovenskega govora v primerjavi s primerljivim prepoznavalnikom angleškega govora vsaj podeseteri. Zato je potrebno posebno pozornost posvetiti prav optimizaciji uporabljenih modelov in njihovi adaptaciji na morfološke posebnosti pregibno bogatih jezikov. Naglasno mesto je v slovenščini premično in je le delno predvidljivo, saj je slovenščina primer naglasno in izgovorno zelo zapletenega slovanskega jezika, kjer naglasi niso vezani zgolj na posamično iztočnico ali fiksno na določen zlog: skozi pregibno paradigmo se lahko spreminjajo tako po kvaliteti, kot tudi po mestu naglašenega zloga. Zato je slovar izgovarjav, ki podaja naglasno mesto ter izgovorne različice besed, ključen za razvoj jezikovno-tehnoloških aplikacij ter za jezikoslovne raziskave. Slovar izgovarjav lahko uporabljamo bodisi v polni obliki ali pa kot učno gradivo za pristope strojnega učenja, ki samodejno napovedujejo izgovarjavo besed. V okviru aplikativnega projekta OptiLEX se bomo posvetili razvoju referenčnega slovarja izgovarjav ter raziskavam in implementaciji modula za učinkovito računalniško predstavitev leksikalnih jezikovnih virov, sposobnega delovanja v govornih aplikacijah v vgrajenih sistemih. Reševali bomo vrsto problemov: zahtevo po delovanju v realnem času; zahtevo po kompaktnem zapisu jezikovnih virov; ter zahtevo po majhnem odtisu zapisa jezikovnih virov v delovnem pomnilniku. Cilj projekta OptiLEX je raziskati postopke optimizacije računalniške predstavitve leksikalnih jezikovnih virov za pregibno bogate jezike, ki jih bo možno uporabiti pri prepoznavanju in sintezi govora na vgrajenih platformah. Postopke bomo implementirali in validirali na strojni opremi vgrajenega prenosnega terminala. V okviru projekta bomo poiskali učinkovite postopke za zmanjševanje odvečnosti pri predstavitvi in računalniškem zapisu jezikovnih virov za pregibno bogate jezikovne skupine, ki bodo omogočali hitro, pomnilniško čim manj zahtevno ter visokokakovostno pretvorbo grafemskega zapisa besed v fonetični prepis in obratno. Uspešnost zmanjševanja odvečnosti pri predstavitvi jezikovnih virov bo ovrednotena na slovarskih jezikovnih virih za več pregibno bogatih jezikov, vključno s slovenskim jezikom.
Pomen za razvoj znanosti
Globalni vpliv, ki ga bo ustvaril OptiLEX na znanstveni in tehnološki ravni, lahko povzamemo z naslednjimi besedami: · Z novimi naprednimi postopki predstavitve jezikovnih virov s poudarkom na oblikoskladenjsko bogatih jezikih bo OptiLEX prispeval k napredku znanosti na področju govornih tehnologij. · OptiLEX se bo posvečal operativnim izzivom pri hitri implementaciji jezikovnih tehnologij z uporabo velikih slovarjev izgovarjav na vgrajenih mobilnih platformah in napravah v svetu interneta stvari (IoT) z omejenimi računskimi in spominskimi viri. · OptiLEX bo odkrival nove alternativne implementacije vgrajenih govornih tehnologij, pri čemer bo upošteval alternativne reprezentacije slovar virov. · OptiLEX bo omogočil ponovno uporabo razpoložljive jezikovne infrastrukture, na primer obstoječih jezikovnih virov in obstoječih tehnologij ter orodij jezikovnih portalov, ki so bili razviti v okviru nacionalnih programov financiranja, s čimer bosta postala mogoča uporaba in izkoriščanje sinergij med novimi raziskovalnimi aktivnostmi in že odobrenimi raziskovalnimi sredstvi. · OptiLEX bo prispeval k razvoju znanosti na področju jezikoslovja, tako da bo v ospredje jezikoslovnega raziskovanja postavil govorjeni jezik. To je na področju slovenščine najbolj zapostavljena oblika jezika, čeprav gre za primarno obliko komunikacije, ki v sodobnem času z razvojem novih tehnologij postaja še opaznejša in pomembnejša. Rezultati projekta bodo uporabni za strokovnjake, ki se ukvarjajo s problematiko govorjenega (knjižnega) jezika, obenem pa bodo pomembna referenca za osnovanje pravorečnega priročnika, ki ga slovenščina zelo potrebuje, na kar je bilo opozorjeno že na več mestih. Edini slovenski pravorečni priročnik je namreč nastal pred sedemdesetimi leti! Tu torej ne gre samo za raziskave, ki bi bile za slovensko jezikoslovje zanimive in potrebne, ampak za temeljna znanja, ki bi jih jezikoslovna stroka za slovenski jezik nujno potrebovala, pa jih še vedno nima. · OptiLEX bo z zavezanostjo odprtemu znanju in ponovljivemu raziskovanju, kot enima izmed ključnih dejavnikov za razvoj raziskovalne skupnosti, prispeval h krepitvi evropske inovacijske zmogljivosti. V OptiLEX-u razviti postopki predstavitve leksikalnih reprezentacij bodo na voljo prek brezplačnih programskih vmesnikov (API). Dostopnost posameznih modulov za uporabo v raziskovalne namene bo pogojena s stopnjo dostopnosti primarnega jezikovnega vira. Slovarji izgovarjav za vire z odprtim dostopom bodo na voljo pod pogoji odprtega dostopa. Vsi odprto dostopni moduli referenčnega slovarja bodo diseminirani na portalu FRAN in repozitorija jezikovnih virov raziskovalne infrastrukture CLARIN.SI, ki je del širše infrastrukture EU CLARIN. To bo predstavljalo pomemben prispevek k pobudi za odprte podatke, saj bodo v okviru projekta razviti jezikovni viri dostopni širši skupnosti. Objava virov ne bo vezana na zaključek projekta, ker bomo module razvijali tudi po zaključku projekta.
Pomen za razvoj Slovenije
OptiLEX vključuje aktivnosti izkoriščanja projektni rezultatov, pri katerih predstavlja ključni cilj prenos tehnologij. Pri tem naslavljamo izziv krepitve zmogljivosti industrije v Evropi in poslovne priložnosti na trgu jezikovne tehnologije za zadovoljevanje potreb enotnega digitalnega trga. Predpogoj za uspeh enotnega digitalnega trga je razpoložljivost produktov in informacij v številnih jezikih, ki jih govorijo stranke in potrošniki. Raziskovalna metodologija, ki jo predlaga OptiLEX, temelji na skupnih standardiziranih leksikalnih virih in odprtih programskih vmesnikih, ki bodo povečali možnosti za tovrsten tehnološki transfer. Globalni vpliv, ki ga bo ustvaril OptiLEX, lahko povzamemo z naslednjimi besedami: · Inteligentne ključne omogočitvene tehnologije (KET) za več industrijskih sektorjev OptiLEX bo prinesel inovativno učinkovito reprezentacijo jezikovnih virov za mobilne in IoT govorne aplikacije. Te informacijsko komunikacijske ključne omogočitvene tehnologije (KET) igrajo pomembno horizontalno vlogo v več gospodarskih sektorjih, ki so vezani na evropsko strategijo pametne specializacije S4, saj omogočajo tehnologije inteligentnih uporabniških vmesnikov za naslednje vertikalne tržne segmente: pametna mesta in skupnosti, pametni dom, pametna mobilnost, tovarne prihodnosti, e-zdravje. · Učinek na industrijski sektor govornih tehnologij Na globalnem trgu govornih tehnologij trenutno dominira nekaj ključnih akterjev (Nuance Communications, Agnitio in Microsoft). Ti so dandanes osredotočeni večinoma na implementacijo v aplikacijah velikih razsežnosti (B2B trg) in pretežno ciljajo na jezike z velikim številom govorcev. Nove poti izkoriščanja obstajajo predvsem na trgu B2C, mobilnem trgu in trgih IoT, preko MSP in zagonskih podjetij. · Pomen za izobraževalni sektor in javno upravo OptiLEX bo prispeval h tehnologijam inteligentnih uporabniških vmesnikov, ki jih uporabljajo različni deležniki za dostop do informacij in storitev, katere nudi javna uprava na več ravneh. OptiLEX tehnologije so na primer uporabne za glasovno podprt dostop do informacij in storitev znotraj projekta e-uprave prek mobilnih platform. Poleg tega so uporabne tudi za samodejno izgradnjo učnih e-gradiv in orodij, ki so lahko ključnega pomena za uporabnike, ki imajo težave z branjem, npr. dislektike, oziroma slepe in slabovidne uporabnike. · Pomen za zaščito nacionalne kulturne dediščine V okviru OptiLEXa bodo razviti pomembni jezikovni viri v obliki slovarjev izgovarjav za standardno in nestandardno slovenščino. S tem bomo pomembno prispevali k varovanju in zaščiti nacionalne kulturne dediščine.
Najpomembnejši znanstveni rezultati Vmesno poročilo
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati Vmesno poročilo
Zgodovina ogledov
Priljubljeno