AvID je več-modalna zbirka čustvenega govora, ki je bila posneta simultano z več mikrofoni in video kamero. Pri zajemanju zbirke je bil naš cilj pridobiti podatke, ki bi omogočali eksperimente, povezane z razpoznavanjem identitete kakor tudi čustvenega stanja govorca. Posebej smo se potrudili pridobiti podatke, ki bi vsebovali spontane čustvene odzive in tako omogočili bolj realistične pogoje pri preizkusih samodejnega razpoznavanja. Spontane čustvene odzive smo dosegli s posebej načrtovanimi scenariji, ki so vključevali igranje računalniških iger in adaptivne inteligenčne teste. Zbirko podatkov sestavlja 12,5 ur posnetkov, ki smo jih pridobili od 17-ih govorcev.
F.15 Razvoj novega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 7037012Univerza v Surreyu je v okviru mednarodne IEEE/IAPR konference o biometriji ICB'09 organizirala tekmovanje v samodejnem razpoznavanju obrazov, ki smo se ga skupaj s številnimi raziskovalnimi in razvojnimi inštitucijami z različnih delov sveta udeležili tudi mi. Na tekmovanju so sodelovale raziskovalno-razvojne inštitucije, kot so IDIAP, Univerza v Surreyu, Univerza z Viga, Politehnična univerza z Viga, Amsterdamski CWI, Univerza z Manchestra in seveda tudi Univerza v Ljubljani. Tekmovanje je potekalo na uveljavljeni podatkovni zbirki BANCA pri dveh eksperimentalnih konfiguracijah. Sistem, s katerim smo se udeležili tekmovanja, je pri zahtevnejši od obeh konfiguracij prepričljivo premagal konkurenco in dosegel tudi najboljši skupen rezultat razpoznavanja. Prototipni sistem, ki smo ga implementirali za tekmovanje, nam je omogočil pridobitev novih praktičnih znanj ter vpogled v težave, ki jih srečujemo pri implementaciji realnih sistemov za razpoznavanje obrazov.
B.03 Referat na mednarodni znanstveni konferenci
COBISS.SI-ID: 7132756S predlaganima sistemoma za ugotavljanje stopnje alkoholiziranosti in zaspanosti na osnovi posnetega govora smo obakrat dosegli drugo mesto na tekmovanju "Interspeech 2011 Speaker State Challenge" v okviru največje letne mednarodne konferece s področja govornih tehnologij Interspeech 2011. S svojimi rezultati je na tekmovanju sodelovalo 18 raziskovalnih skupin. Naša sistema sta slonela na določanju splošnega verjetnostnega modela govora (UBM), ki smo ga določili na podlagi prikritih Markovovih modelov za govor, ki je bil na razpolago v podatkovnih zbirkah. Za določanje vektorjev značilk smo potem uporabili postopek maksimiranje aposteriornega verjetja (MAP). Ko smo značilke kombinirali še z značilkami osnovnega sistema na tekmovanju, smo uspeli bistveno izboljšati rezultate. Na testni množici za ugotavljanje alkoholiziranosti smo dosegli 67.46% pravilnost, na testni množici za ugotavljanje zaspanaosti pa 71.28% pravilnost.
B.03 Referat na mednarodni znanstveni konferenci
COBISS.SI-ID: 8580692Predlagani novi postopek za merjenje razdalje s pomočjo aktivne 3-D triangulacije odpravlja težave dosedaj poznanih postopkov, in sicer: ima nizko energijsko porabo, je neobčutljiv na zunanje motnje ter spremembo osvetlitve, sočasno ga lahko uporablja več naprav v istem prostoru. Patent je bil za leto 2011 izbran za najpomembnejši dosežek na področju Meroslovje 2.15 v okviru programov in projektov ARRS.
F.32 Mednarodni patent
COBISS.SI-ID: 8985172V prispevku so predstavljene aktualne raziskave s področja govornih tehnologij za slovenski jezik in umestitev doseženih rezultatov v prakso, kot tudi zahtevnost in interdisciplinarnost problematike. Ker predstavlja slovenski jezik enega izmed temeljev naše nacionalne identitete, je pomembno tudi vprašanje, kako lahko spoznanja s tega področja uporabimo v slovenskem govoru. Podana je problematika uporabe takih sistemov v slovenščini in doseženi rezultati na tem področju.
F.30 Strokovna ocena stanja
COBISS.SI-ID: 8160852