Analizirane so bili kontekstne lastnosti v formalnem in neformalnem govoru, ki pomembno vplivajo na razlike v uporabi diskurznih označevalcev. Rezultati izvedene analize o pogostosti pojavljanja diskurznih označevalcev ter analize konteksta v katerem se pojavljajo so služili kot izhodišča pri postopkih modeliranja spontanega govora. Razlike med žanri so pokazale na upravičenost kombiniranja baz izgovarjav v postopku generiranja akustičnih modelov. Članek je bil objavljen v interdisciplinarni reviji, ki v skladu z ARRS metodologijo sodi v kategorijo A1''.
COBISS.SI-ID: 12612886
V članku smo predstavili rezultate modeliranja slovenskega jezika za uporabo v razpoznavalniku spontanega govora. Slovenski jezik sodi v skupino visoko pregibnih jezikov s kompleksno morfologijo. V članku smo predlagali podatkovno vodeno razcepljanje besed v dve podenoti, tj. osnovo in končnico z uporabo nove metrike. Prednost predlaganega algoritma je jezikovna neodvisnost, saj razcep temelji na zmanjševanju entropije učnega korpusa. Eksperimentalno smo pokazali, da predlagani jezikovni modeli zmanjšajo delež besed izven slovarja in tako vodijo k boljšim rezultatom razpoznavanja govora.
COBISS.SI-ID: 13118230
Predlagali smo novo metodo modeliranja mašil in onomatopej za razpoznavanje spontanega govora z velikim slovarjem besed. Akustični modeli so bili zasnovani na osnovi rezultatov analize diskurznih označevalcev. Pri tem smo upoštevali predvsem njihove akustično-fonetične značilnosti, kjer smo ločeno modelirali onomatopeje. Predlagana metoda je tako zasnovana na osnovi implicitnega modeliranja s fonetičnimi razredi brez upoštevanja konteksta v jezikovnem modelu. Primerjava s tremi drugimi metodami modeliranja je pokazala na statistično pomembno izboljšanje rezultatov razpoznavanja govora.
COBISS.SI-ID: 12706070
V članku smo opisali rezultate analize pojavljanja diskurznih označevalcev v slovenskem spontanem govoru. Analiza je bila izvedena na osnovi primerjave med naborom spontanih stavkov iz govornih baze BNSI Broadcast News in Turdis (domena: novice oz. turizem). S stališča modeliranja efektov spontanega govora v razpoznavalniku govora so posebej pomembni rezultati analize za kategorijo mašil, ter za kategorijo opornih signalov. Primerjava med obema žanroma je pokazala na statistično signifikantne razlike pri pogostosti pojavljanja različnih diskurznih označevalcev.
COBISS.SI-ID: 36334434