Globalizacija je slovenščino postavila pred nov izziv, zlasti to velja za terminološko področje. Nov raziskovalni model, ki se uporablja v projektu TERMIS, kaže pot do standardizacije prihodnjih slovenskih terminologij.
F.18 Posredovanje novih znanj neposrednim uporabnikom (seminarji, forumi, konference)
COBISS.SI-ID: 31431261V prispevku predstavljamo prosto dostopni spletni portal Termania, ki je namenjen iskanju po slovarskih zbirkah ter izdelavi in urejanju slovarskih gesel. Cilj portala je postati centralno mesto zbiranja predvsem terminoloških in tudi drugih podatkov slovarske narave za slovenščino, v kasnejši fazi pa tudi za druge jezike. Ciljna publika portala so vsi uporabniki spleta, zato je posebna pozornost namenjena uporabniški prijaznosti orodij, ta osnovna naravnanost pa hkrati omogoča tudi rabo zahtevnejših funkcij, kot je uredniški nadzor nad vsebino, uporabo jezikovnih tehnologij za pridobivanje leksikalnih podatkov iz besedilnih korpusov in druge napredne funkcije.
F.07 Izboljšanje obstoječega izdelka
COBISS.SI-ID: 26419239V prispevku opisujemo označevalnik za slovenščino Obeliks, ki je bil izdelan v okviru projekta Sporazumevanje v slovenskem jeziku. Označevalnik je sestavljen iz treh komponent: tokenizacijskega modula, ki za stavčno segmentacijo in tokenizacijo uporablja pravila, oblikoskladenjskega označevalnika ter različice lematizatorja LemmaGen, ki je prilagojena za delovanje v kombinaciji z označevalnikom. Učno množico pri opisani različici označevalnika predstavlja učni korpus ssj500k, ki je označen po tabeli oznak JOS. Pri sistemu JOS s 1.903 možnimi oznakami je natančnost označevalnika 91,34 % za celotno oznako in 98,30 % za vrhnjo kategorijo (POS). Natančnost lematizacije je 97,88 % ob upoštevanju velike začetnice ter 98,55 % na ravni črkovnega niza. V prispevku predstavljamo zasnovo označevalnika ter analizo natančnosti označevanja. Označevalnik je prosto dostopen na spletu.
F.06 Razvoj novega izdelka
COBISS.SI-ID: 26418983