Predstavljen je pristop avtomatskega luščenja definicij iz nestrukturiranega besedila. Pristop zajema fazo luščenja definicijskih kontekstov na podlagi oblikoskladenjskih vzorcev, avtomatsko izluščenih terminov ter na podlagi semantičnih oznak iz slovenskega Wordneta. Nato izmed definicijskih kandidatov izluščijo dobro oblikovane definicije z uporabo klasifikacijskega modela. Klasifikacijski model je bil avtomatsko naučen na podlagi definicijskih in nedefinicijskih stavkov v slovenski Wikipediji.
B.03 Referat na mednarodni znanstveni konferenci
COBISS.SI-ID: 43122530Prispevek predstavlja pristop k samodejnemu luščenju in poravnanju večbesednih terminov iz primerljivega angleškoslovensko zdravstvenega korpusa. Najprej so termini iz korpusa izluščeni za vsak jezik posebej z uporabo seznama uporabniku prilagojenih oblikoskladenjskih vzorcev in tehtanja pomembnosti termina. Sledi poravnava izluščenih terminov na način zbirke ustreznic z izvornim dvojezičnim leksikonom. V podaljšku pristopa prikažemo tudi, da je majhen izvorni leksikon mogoče obogatiti z domensko specifičnim besediščem s pomočjo neposrednega luščenja iz primerljivega korpusa, kar pomembno izboljša rezultate določevanja večbesednih terminov. Medtem ko se je večina prejšnjih študij luščenja dvojezičnih leksikonov iz primerljivih korpusov osredotočala na določevanje posameznih besed, je predlagana tehnika uspešno izboljšana v tem, da se je možno ukvarjati tudi z večbesednimi termini. Glede na to, da predlagani pristop zahteva minimalne vire znanja, je lahko prilagodljiv za nove jezikovne pare ali domene, kar je ena njegovih največjih prednosti.
B.03 Referat na mednarodni znanstveni konferenci
COBISS.SI-ID: 49683298V raziskavi so analizirane domnevne romanske leksikalne in oblikoslovne prvine v slovenskih sporočanjskih vzorcih, ki sestavljajo Vocabolario Italiano e Schiauo italijanskega meniha Gregoria Alasia da Sommaripa iz leta 1607. Avtor razprave ugotavlja, da domnevne romanske prvine ne morejo biti vse obravnavane kot primeri romanske (predvsem italijanske) interference v Alasijevih pogovorih, saj so bile vsaj nekatere prisotne bodisi v širšem slovenskem jezikovnem prostoru (potrjujeta jih protestantska, baročna književna norma, npr. pridevniški primernik vech drago) bodisi so bile najbrž že znane zahodnim slovenskim govorom (npr. glagol stati v pomenu ‘biti, počutiti se’). Takšne prvine je treba označiti za primere pozitivnega transferja (izvor in status tujejezičnih prvin znotraj posameznih socialnih zvrsti mora biti obravnavan ločeno) in jih razlikovati od idiolektalnih primerov negativnega transferja ali drugih napak, povezanih z Alasijevim slabšim znanjem slovenskega jezika (oz. lokalnega govora).
B.03 Referat na mednarodni znanstveni konferenci
COBISS.SI-ID: 52693602Turbulentni družbenopolitični dogodki, ki so v 90. letih prejšnjega stoletja zajeli področje nekdanje skupne države SFR Jugoslavije, so se odrazili tudi v odnosih med posameznimi družbami in jeziki. Obenem pa so družbene spremembe, ki so povzročile razpad Jugoslavije, povzročile »smrt« lingvistično enega jezika – srbohrvaščine – in omogočile nastanek štirih jezikovnih standardov – hrvaškega, srbskega, bosanskega in črnogorskega – ter spremembo statusa slovenskega in makedonskega jezika, kar je pritegnilo veliko pozornost tako domačih kot tujih (socio)lingvistov. V sedmih poglavjih monografije uveljavljeni (socio)lingvisti opisujejo z vidika kritične sociolingvistike aktualne sociolingvistične situacije in odnose med jezikovno politiko in jezikovno stvarnostjo v novonastalih državah.
C.01 Uredništvo tujega/mednarodnega zbornika/knjige
COBISS.SI-ID: 200399884sloWTool je celovito orodje za pregledovanje, urejanje in vizualizacijo wordnetov s pomočjo hiperboličnih grafov in slik. Orodje je prosto dostopno pod licenco CC-BY-SA in je zasnovano na tehnologijah MySQL in PHP, zaradi česar je popolnoma prilagodljivo in prenosljivo. Združljivo je z vsemi spletnimi brskalniki in omogoča hitre poizvedbe po wordnetu. Orodju so priložene programske skripte za avtomatsko prevedbo v in iz različnih standardnih vhodnih in izhodnih formatov, kot sta DEBVisDic XML in LMF, kar močno poenostavi uvažanje in izvažanje wordneta za kateri koli jezik. Spletni brskalnik je preprost za uporabo za nestrokovnjake, napredni iskalnik pa omogoča tudi oblikovanje kompleksnejših iskalnih pogojev in nastavitev za način prikaza rezultatov ter preklapljanje med eno- in večjezičnim načinom. sloWTool je mogoče uporabljani na spletu ali ga prenesti in namestiti lokalno: https://launchpad.net/slowtool
F.16 Izboljšanje obstoječega informacijskega sistema/podatkovnih baz
COBISS.SI-ID: 25364007