J6-7094 — Vmesno poročilo
1.
Slovenska znanstvena besedila: prototipni korpus in načrt analiz

Razvitost jezika, ki se rabi v akademskem okolju, je pomemben kazalnik njegove vitalnosti. V prispevku prikažemo izdelavo sodobnega referenčnega vira za ta del slovenščine in podamo okvirni nabor nadaljnjih na njem osnovanih raziskav. Prototipni korpus KAS vsebuje besedila, zajeta z Nacionalnega portala odprte znanosti, ter vključuje več kot 50.000 znanstvenih in strokovnih besedil s preko milijardo pojavnic. Njegov nastanek je med drugim vključeval postopke zajema, filtriranja, čiščenja in jezikoslovnega označevanja, na njem osnovane raziskave pa bodo dale rezultate na področju klasifikacije besedil, razvoja orodij in zbirk za terminološko delo ter opisa tega dela sodobnega slovenskega jezika.

COBISS.SI-ID: 62530146
2.
Slovenski strokovni jezik: korpusni opis trpnika

V prispevku nas je zanimala raba pogosto odklanjane glagolske oblike, trpnika, v zvrsti, za katero velja, da ga vsebuje več kot druge, tj. v strokovnem jeziku. Analizo smo omejili na trpnik z deležnikom in na šest v Slovenski slovnici opredeljenih skladenjskih vzorcev, gradivo pa sta predstavljala dva korpusa: korpus akademskih besedil Kas in korpus splošne slovenščine Kres. Rezultati so med drugim potrdili večji obseg trpnika v korpusu Kas (čeprav predvsem v sedanjiku), hkrati pa pokazali, da je trpniški način v Kasu uresničen s sorazmerno manjšim naborom besedišča kot v Kresu.

COBISS.SI-ID: 34453853
3.
Luščenje terminologije akademske sloveščine z uporabo Sketch Engine

V prispevku predstavimo razvoj modula za luščenje terminologijo v okviru sistema za upravljanje s korpusi Sketch Engine za namene raziskovalnega projekta KAS, ki se ukvarja z viri in orodji za analizo akademske slovenščine. Opišemo formalizem za definicijo terminov in izračun primernosti posameznih terminov, podamo opis definicije gramatike za slovenske termine in evalvacijo izluščenih terminov nad korpusom KAS.

COBISS.SI-ID: 62994018