J6-8255 — Zaključno poročilo
1.
Collocations in lexicography

Tematska številka revije Slovenščina 2.0 je posvečena kolokacijam in je nastala na osnovi dobro obiskane delavnice na temo kolokacij, ki je potekala v organizaciji članov projektne skupine in v okviru konference eLex 2019. Tematska številka vsebuje 7 prispevkov, ki se lotevajo različnih vidikov kolokacije: kaj sploh je kolokacija, kako jo opredeliti do drugih večbesednih izrazov, koliko kolokacijskih podatkov vključiti v slovar, kako naj bodo predstavljeni uporabnikom ter kako kodirati kolokacijske podatke, da bodo uporabni za različne namene. Prispevki tako naslavljajo širok nabor tem v šestih različnih jezikih, zaradi česar je tematska številka res mednarodna, tako v zastopanosti kot relevantnosti obravnavanih tem.

C.03 Vabljeni urednik revije (guest-associated editor)

COBISS.SI-ID: 24561667
2.
Kolokacijski slovar sodobne slovenščine KSSS 1.0

Kolokacijski slovar sodobne slovenščine, ki vsebuje 35.989 iztočnic in 7.338.801 kolokacij in je prvi takšen slovar pri nas, predstavlja prvi korak k zapolnjevanju manka na področju jezikovnih virov za slovenščino, namenjenih jezikovni produkciji. Glavni prepoznavni elementi slovarja so stopenjski prikaz gesel, predstavitev kolokacijskih podatkov v širšem besedilnem kontekstu ter različne možnosti filtriranja in razvrščanja bogatih kolokacijskih podatkov. Poleg spletne dostopnosti na https://viri.cjvt.si/kolokacije je bila slovarska baza naložena tudi v repozitorij CLARIN.SI in je bila že uporabljena za različne namene, recimo pri jezikovno-didaktični aplikaciji Igri besed in mobilni verziji Kolokacij in Sopomenk (samostojna pobuda razvijalca iz Hrvaške).

F.11 Razvoj nove storitve

COBISS.SI-ID: 20172291
3.
Slovenska ontologija semantičnih tipov za samostalnike SLONEST-noun 1.0

SLONEST-noun 1.0 je ontologija za samostalnike in vsebuje 271 kategorij semantičnih tipov, od tega 21 krovnih kategorij, ki so razdeljene v tri nadaljnje hierarhične nivoje. Ontologija je bila razvita in evalvirana tudi na podlagi kolokacijskih podatkov, zato so za večino kategorij podani primeri kolokacij. V vsaki kolokaciji sta označeni samostalniška iztočnica in kolokator, podana je tudi informacija o skladenjski strukturi kolokacije. Ontologijo v praksi že uporabljajo, in sicer pri izdelavi Digitalne slovarske baze za slovenščino in Velikega slovensko-madžarskega slovarja, ki nastajata pod okriljem Centra za jezikovne vire in tehnologije Univerze v Ljubljani. Kjer je relevantno, zlasti pri krovnih kategorijah, je podana tudi povezava s semantičnimi tipi (oz. leksikografskimi direktoriji) v Wordnetu, skupaj s podatkom o ravni ujemanja ("v celoti" ali "delno"). Ravno zaradi teh informacij je ontologija zelo relevantna za mednarodni prostor, saj bo olajšala povezovanje slovarjev in ostalih leksikalnih virov, kar je trenutno zelo aktualna tematika na področju jezikoslovja in leksikografije, koristi pa segajo globoko v različna področja družbe (pametna mesta, umetna inteligenca ipd.).

F.15 Razvoj novega informacijskega sistema/podatkovnih baz

COBISS.SI-ID: 62581507
4.
Veliki slovensko-madžarski slovar

Gre za projekt, ki nastaja na Centru za jezikovne vire in tehnologije Univerze v Ljubljani (financira ARRS v sklopu MRIC UL) in je pomemben za različne segmente družbenega življenja, od kulture, izobraževanja do gospodarstva. Metodologija prepoznave in luščenja kolokacij, izdelana v okviru projekta KOLOS, je za slovensko-madžarski slovar ključnega pomena, prav tako se pri izdelavi slovarskih gesel uporablja ontologija semantičnih tipov. Slovar predstavlja tudi pomembno osnovo pri oblikovanju podatkovnega modela in pomenskih konceptov za digitalno slovarsko bazo za slovenščino, ki nastaja v okviru projekta Razvoj slovenščine v digitalnem okolju (financira Ministrstvo za kulturo).

D.01 Vodenje/koordiniranje (mednarodnih in domačih) projektov

COBISS.SI-ID: 67672930
5.
Sledilnik 1.0: Jezikovni sledilnik

Jezikovni sledilnik prikazuje informacije o časovnih trendih rabe besed in besednih nizov. Sledilnik črpa podatke iz referenčnega korpusa sodobne standardne slovenščine Gigafida 2.0 (Krek idr. 2020) za besedila do leta 2018 in servisa spletnih novic IJS NewsFeed (besedila od leta 2019 naprej), ki črpa besedila iz več kot 100 različnih slovenskih spletnih virov. Sledilnik je nastal tudi s pomočjo metod o časovnih trendih kolokacij, pa tudi posameznih besed, razvitih in evalviranih pri projektu KOLOS. Gre za sploh prvo orodje pri nas, ki omogoča sprotno spremljanje sprememb v rabi slovenščine, tudi neologizmov, in nas tako postavlja ob bok vodilnim državam in ustanovam na tem področju.

F.17 Prenos obstoječih tehnologij, znanj, metod in postopkov v prakso

COBISS.SI-ID: 62272771