Projekti / Programi
Kolokacije kot temelj jezikovnega opisa: semantični in časovni vidiki
Koda |
Veda |
Področje |
Podpodročje |
6.05.02 |
Humanistika |
Jezikoslovje |
Teoretično in uporabno jezikoslovje |
Koda |
Veda |
Področje |
H350 |
Humanistične vede |
Jezikoslovje |
Koda |
Veda |
Področje |
6.02 |
Humanistične vede |
Jeziki in književnost |
kolokacija, korpus, pomenoslovje, neologizmi, strojno učenje
Raziskovalci (14)
Organizacije (3)
Povzetek
Glavni cilj predlaganega projekta je izvedba temeljnih raziskav semantičnih in časovnih vidikov kolokacij, pa tudi metod za merjenje kolokacijskih razmerij, saj so te tematike v slovenskem jezikoslovju, pa tudi mednarodno, zaenkrat dokaj slabo pokrite. Drugi cilj je izdelava in temeljita jezikoslovna evalvacija metod strojnega učenja za namene analiz slovenskega jezika in luščenja leksikalnih podatkov iz korpusov. Na ta način želimo v slovenski prostor vpeljati tesnejše sodelovanje in sinergijo med leksikografijo in jezikoslovjem na eni strani ter računalniškim jezikoslovjem in statističnimi obdelavami naravnega jezika na drugi. Tretji cilj je sistematična integracija rezultatov študij med različnimi tipi uporabnikov v izdelavo projektnih metod in orodij ter priprava metodoloških opisov za prenos rezultatov v prakso z namenom zagotovitve njihove čim večje uporabnosti.
Projekt bo naslovil štiri različne vidike kolokacij: statistične metode za merjenje kolokacijskih razmerij, semantične nize oz. kategorije kolokacij, vlogo kolokacij kot razločevalnega elementa med pomensko povezanimi besedami (npr. sinonimi) in pa vlogo kolokacij pri zaznavanju semantičnih in podobnih sprememb v rabi besed skozi čas.
Za slovenski prostor bodo izvirni prav vsi deli projekta, saj predlagane raziskave in orodja za slovenščino še ne obstajajo, so pa rezultati več preteklih in trenutno potekajočih raziskovalnih projektov odlična podlaga zanje. Tudi po času in relevantnosti gre za zelo pomembno raziskavo, saj trenutno v Sloveniji poteka ali pa se načrtuje nekaj večjih leksikografskih in podobnih projektov, ki bi od rezultatov predlaganega projekta imeli velike koristi. Vsak delovni sklop bo doprinesel pomembno novo znanje na področje jezikovnega opisa in močno vplival na pristope ter analizo kolokacij na drugih področjih, kot sta jezikoslovje in poučevanje jezika.
Številni vidiki projekta bodo relevantni tudi za mednarodno raziskovalno skupnost in bodo vplivali na razvoj novih raziskovalnih smeri tako v Sloveniji kot v tujih jezikovnih skupnostih, zlasti tistih, katerih jezik je podobno morfološko bogat kot slovenščina. Z rezultati projekta želimo spodbuditi nadaljnje teoretične in aplikativne raziskave kolokacij, koligacij in večbesednih enot.
Pomen za razvoj znanosti
Raziskovalni projekt vzpostavlja dialog med različnimi strokami in disciplinami v slovenskem prostoru, hkrati pa tudi strokovni dialog slovenskega prostora s tujim, predvsem evropskim; vanj se vključuje z izvirnim prispevkom v gradivu ter teoretskometodoloških pristopih. V zadnjih treh desetletjih je v jezikoslovju opazen premik znanstvene paradigme iz raziskovanja jezikovnega sistema, kakršen je bil značilen predvsem za strukturalizem, v celostno in empirično naravnano obravnavo jezika, ki skuša zajeti delovanje jezika v realnih okoliščinah, kar je ključno tudi za medjezikovne primerjave ter raziskovanje in opazovanje spremembe jezikovnih fenomenov v času. Ker so v slovenskem prostoru jezikovni opisi še vedno prevladujoče strukturalistični, to povzroča vse večji razkorak med sodobnimi jezikovnimi opisi v drugih jezikovnih okoljih in jezikovnih opisih slovenskega jezika. Projekt bo tako pripomogel k zmanjšanju razkoraka, saj se navezuje na najbolj aktualne pristope v leksikografski teoriji in praksi v svetu, in sicer eksplicitno na tisti del, ki je zadnjih letih oblikoval nov metodološki okvir eleksikografije, izhajajoč iz čezdisciplinarnega pristopa korpusnega jezikoslovja in leksikografije, računalniškega jezikoslovja in informacijskih tehnologij. Tudi glede na čas gre v slovenskem prostoru za zelo pomembno raziskavo, saj trenutno v Sloveniji poteka ali pa se načrtuje nekaj večjih leksikografskih in sorodnih projektov, ki bi od rezultatov predlaganega projekta imeli velike koristi; vsak delovni sklop bo namreč doprinesel pomembno novo znanje na področju jezikovnega opisa večbesednih jezikovnih enot.
V raziskavo se sistematično vključuje tudi postopke procesiranja naravnega jezika, s čemer bo raziskava za slovenski prostor izrazito inovativna, prav tako pa bodo razviti novi analitični pristopi v jezikoslovju sploh, s čimer se raziskava inovativno vključuje v dialog z aktualnim jezikoslovjem v svetu. Konkretno bo raziskava pomenila pomemben doprinos k identifikaciji najbolj optimalne statistične mere za avtomatsko ugotavljanje kolokabilnosti za namene leksikografije in jezikovnega opisa v širšem smislu, pomembno pa bo izboljšala tudi state-of-the-art glede uporabe kolokacij za (pol)avtomatsko medsebojno ločevanje sinonimov. Na tej osnovi bodo pripravljena tudi priporočila za uporabo analitičnih postopkov v leksikografski praksi.
Pomen za razvoj Slovenije
Razvoj sodobnih digitalnemu mediju prilagojenih jezikovnih virov ter z njimi povezanih raziskav je eden od ciljev Resolucije nacionalnega programa za jezikovno politiko 2014–2018 Republike Slovenije in z njo povezanega Akcijskega načrta za jezikovno opremljenost, tako da raziskava neposredno naslavlja temo, ki je bila v Sloveniji prepoznana kot ena od ključnih tem v okviru jezikovne politike in jezikovnega načrtovanja. Gre za zavedanje, da je v globalno povezanem svetu dostopnost do informacij v določenem jeziku in povezljivost z drugimi jeziki ključnega pomena, zato je oblikovanje sodobnih jezikovnih virov in s tem povezanih raziskav izjemnega pomena za vitalnost slovenske jezikovne skupnosti.
Rezultati raziskave bodo sistematično vključeni v infrastrukturo Centra za jezikovne vire in tehnologije Univerze v Ljubljani in odprto dostopni vsej zainteresirani javnosti, s čimer se priključujemo težnji po sistematičnem oblikovanju jezikovne infrastrukture za slovenščino in sledimo evropsko priznanemu načelu odprte znanosti.
V raziskavi je predvidena vrsta evalvacijskih študij, in sicer tako med jezikoslovci različnih profilov kot tudi različnimi skupinami uporabnikov (prevajalci, učitelji, študenti itd.). Projekt s tem neposredno nagovarja uporabnike jezikovnih opisov, stopa z njimi v dialog in pridobljene podatke med uporabniki sistematično vključuje v postopke izboljšave analitičnih tehnik. Tako raziskava ne ostaja zaprta v akademsko skupnost, ampak vse čas poteka raziskave načrtno vzpostavlja dialog s širšo skupnostjo, kateri so konkretni jezikovni opisi tudi namenjeni. Čeprav so v svetu v leksikografski teoriji in praksi že ustaljene raziskave uporabnikov, njihovih potreb in pričakovanj, pa se slovenski prostor tovrstnih raziskav sistematično loteva šele zadnjih nekaj let. Raziskava se tudi v tem segmentu vpenja v aktualne leksikografske trende in se loteva uporabniških potreb in pričakovanj.
Da bi akademska skupnost čim bolj učinkovito komunicirala s širšo javnostjo, je eden od projektnih ciljev tudi priprava orodja za sistematično spremljanje življenja besed; za raziskovalce je to razvojno izjemno izzivalen izdelek, ki bo neposredno doprinesel h kulturnemu razvoju in gradnji vitalno pomembne jezikovne infrastrukture.
Najpomembnejši znanstveni rezultati
Vmesno poročilo,
zaključno poročilo
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati
Vmesno poročilo,
zaključno poročilo