Nalaganje ...
Projekti / Programi vir: ARIS

Kolokacije kot temelj jezikovnega opisa: semantični in časovni vidiki

Raziskovalna dejavnost

Koda Veda Področje Podpodročje
6.05.02  Humanistika  Jezikoslovje  Teoretično in uporabno jezikoslovje 

Koda Veda Področje
H350  Humanistične vede  Jezikoslovje 

Koda Veda Področje
6.02  Humanistične vede  Jeziki in književnost 
Ključne besede
kolokacija, korpus, pomenoslovje, neologizmi, strojno učenje
Vrednotenje (pravilnik)
vir: COBISS
Raziskovalci (14)
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  27674  dr. Špela Arhar Holdt  Jezikoslovje  Raziskovalec  2017 - 2020  236 
2.  36914  dr. Jaka Čibej  Jezikoslovje  Raziskovalec  2018 - 2020  152 
3.  36491  dr. Kaja Dobrovoljc  Jezikoslovje  Raziskovalec  2019 - 2020  147 
4.  16313  dr. Apolonija Gantar  Jezikoslovje  Raziskovalec  2017 - 2020  223 
5.  52176  Teja Goli    Tehnični sodelavec  2019 - 2020  13 
6.  14681  dr. Vojko Gorjanc  Jezikoslovje  Raziskovalec  2017 - 2020  479 
7.  37694  mag. Maja Jančič  Ekonomija  Raziskovalec  2018 - 2020  91 
8.  32887  mag. Bojan Klemenc  Računalništvo in informatika  Tehnični sodelavec  2017 - 2020  56 
9.  33796  dr. Iztok Kosem  Jezikoslovje  Vodja  2017 - 2020  304 
10.  26166  dr. Simon Krek  Jezikoslovje  Raziskovalec  2017 - 2020  373 
11.  37653  dr. Cyprian Adam Laskowski  Jezikoslovje  Raziskovalec  2017 - 2020  35 
12.  36871  dr. Nikola Ljubešić  Jezikoslovje  Raziskovalec  2017 - 2020  397 
13.  20482  dr. Nataša Logar  Jezikoslovje  Raziskovalec  2017 - 2020  354 
14.  51456  dr. Eva Pori  Jezikoslovje  Raziskovalec  2019 - 2020  56 
Organizacije (3)
št. Evidenčna št. Razisk. organizacija Kraj Matična številka Štev. publikacijŠtev. publikacij
1.  0106  Institut "Jožef Stefan"  Ljubljana  5051606000  90.753 
2.  0581  Univerza v Ljubljani, Filozofska fakulteta  Ljubljana  1627058  98.000 
3.  0582  Univerza v Ljubljani, Fakulteta za družbene vede  Ljubljana  1626957  40.448 
Povzetek
Glavni cilj predlaganega projekta je izvedba temeljnih raziskav semantičnih in časovnih vidikov kolokacij, pa tudi metod za merjenje kolokacijskih razmerij, saj so te tematike v slovenskem jezikoslovju, pa tudi mednarodno, zaenkrat dokaj slabo pokrite. Drugi cilj je izdelava in temeljita jezikoslovna evalvacija metod strojnega učenja za namene analiz slovenskega jezika in luščenja leksikalnih podatkov iz korpusov. Na ta način želimo v slovenski prostor vpeljati tesnejše sodelovanje in sinergijo med leksikografijo in jezikoslovjem na eni strani ter računalniškim jezikoslovjem in statističnimi obdelavami naravnega jezika na drugi. Tretji cilj je sistematična integracija rezultatov študij med različnimi tipi uporabnikov v izdelavo projektnih metod in orodij ter priprava metodoloških opisov za prenos rezultatov v prakso z namenom zagotovitve njihove čim večje uporabnosti.   Projekt bo naslovil štiri različne vidike kolokacij: statistične metode za merjenje kolokacijskih razmerij, semantične nize oz. kategorije kolokacij, vlogo kolokacij kot razločevalnega elementa med pomensko povezanimi besedami (npr. sinonimi) in pa vlogo kolokacij pri zaznavanju semantičnih in podobnih sprememb v rabi besed skozi čas.   Za slovenski prostor bodo izvirni prav vsi deli projekta, saj predlagane raziskave in orodja za slovenščino še ne obstajajo, so pa rezultati več preteklih in trenutno potekajočih raziskovalnih projektov odlična podlaga zanje. Tudi po času in relevantnosti gre za zelo pomembno raziskavo, saj trenutno v Sloveniji poteka ali pa se načrtuje nekaj večjih leksikografskih in podobnih projektov, ki bi od rezultatov predlaganega projekta imeli velike koristi. Vsak delovni sklop bo doprinesel pomembno novo znanje na področje jezikovnega opisa in močno vplival na pristope ter analizo kolokacij na drugih področjih, kot sta jezikoslovje in poučevanje jezika.   Številni vidiki projekta bodo relevantni tudi za mednarodno raziskovalno skupnost in bodo vplivali na razvoj novih raziskovalnih smeri tako v Sloveniji kot v tujih jezikovnih skupnostih, zlasti tistih, katerih jezik je podobno morfološko bogat kot slovenščina. Z rezultati projekta želimo spodbuditi nadaljnje teoretične in aplikativne raziskave kolokacij, koligacij in večbesednih enot.
Pomen za razvoj znanosti
Raziskovalni projekt vzpostavlja dialog med različnimi strokami in disciplinami v slovenskem prostoru, hkrati pa tudi strokovni dialog slovenskega prostora s tujim, predvsem evropskim; vanj se vključuje z izvirnim prispevkom v gradivu ter teoretsko­metodoloških pristopih. V zadnjih treh desetletjih je v jezikoslovju opazen premik znanstvene paradigme iz raziskovanja jezikovnega sistema, kakršen je bil značilen predvsem za strukturalizem, v celostno in empirično naravnano obravnavo jezika, ki skuša zajeti delovanje jezika v realnih okoliščinah, kar je ključno tudi za medjezikovne primerjave ter raziskovanje in opazovanje spremembe jezikovnih fenomenov v času. Ker so v slovenskem prostoru jezikovni opisi še vedno prevladujoče strukturalistični, to povzroča vse večji razkorak med sodobnimi jezikovnimi opisi v drugih jezikovnih okoljih in jezikovnih opisih slovenskega jezika. Projekt bo tako pripomogel k zmanjšanju razkoraka, saj se navezuje na najbolj aktualne pristope v leksikografski teoriji in praksi v svetu, in sicer eksplicitno na tisti del, ki je zadnjih letih oblikoval nov metodološki okvir e­leksikografije, izhajajoč iz čezdisciplinarnega pristopa korpusnega jezikoslovja in leksikografije, računalniškega jezikoslovja in informacijskih tehnologij. Tudi glede na čas gre v slovenskem prostoru za zelo pomembno raziskavo, saj trenutno v Sloveniji poteka ali pa se načrtuje nekaj večjih leksikografskih in sorodnih projektov, ki bi od rezultatov predlaganega projekta imeli velike koristi; vsak delovni sklop bo namreč doprinesel pomembno novo znanje na področju jezikovnega opisa večbesednih jezikovnih enot. V raziskavo se sistematično vključuje tudi postopke procesiranja naravnega jezika, s čemer bo raziskava za slovenski prostor izrazito inovativna, prav tako pa bodo razviti novi analitični pristopi v jezikoslovju sploh, s čimer se raziskava inovativno vključuje v dialog z aktualnim jezikoslovjem v svetu. Konkretno bo raziskava pomenila pomemben doprinos k identifikaciji najbolj optimalne statistične mere za avtomatsko ugotavljanje kolokabilnosti za namene leksikografije in jezikovnega opisa v širšem smislu, pomembno pa bo izboljšala tudi state-of-the-art glede uporabe kolokacij za (pol)avtomatsko medsebojno ločevanje sinonimov. Na tej osnovi bodo pripravljena tudi priporočila za uporabo analitičnih postopkov v leksikografski praksi.
Pomen za razvoj Slovenije
Razvoj sodobnih digitalnemu mediju prilagojenih jezikovnih virov ter z njimi povezanih raziskav je eden od ciljev Resolucije nacionalnega programa za jezikovno politiko 2014–2018 Republike Slovenije in z njo povezanega Akcijskega načrta za jezikovno opremljenost, tako da raziskava neposredno naslavlja temo, ki je bila v Sloveniji prepoznana kot ena od ključnih tem v okviru jezikovne politike in jezikovnega načrtovanja. Gre za zavedanje, da je v globalno povezanem svetu dostopnost do informacij v določenem jeziku in povezljivost z drugimi jeziki ključnega pomena, zato je oblikovanje sodobnih jezikovnih virov in s tem povezanih raziskav izjemnega pomena za vitalnost slovenske jezikovne skupnosti. Rezultati raziskave bodo sistematično vključeni v infrastrukturo Centra za jezikovne vire in tehnologije Univerze v Ljubljani in odprto dostopni vsej zainteresirani javnosti, s čimer se priključujemo težnji po sistematičnem oblikovanju jezikovne infrastrukture za slovenščino in sledimo evropsko priznanemu načelu odprte znanosti. V raziskavi je predvidena vrsta evalvacijskih študij, in sicer tako med jezikoslovci različnih profilov kot tudi različnimi skupinami uporabnikov (prevajalci, učitelji, študenti itd.). Projekt s tem neposredno nagovarja uporabnike jezikovnih opisov, stopa z njimi v dialog in pridobljene podatke med uporabniki sistematično vključuje v postopke izboljšave analitičnih tehnik. Tako raziskava ne ostaja zaprta v akademsko skupnost, ampak vse čas poteka raziskave načrtno vzpostavlja dialog s širšo skupnostjo, kateri so konkretni jezikovni opisi tudi namenjeni. Čeprav so v svetu v leksikografski teoriji in praksi že ustaljene raziskave uporabnikov, njihovih potreb in pričakovanj, pa se slovenski prostor tovrstnih raziskav sistematično loteva šele zadnjih nekaj let. Raziskava se tudi v tem segmentu vpenja v aktualne leksikografske trende in se loteva uporabniških potreb in pričakovanj. Da bi akademska skupnost čim bolj učinkovito komunicirala s širšo javnostjo, je eden od projektnih ciljev tudi priprava orodja za sistematično spremljanje življenja besed; za raziskovalce je to razvojno izjemno izzivalen izdelek, ki bo neposredno doprinesel h kulturnemu razvoju in gradnji vitalno pomembne jezikovne infrastrukture.
Najpomembnejši znanstveni rezultati Vmesno poročilo, zaključno poročilo
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati Vmesno poročilo, zaključno poročilo
Zgodovina ogledov
Priljubljeno