Projekti / Programi
Leksikografske in leksikološke raziskave slovenskega jezika z uporabo digitalnih jezikovnih virov
Koda |
Veda |
Področje |
Podpodročje |
6.05.00 |
Humanistika |
Jezikoslovje |
|
Koda |
Veda |
Področje |
H004 |
Humanistične vede |
Filologija |
H350 |
Humanistične vede |
Jezikoslovje |
H353 |
Humanistične vede |
Leksikologija |
H360 |
Humanistične vede |
Uporabna lingvistika, poučevanje tujih jezikov, sociolingvistika |
leksikografija, leksikologija, jezikovne tehnologije, slovenski jezik, jezikoslovje, korpusno jezikoslovje, jezikovni viri
Raziskovalci (24)
Organizacije (2)
Povzetek
Načrtovane raziskave predvidevajo leksikološko-leksikografske analize slovenskega besedišča, nujne za aktualizacijo slovarjev slovenskega knjižnega jezika, nadalje za izdelavo terminoloških slovarjev različnih strok in za leksikološko-leksikografsko redakcijo dveh avtorskih narečnih slovarjev. Omenjeni slovarji so v fazi priprave. Navedene raziskave predstavljajo nadgradnjo obstoječih in so izvedljive na metodološko povsem aktualni ravni s pomočjo uporabe digitalno pripravljenih jezikovnih virov.
Pomen teh virov za leksikološke in leksikografske raziskave se je v zadnjih letih spremenil: pri izbiranju gradiva ne služijo več le kot pomožno orodje, temveč zahteva odločitev o vključitvi ali izključitvi posameznega slovarskega gesla strojno preverjanje pojavitev, tako glede pogostnosti kot sobesedila. Za leksikografsko delo so odločilnega pomena stopnja obdelanosti in zvrstna bogatost jezikovnih virov, ustreznost označitve besedilnih korpusov in stopnja strukturiranosti elektronskih slovarskih zbirk. V okviru raziskovalnega projekta je predvidena dopolnitev in razširitev označitve obstoječih inštitutskih jezikovnih virov glede na potrebe v projektu načrtovanih enojezičnih slovarjev slovenskega jezika ter nadgradnja elektronske slovarske zbirke besednih oblik z govornimi predstavitvami (zvočnimi podobami).
V okviru slednjega je v načrtu nadgradnja obstoječe spletne predstavitve slovarske zbirke Slovarja slovenskega knjižnega jezika z dodatnimi izpisi izgovora za izbrano besedno obliko, tako v obliki fonetičnega prepisa z IPA znaki, kot tudi z govorno predstavitvijo izbrane besedne oblike. Pri tvorjenju govorne predstavitve besednih oblik bo uporabljen sintetizator govora za slovenski jezik, ki omogoča pretvorbo poljubne slovenske besede v ustrezno zvočno podobo. Zvočne podobe besednih oblik bodo v spletno predstavitev slovarske zbirke vnesle zanimivo multimedijsko komponento, ki bo lahko poleg obogatitve spletne predstavitve slovarske zbirke v pomoč tudi tujcem pri iskanju izgovora besednih oblik, saj bodo le-te predstavljene z IPA zapisom ter dodatno govorno predstavitvijo.
Gradivska osnova za obdelavo jezikovnih virov so elektronske različice že obstoječih slovarjev slovenskega jezika (Slovar slovenskega knjižnega jezika, Besedišče slovenskega jezika z oblikoslovnimi podatki, Odzadnji slovar slovenskega jezika po SSKJ, Slovenski pravopis 2001) in v okviru drugih projektov nastajajočih slovarjev (enozvezkovni slovar slovenskega jezika, lematizacijski slovar, vezljivostni slovar, frazeološki slovar, sinonimni slovar).