Projekti / Programi
Jezikovni viri za slovenščino
Koda |
Veda |
Področje |
Podpodročje |
6.05.00 |
Humanistika |
Jezikoslovje |
|
Koda |
Veda |
Področje |
H350 |
Humanistične vede |
Jezikoslovje |
H352 |
Humanistične vede |
Slovnica, semantika, semiotika, sintaksa |
H360 |
Humanistične vede |
Uporabna lingvistika, poučevanje tujih jezikov, sociolingvistika |
P175 |
Naravoslovno-matematične vede |
Informatika, teorija sistemov |
P176 |
Naravoslovno-matematične vede |
Umetna inteligenca |
jezikovni viri, korpusno jezikoslovje, korpusi, slovenski jezik, jezikoslovno označevanje, lematizacija, disambiguacija, pomensko označevanje, avtomatsko iskanje podatkov
Raziskovalci (10)
Organizacije (3)
Povzetek
Projekt Jezikovni viri za slovenščino bo oblikoval korpusne vire in jezikoslovna ter tehnološka orodja za raziskovanje slovenskega jezika in besedil v slovenščini. Oblikovan bo kot količinska in kakovostna nadgradnja referenčnega korpusa slovenskega jezika FIDA, v sodelovanju istih partnerjev (Filozofska fakulteta Univerze v Ljubljani, Inštitut Jožef Stefan, DZS d.d., Amebis d.o.o.) in s pritegnitvijo enega novega (Fakulteta za družbene vede Univerze v Ljubljani). Nadgradnja korpusa bo potekala na več nivojih: v količinski podvojitvi (na 200.000.000 besed), v vključitvi sestavine govornih in spletnih besedil ter v oblikovanju in uporabi dodatnih uravnoteževalnih meril. Vzporedno bo potekala gradnja orodij za avtomatsko pridobivanje besedil za korpus, za procesiranje korpusnih podatkov in njihovo analizo. Vsi rezultati bodo po poteku projekta javno dostopni v raziskovalne in pedagoške namene in s tega stališča odločilni premik v raziskovalni in jezikovnonačrtovalni infrastrukturi na področju humanistike, družboslovja in informacijskih ved.