V prispevku prikazujemo analizo luščenja eno- in večbesednih terminoloških kandidatov, ki smo ga izvedli za potrebe priprave slovarja odnosov z javnostmi na podlagi korpusa KoRP z luščilnikom LUIZ. Podrobneje se posvečamo dvojemu: (a) izluščenim enobesednim samostalniškim terminološkim kandidatom, katerih seznam primerjamo s pogostostnim seznamom samostalnikov v KoRP in vrednotimo glede na terminološkost, kot sta jo prepoznala dva področna strokovnjaka, ter (b) izluščenim večbesednim nizom z glagolskim jedrom. Nadgrajeno metodo luščenja in izboljšan prikaz rezultatov smo dopolnili še z analizo priklica. Potrdili oz. ugotovili smo, da je v primerjavi s pogostostnim seznamom terminološki potencial enot v zgornjem delu liste izluščenih samostalnikov večji in da imajo izluščeni glagolski besedni nizi predvsem kolokacijsko vrednost, ne pa tudi terminološke. Analiza priklica je pokazala predvsem nizko stopnjo strinjanja med obema področnima strokovnjakoma, sicer pa je bil priklic razmeroma visok.
COBISS.SI-ID: 31519069
Pri oblikovanju leksikalne baze za slovenščino v okviru projekta Sporazumevanje v slovenskem jeziku smo del gesel izdelali s postopkom avtomatskega luščenja leksikalnih podatkov iz korpusa Gigafida prek orodja Sketch Engine neposredno v program za izdelavo leksikalne baze iLex. V prispevku opisujemo posamezne korake pri pripravi avtomatizacijskega postopka, zlasti prilagoditev slovnice besednih skic, izdelavo konfiguracije za aplikacijo GDEX za izbor dobrih korpusnih zgledov in pripravo API skripte. Na kratko predstavimo prve rezultate izvedenega postopka in predlagamo izboljšave tako na ravni metodologije kot tudi vključitve dodatnih jezikovnotehnoloških funkcionalnosti pri avtomatičnem luščenju jezikovnih podatkov.
COBISS.SI-ID: 34731309
Za analizo korpusnih podatkov leksikografi potrebujejo orodje, ki jim bo omogočilo iskanje, obdelavo in shkranjevanje podatkov. Dobro korpusno orodje je ključno za celostno leksikografsko analizo. Funkcionalnost in uporabniška prijaznost korpusnih orodij sta se močno izboljšali, odkar so bila taka orodja prvič uporabljena v slovarskih projektih. Prispevek podrobno predstavlja Sketch Engine in njegovo aplikacijo TickBox Lexicograpy.
COBISS.SI-ID: 31850845