Nalaganje ...
Projekti / Programi vir: ARIS

Analiza velikih tekstovnih podatkovnih baz

Raziskovalna dejavnost

Koda Veda Področje Podpodročje
2.07.07  Tehnika  Računalništvo in informatika  Inteligentni sistemi - programska oprema 

Koda Veda Področje
T171  Tehnološke vede  Mikroelektronika 
Ključne besede
strojno učenje, učenje na tekstovnih podatkih, analiza spletnih strani, filtriranje informacij
Vrednotenje (pravilnik)
vir: COBISS
Raziskovalci (1)
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  12570  dr. Dunja Mladenić  Računalništvo in informatika  Vodja  1999 - 2001  662 
Organizacije (1)
št. Evidenčna št. Razisk. organizacija Kraj Matična številka Štev. publikacijŠtev. publikacij
1.  0106  Institut "Jožef Stefan"  Ljubljana  5051606000  90.636 
Povzetek
Raziskave bodo usmerjene v razvoj novih in izpopolnjevanje obstoječih računalniških metod za analizo velikih tekstovnih podatkovnih baz. Posebej se bomo posvetili analizi slovenskih besedil. Razvite metode bodo omogočile avtomatsko kategorizacijo dokumentov napisanih v slovenskem jeziku, prilagajanje obstoječih metod strojnega učenja na slovenska besedila, analizo tekstovnih podatkovnih baz na osnovi nove, razširjene predstavitve dokumentov in uporabniku prilagojeno preiskovanje svetovnega spleta zasnovano na razvitih metodah za analizo tekstovnih dokumentov. Omogočen bo tudi razvoj aplikacij, kot je na primer avtomatsko vzdrževanje obstoječih kategorizacij tekstovnih dokumentov, ki so trentuno ročno vzdrževane. Dva primera tovrstne kategorizacije sta kategorizacija slovenskih spletnih strani žMat Kurja'' in specializirana podatkovna baza z nacionalno bibliografijo za biomedicino žBiomedicina Slovenica’.
Zgodovina ogledov
Priljubljeno