Projekti / Programi
Analiza velikih tekstovnih podatkovnih baz
Koda |
Veda |
Področje |
Podpodročje |
2.07.07 |
Tehnika |
Računalništvo in informatika |
Inteligentni sistemi - programska oprema |
Koda |
Veda |
Področje |
T171 |
Tehnološke vede |
Mikroelektronika |
strojno učenje, učenje na tekstovnih podatkih, analiza spletnih strani, filtriranje informacij
Raziskovalci (1)
št. |
Evidenčna št. |
Ime in priimek |
Razisk. področje |
Vloga |
Obdobje |
Štev. publikacijŠtev. publikacij |
1. |
12570 |
dr. Dunja Mladenić |
Računalništvo in informatika |
Vodja |
1999 - 2001 |
662 |
Organizacije (1)
št. |
Evidenčna št. |
Razisk. organizacija |
Kraj |
Matična številka |
Štev. publikacijŠtev. publikacij |
1. |
0106 |
Institut "Jožef Stefan" |
Ljubljana |
5051606000 |
90.636 |
Povzetek
Raziskave bodo usmerjene v razvoj novih in izpopolnjevanje obstoječih računalniških metod za analizo velikih tekstovnih podatkovnih baz. Posebej se bomo posvetili analizi slovenskih besedil. Razvite metode bodo omogočile avtomatsko kategorizacijo dokumentov napisanih v slovenskem jeziku, prilagajanje obstoječih metod strojnega učenja na slovenska besedila, analizo tekstovnih podatkovnih baz na osnovi nove, razširjene predstavitve dokumentov in uporabniku prilagojeno preiskovanje svetovnega spleta zasnovano na razvitih metodah za analizo tekstovnih dokumentov. Omogočen bo tudi razvoj aplikacij, kot je na primer avtomatsko vzdrževanje obstoječih kategorizacij tekstovnih dokumentov, ki so trentuno ročno vzdrževane. Dva primera tovrstne kategorizacije sta kategorizacija slovenskih spletnih strani žMat Kurja'' in specializirana podatkovna baza z nacionalno bibliografijo za biomedicino žBiomedicina Slovenica’.