Projekti / Programi
Inteligentna analiza podatkov, računalniška logika in jezikoslovje
01. januar 1999
- 31. december 2003
Koda |
Veda |
Področje |
Podpodročje |
2.07.00 |
Tehnika |
Računalništvo in informatika |
|
2.06.00 |
Tehnika |
Sistemi in kibernetika |
|
Koda |
Veda |
Področje |
P176 |
Naravoslovno-matematične vede |
Umetna inteligenca |
B110 |
Biomedicinske vede |
Bioinformatika, medicinska informatika, biomatematika, biometrija |
H350 |
Humanistične vede |
Jezikoslovje |
B003 |
Biomedicinske vede |
Ekologija |
P175 |
Naravoslovno-matematične vede |
Informatika, teorija sistemov |
P110 |
Naravoslovno-matematične vede |
Matematična logika, teorija množic, kombinatorika |
računalništvo in informatika, umetna inteligenca, informacijski sistemi, analiza podatkov, induktivno logično programiranje, logično programiranje z omejitvami, računalniško jezikoslovje, jezikovne tehnologije, medicinska informatika, analiza podatkov o okolju
Raziskovalci (7)
št. |
Evidenčna št. |
Ime in priimek |
Razisk. področje |
Vloga |
Obdobje |
Štev. publikacijŠtev. publikacij |
1. |
05806 |
dr. Bojan Cestnik |
Računalništvo in informatika |
Raziskovalec |
2001 - 2003 |
197 |
2. |
11130 |
dr. Sašo Džeroski |
Računalništvo in informatika |
Raziskovalec |
2001 - 2003 |
1.204 |
3. |
05023 |
dr. Tomaž Erjavec |
Jezikoslovje |
Raziskovalec |
2001 - 2003 |
636 |
4. |
20243 |
dr. Branko Kavšek |
Računalniško intenzivne metode in aplikacije |
Raziskovalec |
2001 - 2003 |
134 |
5. |
08949 |
dr. Nada Lavrač |
Računalništvo in informatika |
Vodja |
2001 - 2003 |
869 |
6. |
16302 |
dr. Ljupčo Todorovski |
Računalništvo in informatika |
Raziskovalec |
2001 - 2003 |
443 |
7. |
22279 |
dr. Bernard Ženko |
Računalništvo in informatika |
Raziskovalec |
2002 - 2003 |
172 |
Organizacije (1)
št. |
Evidenčna št. |
Razisk. organizacija |
Kraj |
Matična številka |
Štev. publikacijŠtev. publikacij |
1. |
0106 |
Institut "Jožef Stefan" |
Ljubljana |
5051606000 |
90.742 |
Povzetek
Na vseh področjih človekovega delovanja smo priča razkoraku med količino ustvarjenih podatkov, ki se shranjujejo na elektronskih medijih, ter človekovo sposobnostjo razumevanja teh podatkov. Cilj programa je razvoj in uporaba metod umetne inteligence za računalniško analizo podatkov, ki sodijo na področje odkrivanja zakonitosti v podatkovnih bazah (KDD - Knowledge Discovery in Databases) in inteligentne analize podatkov (IDA - Intelligent Data Analysis). Te metode bomo razvijali v tesni povezavi z izsledki računalniške logike (Computational Logic), predvsem induktivnega logičnega programiranja (ILP - Inductive Logic Programming), logičnega programiranja z omejitvami (CLP - Constraint Logic Programming) in računalniškega jezikoslovja (Computational Linguistics). Vezni člen v raziskavah je zahteva po čim večji uporabi človekovega znanja pri reševanju problemov in analizi podatkov ter čim boljši razumljivosti odkritih rešitev, kar omogoča uporaba logičnih formalizmov za predstavitev znanja. Na področju inteligentne analize podatkov bo raziskovalni program usmerjen v razvoj novih in izpopolnjevanje obstoječih računalniških metod strojnega učenja, predvsem induktivnega logičnega programiranja. Razvite metode bomo uporabili na različnih področjih ter jih tudi prilagajali zahtevam izbranega področja. Poseben poudarek bo na uporabi razvitih metod za reševanje naslednjih praktičnih problemov:- analiza medicinskih podatkov in sinteza diagnostičnih in prognostičnih pravil (pri ishem. bolezni srca, epilepsiji, itd.),- analiza podatkov o okolju (podatkov o kakovosti rečnih voda, modeliranje populacij gozdnih živali, itd.),- analiza ekonomsko-poslovnih podatkov (podatkov o podjetjih, prodaji, itd.).Pri modeliranju problemov z metodami logičnega programiranja z omejitvami je za učinkovito reševaje problemov potrebno v model vključiti znanje o domeni ter izkušnje o modeliranju podobnih tipov problemov. To lahko dosežemo v sodelovanju z eksperti. Raziskave v tem programu pa bodo namenjene avtomatskemu generiranju tovrstnega znanja z uporabo metod strojnega učenja. Metode logičnega programiranja z omejitvami bomo uporabili za analizo in reševanje kompleksnih kombinatoričnih problemov na različnih področjih (razporejanje poslov in virov, izgradnja urnikov, itd.).Na področju računalniške lingvistike (Computational Linguistics) in jezikovnih tehnologij (Language Technologies) bomo v okviru programa zbirali in analizirali tekstovne podatke. Poudarek bo na zajemu in gradnji slovenskih in večjezičnih jezikovnih virov, predvsem korpusov in slovarjev. Razvijali bomo oblikoslovne, skladenjske in prevodne jezikovne modele slovenskega jezika, pri čemer bomo uporabljali tudi metode strojnega učenja, predvsem induktivnega logičnega programiranja.
Pomen za razvoj znanosti
Že program Fourth Framework Evropske unije ugotavlja, da so adaptivnost in odkrivanje znanja iz podatkov izjemnega pomena za izboljšanje delovnih in administrativnih procesov. Pri večjih problemih s tega področja, ki so prioritetnega značaja za uporabnike, je prisotna potreba po odkrivanju znanja iz tekstovnih in relacijskih podatkov, tj. podatkov, ki jih lahko obravnavamo z metodami računalniške lingvistike in induktivnega logičnega programiranja. Z naraščanjem količine shranjenih podatkov (Data Warehousing) narašča tudi zavedanje o ključnem pomenu strukturiranih podatkov in relacij med njimi za področja uporabe kot so biologija, ekologija in upravljanje z okoljem, inženirstvo in medicina. Raziskave inteligentne analize podatkov, odkrivanja zakonitosti v podatkovnih bazah in računalniške lingvistike so v svetu v izjemnem razcvetu, kar dokazujejo nove konference, znanstvene revije in knjige s tega področja. Podobno velja tudi za logično programiranje z omejitvami, ki se je v zadnjih nekaj letih izkazalo kot najprodornejše področje računalniške logike. Raziskovalni program bo prispeval k razvoju metod induktivnega logičnega programiranja ter uporabe metod strojnega učenja za analizo podatkov v ekologiji in medicini ter k razvoju in analizi slovenskih jezikovnih virov. Prispeval bo tudi k razvoju metod za učinkovitejše reševanje sistemov omejitev.
Pomen za razvoj Slovenije
Program bo prispeval k razvoju slovenske znanosti na področju odkrivanja zakonitosti v podatkovnih bazah, računalni-škega jezikoslovja in računalniške logike, predvsem induktivnega logičnega programiranja in logičnega programiranja z omejitvami. Skrbeli bomo tudi za popularizacijo teh področij ter širjenje znanj o navedenih področjih v Sloveniji.Razvili bomo nove algoritme strojnega učenja za analizo podatkov, ki bodo omogočali uporabo strokovnega znanja o problemu, razumljivost naučenih pravil ter uporabnost za raziskave in reševanje praktičnih problemov. Nadaljevali bomo z analizo slovenskih podatkov o okolju (v sodelovanju s Hidrometeorološkim zavodom Slovenije in Oddelkom za gozdarstvo Biotehniške fakultete v Ljubljani). Izsledki analiz bi lahko prispevali k izboljšanju spremljanja in ocenjevanja kako-vosti rečnih voda ter k izboljšanju upravljanja populacij gozdnih živali. Nadaljevali bomo z analizo medicinskih podatkov (v sodelovanju z raziskovalci Medicinske fakultete in zdravniki UKC v Ljubljani), kjer bi uporaba metod za inteligentno analizo podatkov lahko pomembno doprinesla k zmanjšanju števila preiskav, kvalitetnejšemu spremljanju zdravstvenega stanja bolnikov ter hitrejši diagnostiki. Algoritme logičnega programiranja z omejitvami bomo uporabili na zahtevnih optimizacijskih problemih za izboljšanje produktivnosti slovenskih podjetij, predvsem na podr. strojništva.Prihodnost slovenščine je vezana tudi na razvitost jezikovnih tehnologij za naš jezik, še posebej z razvojem informacijskih tehnologij in vključevanja Slovenije v Evropsko unijo. Najbolj akutno je pomanjkanje podpore prevajanju, iskanju informacij, slovaropisju in terminologiji. Nadaljevanje dela na izgradnji računalniških virov (v sodelovanju z DZS d.d. in Amebis d.o.o.) in modelov slovenskega jezika ima namen nuditi konkretne rešitve na tem področju in spodbuditi razvoj tega, zaenkrat skoraj neobstoječega področja v Sloveniji.
Najpomembnejši znanstveni rezultati
Zaključno poročilo
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati
Zaključno poročilo