Nalaganje ...
Projekti / Programi vir: ARIS

Paradigma stiskanja podatkov z odstranjevanjem obnovljivih informacij

Raziskovalna dejavnost

Koda Veda Področje Podpodročje
2.07.00  Tehnika  Računalništvo in informatika   

Koda Veda Področje
1.02  Naravoslovne vede  Računalništvo in informatika 
Ključne besede
stiskanje podatkov, značilnica, optimizacija, algoritmi restavracije, univerzalna platforma
Vrednotenje (metodologija)
vir: COBISS
Organizacije (1) , Raziskovalci (13)
0796  Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  53590  dr. Jernej Cukjati  Računalništvo in informatika  Mladi raziskovalec  2022 - 2023 
2.  53755  Aljaž Jeromel  Računalništvo in informatika  Raziskovalec  2022 - 2025  29 
3.  37222  dr. Štefan Kohek  Računalništvo in informatika  Raziskovalec  2022 - 2025  142 
4.  16259  dr. Simon Kolmanič  Računalništvo in informatika  Raziskovalec  2022 - 2025  219 
5.  21318  dr. Bogdan Lipuš  Računalništvo in informatika  Raziskovalec  2022 - 2025  59 
6.  33709  dr. Niko Lukač  Računalništvo in informatika  Raziskovalec  2022 - 2025  245 
7.  29243  dr. Domen Mongus  Računalništvo in informatika  Raziskovalec  2022 - 2025  303 
8.  32690  Sašo Pečnik  Računalništvo in informatika  Raziskovalec  2022 - 2025  24 
9.  15671  dr. David Podgorelec  Računalništvo in informatika  Raziskovalec  2022 - 2025  225 
10.  08638  dr. Krista Rizman Žalik  Računalništvo in informatika  Raziskovalec  2022 - 2025  194 
11.  18726  dr. Damjan Strnad  Računalništvo in informatika  Raziskovalec  2022 - 2025  268 
12.  06671  dr. Borut Žalik  Računalništvo in informatika  Vodja  2022 - 2025  878 
13.  31475  Denis Žganec  Računalništvo in informatika  Tehnični sodelavec  2022 - 2025  19 
Povzetek
Stiskanje podatkov je ena izmed tradicionalnih disciplin računalništva, ki pa v zadnjih desetletjih ni bistveno napredovala in ni sledila trendom v znanosti, ko z novimi napravami zajemamo vedno večje količine zelo raznorodnih podatkov. Te stiskamo z domensko odvisnimi ali s splošnonamenskimi metodami. Splošnonamenske metode so vsem dobro znane brezizgubne rešitve izpred dobrih 30 let (na primer RAR ali ZIP). Splošnost dosegajo s tem, da tok podatkov obravnavajo na elementarnem nivoju zlogov, s čimer pa zanemarijo višjenivojske relacije, ki v podatkih morda obstajajo. Domensko odvisne metode so izgubne, skoraj brezizgubne ali brezizgubne. Izgubne metode temeljijo na transformacijah, ki podatke preslikajo v frekvenčni prostor, kjer opravijo kvantizacijo, preostale vrednosti pa zakodirajo brezizgubno, pri čemer je tudi brezizgubni del postopkov praviloma domensko odvisen. Skoraj brezizgubne in brezizgubne metode so izrazito drugačne in tipično temeljijo na napovedovanju, ki pa upošteva le ozek prostorski in/ali časovni kontekst, s čimer se uspešnost napovedi manjša. Večina metod je tudi simetrična, kar pomeni, da razširjanje podatkov opravijo z enakim cevovodom metod, le v obratnem vrstnem redu. Slabost tega je enaka časovna zahtevnost kodiranja in dekodiranja, kar pomeni, da dekodirnik zahteva podobno računalniško infrastrukturo kot kodirnik. Za vsak tip podatkov potrebujemo specifične rešitve, ki na drug tip podatkov niso prenosljive (stiskanje zvoka je zelo drugačno kot, na primer, stiskanje rastrskih slik). V projektu COMPROMISE želimo razviti novo metodologijo stiskanja podatkov, ki bo v veliki meri domensko neodvisna, nesimetrična ter z enotnim cevovodom postopkov primerna za izgubno, skoraj brezizgubno in izgubno stiskanje. Domensko neodvisnost bomo dosegli s tem, da bomo v različnih domenah oblikovali nabore značilnic, ki jih bomo povezali v enotno domensko neodvisno taksonomijo. Značilnica bo v našem projektu informacija, ki temelji na človekovih zaznavah in ima za interpretacijo podatkovnega toka ali njegovo strojno obdelavo (npr. računalniški vid, klasifikacija) visoko diskriminativno oz. prediktivno vrednost. Dobljen nabor značilnic bomo nato v domensko neodvisnem procesu iterativne optimizacije zmanjševali do nivoja, ki bo iz nabora ohranjenih značilnic z restavracijskimi tehnikami še omogočal zadovoljivo rekonstrukcijo vhodnega podatkovnega toka. Cevovod stiskanja bo povsem enak za izgubno, brezizgubno in skoraj brezizgubno stiskanje, le da bomo v primeru slednjih dveh na izhod poslali tudi popravke, ki jih bomo v optimizacijskem postopku dobili kot razliko med izvornim in restavriranim podatkovnim nizom. Postopek razširjanja podatkov bo računsko mnogo enostavnejši, saj bo samo razširil značilnice, jih restavriral in v primeru brezizgubnega ali skoraj brezizgubnega stiskanja korigiral s popravki. S tem bodo zahteve za dekodirnik bistveno manjše kot za kodirnik. Koncept domensko neodvisnih značilnic omogoča tudi, da stisnjeni podatki ohranijo informacije o višjenivojskih relacijah v podatkih, s čimer povečujemo ponovno uporabljivost podatkov na različnih semantičnih nivojih. Da bi pokazali univerzalnost in domensko neodvisnost metodologije, bomo v naši raziskavi uporabili rastrske slike, digitalni avdio, biomedicinske signale in redke vokselske mreže, torej podatke, ki se razlikujejo tako po dimenzionalnosti kot dinamičnosti in naslavljajo dva človekova zaznavna sistema – vid in sluh. Predlagano domensko neodvisno metodologijo bomo implementirali z enotno platformo, s katero bomo pokazali uspešnost in univerzalnost metodologije COMPROMISE ter predvidoma potrdili ključne kazalnike učinkovitosti in s tem tudi postavljeno znanstveno hipotezo. Pričakujemo, da bomo s predlagano metodologijo v testnih domenah dosegli boljša razmerja brezizgubnega in skoraj brezizgubnega stiskanja podatkov, kot jih dosegajo obstoječe domensko odvisne metode, s čimer bomo postavili temelje za nov rod metod stiskanja podatkov.
Zgodovina ogledov
Priljubljeno