Suurandmetega seonduvad võimalused ja ohud
miljon inimest. [2]
Kuid mis asjad on suurandmed? Suurandmed tähistavad andmehulki, mis on nii suured või
keerulised, et traditsioonilistest andmetöötlusvahenditest enam ei piisa. Neid iseloomustavad
andmete kiirus, suurus ja mitmekesisus. Andmete kiiruse all võib mõista andmete ajakohasust,
ehk kas suurandmed koosnevad infost, mis on saadud näiteks üleeile või hoopis üle-eelmine
aasta. Suurus iseloomustab suurandmete mahtu, mis, nagu esimestes lõikudes kirjeldatult, kasvab
aja möödudes järjest suuremaks. Andmete mitmekesisuse all peetakse silmas andmete tüüpi.
Tavainimene peab andmeteks peamiselt teksti ja pilt, kuid andmed võivad esineda väga erineval
kujul, olles pärinenud nutitelefonidelt või arvutitelt, struktureeritud või mitte. [3]
Kuna suurandmed on väga ressursimahukad ja erinevad, on nende töötlemine väga keeruline.
Peamiseks väljakutseks on õigete andmete tuvastamine ja nende õige kasutusviisi tuvastamine.