Termi "data" ei ole uusi meille. Se on yksi tärkeimmistä asioista opettaessaan, kun valitset tietotekniikan ja tietokoneiden. Jos muistat, tietoja pidetään raaka-aineina. Vaikka olemassa jo kymmenen vuotta, termi Suuri data on huijaus näinä päivinä. Kuten termistä ilmenee, kuormat ja datan kuormitukset ovat suuria tietoja ja niitä voidaan käsitellä eri tavoin erilaisten menetelmien ja työkalujen avulla tarvittavien tietojen hankkimiseksi. Tässä artikkelissa käsitellään Big Data -konsepteja, käyttäen 3 V: n mainetta, jonka Doug Laney on maininnut tietovarastuksen alalla, jonka katsotaan aloittaneen Infonomics (Informaatiotieteet).
Big Data 3 vs.
Tiedot, jotka olivat valtakunnallisesti kerättyjä eri keinoin, tallennettiin oikein erilaisiin tietokantoihin aiemmin ja heitettiin jonkin ajan kuluttua. Kun konsepti ilmeni, että mitä enemmän tietoja, sitä helpompi selvittää - erilaiset ja asiaankuuluvat tiedot - käyttämällä oikeita työkaluja, yritykset alkoivat tallentaa tietoja pidemmille ajanjaksoille. Tämä on kuin uusien tallennuslaitteiden lisääminen tai pilven avulla tietojen tallentaminen missä muodossa tietojen hankinta tapahtuu: asiakirjat, laskentataulukot, tietokannat ja HTML jne. Sitten ne järjestetään asianmukaisiin muotoihin käyttämällä työkaluja, jotka pystyvät käsittelemään suuria paloja data.
HUOMAUTUS: Suurien tietojen laajuus ei rajoitu tietoihin, joita keräät ja tallennetaan tiloissasi ja pilvessä. Se voi sisältää tietoja muista lähteistä, mukaan lukien, mutta ei niihin rajoittuen, julkisen sektorin kohteet.
Suurten tietojen 3D-malli perustuu seuraaviin V: eihin:
- Volume: tarkoittaa tiedon tallennuksen hallintaa
- Velocity: viittaa tietojenkäsittelyn nopeuteen
- Variety: tarkoittaa erilaisten, näennäisesti toisistaan riippumattomien datajoukkoiden ryhmittelyä
Seuraavissa kappaleissa selitetään Big Data -mallinnus puhumalla jokaisesta ulottuvuudesta (kukin V) yksityiskohtaisesti.
A] Suurten tietojen määrä
Suurista tiedoista puhuttaessa voimme ymmärtää äänenvoimakkuutta valtavaksi joukoksi raakaa tietoa. Vaikka tämä on totta, kyse on myös tietojen tallennuskustannuksista. Tärkeitä tietoja voidaan tallentaa sekä tiloissa että pilvessä, jälkimmäinen on joustava vaihtoehto. Mutta sinun täytyy tallentaa kaikki ja kaikki?
Meta Groupin julkaiseman valkoisen kirjan mukaan tietojen osuuden kasvaessa tietojen osat alkavat tarpeettomiksi. Lisäksi se toteaa, että vain sellainen tietomäärä, jota yritykset aikovat käyttää, olisi säilytettävä. Muut tiedot voidaan hylätä tai yritykset eivät ole halukkaita luovuttamaan "oletettavasti ei-tärkeitä tietoja", ne voidaan sijoittaa käyttämättömiin tietokoneisiin ja jopa nauhoihin, jotta yritykset eivät tarvitse maksaa tällaisten tietojen tallentamisesta.
Käytin "oletettavasti merkityksettömiä tietoja", koska minäkin uskon, että minkäänlaista liiketoimintaa voi tulevaisuudessa pyytää - ennemmin tai myöhemmin - ja sitä on pidettävä hyvissä ajoin ennen kuin tiedät, että tiedot ovat todellakin ei-tärkeät. Henkilökohtaisesti tyhjennän vanhat tiedot kiintolevyille vanhimmilta ja toisinaan DVD-levyiltä. Päätietokoneet ja pilvi-tallennus sisältävät tärkeitä tietoja ja tiedän, että käytän niitä. Näistäkin tiedoista löytyy myös kerran -tyyppisiä tietoja, jotka saattavat päätyä vanhaan kiintolevyyn muutaman vuoden kuluttua. Edellä oleva esimerkki on vain ymmärryksesi. Se ei sovi Suurten tietojen kuvaukseen, koska summa on melko vähäinen verrattuna siihen, mitä yritykset pitävät suurina tiedoina.
B ] Velocity suurissa tiedoissa
Tietojen nopeus on tärkeä tekijä puhuttaessa Big Data-käsitteistä. On monia verkkosivustoja, erityisesti sähköistä kaupankäyntiä. Google oli jo myöntänyt, että nopeus, jolla sivun lataus on välttämätöntä paremman sijoituksen kannalta. Sijoitusten lisäksi nopeus tarjoaa käyttäjille myös mukavuutta, kun he myyvät. Sama pätee myös muiden tietojen käsittelyyn.
Puhuttaessa nopeudesta on tärkeää tietää, että se on vain suurempaa kaistanleveyttä. Se yhdistää helposti käytettävät tiedot eri analyysityökaluilla. Helppokäyttöiset tiedot tarkoittavat eräitä kotitehtäviä luomaan helposti käsiteltäviä tietoja. Seuraava ulottuvuus - Variety, levittää tätä valoa.
C] Erilaisia suuria tietoja
Kun kuormia ja kuormituksia on paljon, on tärkeää organisoida ne siten, että analyysityökalut voivat helposti käsitellä tietoja. On myös työkaluja tietojen järjestämiseen. Tallennettaessa tiedot voivat olla rakenteettomia ja kaikenlaisia. Sinun on selvitettävä, mitä yhteyttä hänellä on muiden tietojen kanssa. Kun selvität suhteen, voit noutaa sopivia työkaluja ja muuntaa tiedot haluttuun muotoon jäsennellylle ja lajitellulle tallennukselle.
Yhteenveto
Toisin sanoen Big Data 3D -malli perustuu kolmeen ulottuvuuteen: USABLE-tietosi, joita sinulla on; oikea tietojen merkitseminen; ja nopeampaa käsittelyä. Jos näitä kolmea huolehditaan, tietoja voidaan helposti käsitellä tai analysoida selvittääksesi mitä haluat.
Edellä selostetaan molemmat käsitteet ja Big Data -dimalli 3D-malliin. Toisessa kappaleessa linkitetyt artikkelit osoittavat lisätukea, jos olet uusi käsite.
Jos haluat lisätä mitään, ole hyvä kommentti.