A big data kifejezést különböző helyeken használják, és sokan úgy érezhetik, hogy jelentősége növekszik. Arra azonban, hogy mi a big data, nehéz pontos választ adni. Itt példákkal mutatjuk be a big data alapjait, a big data használatát, valamint a big data használatának kihívásait.
Mi az a big data
A nagy adatmennyiségre gyakran úgy gondolnak, mint “nagy mennyiségű adatra”. A kezdeti időkben, amikor a big data kifejezést valóban használták, a cél az volt, hogy nagy mennyiségű adatot gyűjtsenek össze, és abból merítsenek valamit. A mai értelemben használt big data kifejezést azonban nem kizárólag a mennyiségi nagyság határozza meg. Amit ábrázol, az összetettebb, többféle lehetőséggel. Vessünk egy pillantást arra, hogy mi az a Big Data, és a három V fogalma javasolt annak egyértelmű meghatározása.
A nagy adatot három V jelképezi
A 2000-es évek elején TAG Rainey, egy IT-kutató cég elemzője úgy határozta meg, hogy a big data három vs-t igényel. A három V a térfogat, sebesség és változatosság.
Amikor mindenki hallja a big data szót, a „volumen” jut eszébe. Mint látható, a TAG Rainey definíciója az adatmennyiséget is tartalmazza. Először is, a big data azon az elképzelésen alapul, hogy nagy mennyiségű adatból fogják előállítani, ahogy fejlődik, a feldolgozott adatok mennyisége ország e-mail lista még nagyobb lesz. Az itt meghatározott mennyiség magára az adatmennyiségre is vonatkozik, de magában foglalja ezen nagy mennyiségű adat feldolgozásának lehetőségét is.
A sebesség nem azt jelenti, hogy milyen gyorsan
jönnek és mennek az adatok. Milyen gyakran frissítik az adatokat és milyen gyorsan változnak. Főleg az interneten lévő adatok változnak folyamatosan, és ha nincs rá reagálni képes rendszer, nem lehet a helyzet alapján eredményt levonni. A Big Data ezen változtatások gyorsaságát és a megfelelő frissítési gyakoriságot is megköveteli.
Valószínűleg a változatosság a legnyilvánvalóbb gondolataim a médiával való kommunikációról – japanese stratus része a „csak sok adat” és a „nagy adat” közötti különbségnek. A korábbi adatösszesítésnél általában strukturált adatként formázták és tárolták az adatokat. A big data azonban nem csak numerikus adatokat tartalmaz, hanem strukturálatlan információkat is, például hangot, videót, szöveget és e-mailt, részvényárfolyamokat és pénzügyi információkat. Ezenkívül képesnek kell lennie a strukturált és a strukturálatlan adatok kezelésére is.
A big data definíciójaként ez a „három V” a főáramú, ezeket összefoglalva a big data úgy jellemezhető, hogy „egy sokrétű és masszívan változó adatcsoport és annak feldolgozási képessége”.
A big data magában foglalja az adatokat feldolgozó rendszereket
Mivel a változatosságot a három V definíciója fejezi ki, a big data magában foglalja a strukturálatlan adatokat, valamint a strukturált adatokat, például számokat és azb címtár karakterláncokat. Az adatokat ilyen körülmények között a hagyományos rendszerekkel már nehéz feldolgozni, de megvan az oka annak, hogy itt a big data várható. Egyre nagyobb az elvárás e korábban nehezen feldolgozható strukturálatlan adatok felhasználásával.
A big data reprezentálhatja magát az adatot, de ez önmagában nem tágítja ki a hasznosítás hatókörét és lehetőségeit. Tartalmaznia kell egy