Kas yra "Big Data" - paprastas paaiškinimas su pavyzdžiu

Turinys:

Kas yra "Big Data" - paprastas paaiškinimas su pavyzdžiu
Kas yra "Big Data" - paprastas paaiškinimas su pavyzdžiu
Anonim

Terminas Dideli duomenys vis dažniau naudojama beveik visur planetoje - internetu ir neprisijungus. Ir tai nėra susijusi tik su kompiuteriais. Jis pateikiamas po visuotinio termino "informacinės technologijos", kuris dabar yra beveik visų kitų technologijų ir studijų bei verslo sričių dalis. "Big Data" nėra didelis pasiūlymas. Hipas aplink jį yra tikras gana didelis dalykas, kuris supainioja jus. Šiame straipsnyje aptariama, kas yra "Big Data". Jame taip pat pateikiamas pavyzdys, kaip "NetFlix" panaudojo savo duomenis, arba "Big Data", kad geriau atitiktų klientų poreikius.

Image
Image

Kas yra "Big Data"?

Duomenys, esantys jūsų kompanijų serveriuose, buvo tik iki vakar pateikti duomenys, surūšiuoti ir pateikti. Staiga "Slengas Big Data" tapo populiarus, o dabar jūsų įmonės duomenys yra "Big Data". Sąvoka apima kiekvieną duomenų dalį, kurią jūsų organizacija saugo iki šiol. Tai apima debesyje saugomus duomenis ir net URL, kuriuos pažymėjote. Jūsų įmonė nebūtinai gali skaitmeninti visus duomenis. Galbūt jūs neturite struktūrizuoti visų duomenų. Bet tada visi jūsų įmonės skaitmeniniai, popieriniai, struktūrizuoti ir nestruktūruoti duomenys yra "Big Data".

Trumpai tariant, visi jūsų serveriuose esantys duomenys, nepriklausomai nuo to, ar jie suskirstyti į kategorijas, yra bendrai vadinami BIG DATA. Visi šie duomenys gali būti naudojami skirtingiems rezultatams gauti naudojant skirtingus analizės tipus. Nebūtina, kad visa analizė naudotų visus duomenis. Įvairios analizės metu naudojamos skirtingos "BIG DATA" dalys, kad gautų reikiamus rezultatus ir prognozes.

"Big Data" iš esmės yra duomenys, kuriuos analizuojate naudodamiesi rezultatais, kuriuos galite naudoti numatymams ir kitiems tikslams. Naudodami terminą "didieji duomenys" staiga jūsų įmonė ar organizacija dirba su aukščiausio lygio informacinėmis technologijomis, kad gautų skirtingų tipų rezultatus naudodamiesi tais pačiais duomenimis, kuriuos jūs tyliai ar netyčia laikėte per kelerius metus.

Kiek yra dideli duomenys

Iš esmės visi duomenys kartu yra "Big Data", tačiau daugelis mokslininkų sutinka, kad "Big Data" - kaip toks - negali būti manipuliuojama naudojant įprastas skaičiuokles ir įprastus duomenų bazių valdymo įrankius. Jiems reikalingos specialios analizės priemonės, tokios kaip "Hadoop" (mes tai išnagrinėsime atskirame pranešime), kad visus duomenis būtų galima analizuoti vienu metu (gali būti ir analizės kartojimo).

Priešingai nei minėta, nors aš ir nėra ekspertas šiuo klausimu, aš sakyčiau, kad duomenys su bet kuria organizacija - didelė ar maža, organizuota ar neorganizuota - yra tos organizacijos didieji duomenys ir kad organizacija gali pasirinkti savo pačios analizės priemones duomenys.

Paprastai duomenų analizavimui žmonės kuria skirtingus duomenų rinkinius, pagrįstus vienu ar keliais bendrais laukais, todėl analizė tampa lengva. "Big Data" atveju nereikia sukurti pogrupių analizuoti. Dabar turime įrankių, galinčių analizuoti duomenis, neatsižvelgiant į tai, kiek tai didžiulė. Tikriausiai šie įrankiai patys suskirsto duomenis į kategorijas, netgi analizuodami juos.

Manau, kad svarbu paminėti du sakinius iš Jimmy Gutermano knygos "Didieji duomenys":

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

ir

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Taigi matote, kad tiek apimtis, tiek analizė yra svarbi "Big Data" dalis.

Skaitykite: Kas yra duomenų gavyba?

"Big Data Concepts"

Tai dar vienas klausimas, dėl kurio dauguma žmonių nesutinka. Kai kurie ekspertai teigia, kad "Big Data Concepts" yra trys V:

  1. Tomas
  2. Greitis
  3. Veislė

Kai kurie kiti prideda dar keletą V prie šios sąvokos:

  1. Vizualizacija
  2. Patikimumas (patikimumas)
  3. Kintamumas ir
  4. Vertė

Aš apims "Big Data" sąvokas atskirame straipsnyje, nes šis pranešimas jau tampa didelis. Mano nuomone, pirmuosius tris V pakanka paaiškinti "Big Data" sąvoką.

Pavyzdys "Big Data" - kaip "NetFlix" panaudojo, kad išspręstų problemas

2008 m. "NetFlix" nutrūko, dėl ko daugelis klientų liko tamsoje. Nors kai kurie vis dar galėtų naudotis transliacijos paslaugomis, dauguma jų negalėjo. Kai kuriems klientams pavyko gauti nuomojamus DVD, o kiti nepavyko. "Wall Street Journal" tinklaraščio įrašas sako, kad "Netflix" ką tik pradėjo užsakomąsias transliacijas.

Dėl sutrikusio darbo, valdyba galvoja apie galimas būsimas problemas ir todėl; tai pasuko į "Big Data". Jis išnagrinėjo didelę eismo zonų, jautrių taškų ir tinklo pralaidumą ir tt, naudodamasis šiais duomenimis, dirbo, kad sumažintų prastovos laiką, jei atsiras ateityje kilus problema, kai ji bus globali. Čia yra nuoroda į "Wall Street Journal" dienoraštį, jei norite pamatyti "Big Data" pavyzdžius.

Ankstesnis apibendrina, kas yra "Big Data", esanti ispanų kalbos kalba. Galite vadinti tai labai paprastu įvadu. Aš planuoju rašyti keletą straipsnių apie susijusius veiksnius, tokius kaip: "Koncepcijos", "Analizė", "Įrankiai" ir "Big Data", "Big Data 3 V" ir tt naudojimas ir tt Tuo tarpu, jei norėtumėte ką nors papildyti, prašome komentuoti ir bendrinti su mus.

Rekomenduojamas: