Ce este BIG DATA? Introducere, tipuri, caracteristici, exemplu

Cuprins:

Anonim

Înainte de a trece la introducerea în Big Data, mai întâi trebuie să știți

Ce este Data?

Cantitățile, caracterele sau simbolurile pe care operațiile sunt efectuate de un computer, care pot fi stocate și transmise sub formă de semnale electrice și înregistrate pe suporturi magnetice, optice sau mecanice de înregistrare.

Acum, să învățăm introducerea Big Data

Ce este Big Data?

Big Data este o colecție de date care are un volum imens, dar crește exponențial cu timpul. Este o dată cu dimensiuni și complexități atât de mari încât niciunul dintre instrumentele tradiționale de gestionare a datelor nu le poate stoca sau prelucra eficient. Datele mari sunt, de asemenea, date, dar cu dimensiuni imense.

În acest tutorial, veți învăța,

  • Ce este Data?
  • Ce este Big Data?
  • Exemple de Big Data
  • Tipuri de date mari
  • Caracteristicile Big Data
  • Avantajele procesării datelor mari

Exemple de Big Data

Următoarele sunt câteva dintre exemplele Big Data-

New York Stock Exchange generează aproximativ un terabyte de noi date comerciale pe zi.

Rețele sociale

Statistica arată că peste 500 de terabyte de date noi sunt ingerate în bazele de date ale site - ului de socializare Facebook , în fiecare zi. Aceste date sunt generate în principal în ceea ce privește încărcarea de fotografii și videoclipuri, schimbul de mesaje, plasarea de comentarii etc.

Un singur motor Jet poate genera 10 + terabyte de date în 30 de minute de zbor. Cu multe mii de zboruri pe zi, generarea de date ajunge la mai mulți Petabytes.

Tipuri de date mari

Următoarele sunt tipurile de Big Data:

  1. Structurat
  2. Nestructurat
  3. Semi-structurat

Structurat

Orice date care pot fi stocate, accesate și procesate sub forma unui format fix sunt denumite date „structurate”. De-a lungul perioadei de timp, talentul în informatică a obținut un succes mai mare în dezvoltarea tehnicilor de lucru cu astfel de date (unde formatul este bine cunoscut în avans) și, de asemenea, a obținut valoare din acesta. Cu toate acestea, în zilele noastre, prevedem probleme când o dimensiune a acestor date crește într-o măsură imensă, dimensiunile tipice sunt în furia mai multor zettabytes.

Știi? 10 21 octeți egali cu 1 zettabyte sau un miliard de terabytes formează un zettabyte .

Privind aceste cifre, puteți înțelege cu ușurință de ce este dat numele Big Data și imaginați provocările implicate în stocarea și prelucrarea acestuia.

Știi? Datele stocate într-un sistem de gestionare a bazelor de date relaționale sunt un exemplu de date „structurate” .

Exemple de date structurate

Un tabel „Angajați” dintr-o bază de date este un exemplu de date structurate

Card de identitate al angajatului Numele angajatului Gen Departament Salary_In_lacs
2365 Rajesh Kulkarni Masculin Finanţa 650000
3398 Pratibha Joshi Femeie Administrator 650000
7465 Shushil Roy Masculin Administrator 500000
7500 Shubhojit Das Masculin Finanţa 500000
7699 Priya Sane Femeie Finanţa 550000

Nestructurat

Orice date cu formă sau structură necunoscută sunt clasificate ca date nestructurate. Pe lângă faptul că dimensiunea este imensă, datele nestructurate reprezintă multiple provocări în ceea ce privește prelucrarea lor pentru a obține valoare din acestea. Un exemplu tipic de date nestructurate este o sursă de date eterogenă care conține o combinație de fișiere text simple, imagini, videoclipuri etc. aceste date sunt în forma brută sau în format nestructurat.

Exemple de date nestructurate

Rezultatul returnat de „Căutare Google”

Semi-structurat

Datele semi-structurate pot conține atât formele de date. Putem vedea datele semi-structurate ca o formă structurată, dar de fapt nu sunt definite cu, de exemplu, o definiție a tabelului în SGBD relațional. Exemplu de date semi-structurate este o dată reprezentată într-un fișier XML.

Exemple de date semi-structurate

Date personale stocate într-un fișier XML-

Prashant RaoMale35Seema R.Female41Satish ManeMale29Subrato RoyMale26Jeremiah J.Male35

Creșterea datelor de-a lungul anilor

Vă rugăm să rețineți că datele aplicațiilor web, care sunt nestructurate, constau din fișiere jurnal, fișiere istoric tranzacții etc. Sistemele OLTP sunt construite pentru a funcționa cu date structurate în care datele sunt stocate în relații (tabele).

Caracteristicile Big Data

Datele mari pot fi descrise prin următoarele caracteristici:

  • Volum
  • varietate
  • Viteză
  • Variabilitate

(i) Volum - Numele Big Data în sine este legat de o dimensiune enormă. Dimensiunea datelor joacă un rol foarte crucial în determinarea valorii din date. De asemenea, dacă anumite date pot fi considerate sau nu Big Data, depinde de volumul de date. Prin urmare, „Volumul” este o caracteristică care trebuie luată în considerare atunci când se tratează Big Data.

(ii) Varietate - Următorul aspect al Big Data este varietatea sa .

Varietatea se referă la surse eterogene și la natura datelor, atât structurate, cât și nestructurate. În zilele anterioare, foi de calcul și baze de date erau singurele surse de date luate în considerare de majoritatea aplicațiilor. În prezent, în aplicațiile de analiză sunt luate în considerare și date sub formă de e-mailuri, fotografii, videoclipuri, dispozitive de monitorizare, PDF-uri, audio etc. Această varietate de date nestructurate pune anumite probleme pentru stocare, extragere și analiză a datelor.

(iii) Viteză - Termenul „viteză” se referă la viteza de generare a datelor. Cât de repede sunt generate și procesate datele pentru a satisface cerințele, determină potențialul real al datelor.

Big Data Velocity se ocupă de viteza cu care intră datele din surse precum procesele de afaceri, jurnalele aplicațiilor, rețelele și site-urile de socializare, senzorii, dispozitivele mobile etc. Fluxul de date este masiv și continuu.

(iv) Variabilitate - Aceasta se referă la inconsecvența care poate fi prezentată uneori de date, împiedicând astfel procesul de a putea gestiona și gestiona datele în mod eficient.

Avantajele procesării Big Data

Abilitatea de a procesa Big Data aduce beneficii multiple, cum ar fi-

    • Întreprinderile pot utiliza informații externe în timp ce iau decizii

Accesul la date sociale de la motoarele de căutare și site-uri precum Facebook, Twitter permit organizațiilor să își ajusteze strategiile de afaceri.

    • Serviciu clienți îmbunătățit

Sistemele tradiționale de feedback ale clienților sunt înlocuite cu sisteme noi concepute cu tehnologii Big Data. În aceste noi sisteme, tehnologiile Big Data și procesarea limbajului natural sunt utilizate pentru a citi și a evalua răspunsurile consumatorilor.

    • Identificarea timpurie a riscului pentru produs / servicii, dacă există
    • Eficiență operațională mai bună

Tehnologiile Big Data pot fi utilizate pentru crearea unei zone de staționare sau a unei zone de aterizare pentru date noi înainte de a identifica ce date ar trebui mutate în depozitul de date. În plus, o astfel de integrare a tehnologiilor Big Data și a depozitului de date ajută o organizație să descarce datele accesate rar.

rezumat

  • Definiție Big Data: Big Data este definită ca date de dimensiuni uriașe. Bigdata este un termen folosit pentru a descrie o colecție de date de dimensiuni uriașe și totuși în creștere exponențială cu timpul.
  • Exemplele de analiză Big Data includ bursele de valori, site-urile de socializare, motoarele cu reacție etc.
  • Big Data ar putea fi 1) Structurat, 2) Nestructurat, 3) Semi-structurat
  • Volumul, varietatea, viteza și variabilitatea sunt câteva caracteristici Big Data
  • Serviciul pentru clienți îmbunătățit, o eficiență operațională mai bună, luarea mai bună a deciziilor sunt câteva avantaje ale Bigdata