Top 30 de întrebări pentru interviu Hbase & Răspunsuri

Anonim

Descărcați PDF

Următoarele sunt întrebările frecvente din interviurile pentru perfecționari, precum și dezvoltatorul HBase cu experiență.

1) Explicați ce este Hbase?

Hbase este un sistem de gestionare a bazelor de date orientat pe coloane, care rulează pe HDFS (Hadoop Distribute File System). Hbase nu este un depozit de date relațional și nu acceptă limbajul de interogare structurat, cum ar fi SQL.

În Hbase, un nod master reglează serverele cluster și regiune pentru a stoca porțiuni din tabele și operează activitatea pe date.

2) Explicați de ce să utilizați Hbase?

  • Sistem de stocare de mare capacitate
  • Design distribuit pentru a satisface mesele mari
  • Magazine orientate pe coloane
  • Scalabil orizontal
  • Performanță ridicată și disponibilitate
  • Obiectivul de bază al Hbase este de milioane de coloane, mii de versiuni și miliarde de rânduri
  • Spre deosebire de HDFS (Hadoop Distribute File System), acesta acceptă operații CRUD aleatorii în timp real

3) Menționează care sunt componentele cheie ale Hbase?

  • Zookeeper: Realizează activitatea de coordonare între client și Hbase Maser
  • Hbase Master: Hbase Master monitorizează serverul de regiune
  • RegionServer: RegionServer monitorizează regiunea
  • Regiune: Conține în memoria de stocare a datelor (MemStore) și Hfile.
  • Tabelele de catalog: Tabelele de catalog constau din ROOT și META

4) Explicați în ce constă Hbase?

  • Hbase constă dintr-un set de tabele
  • Și fiecare tabel conține rânduri și coloane precum baza de date tradițională
  • Fiecare tabel trebuie să conțină un element definit ca o cheie primară
  • Coloana Hbase denotă un atribut al unui obiect

5) Menționează câte comenzi operaționale din Hbase?

Comanda operațională în Hbases este de aproximativ cinci tipuri

  • obține
  • A pune
  • Șterge
  • Scanează
  • Creştere

6) Explicați ce este WAL și Hlog în Hbase?

WAL (Write Ahead Log) este similar cu jurnalul MySQL BIN; înregistrează toate modificările care apar în date. Este un fișier de secvență standard de Hadoop și stochează HLogkey's. Aceste chei constau dintr-un număr secvențial, precum și date reale și sunt folosite pentru a reda date care nu au persistat încă după un blocaj de server. Deci, în numerar în caz de eșec al serverului, WAL funcționează ca o linie de viață și recuperează datele pierdute.

7) Când ar trebui să utilizați Hbase?

  • Dimensiunea datelor este imensă: când aveți de operat tone și milioane de înregistrări
  • Redesign complet: Când mutați RDBMS pe Hbase, îl considerați ca o reproiectare completă, apoi doar schimbarea porturilor
  • Comenzi SQL-Less: aveți mai multe caracteristici, cum ar fi tranzacțiile; îmbinări interioare, coloane tastate etc.
  • Investiții în infrastructură: trebuie să aveți suficient cluster pentru ca Hbase să fie cu adevărat util

8) În Hbase ce este familiile de coloane?

Familiile de coloane cuprind unitatea de bază de stocare fizică în Hbase la care se aplică caracteristici precum compresiile.

9) Explicați care este cheia rândului?

Tasta rând este definită de aplicație. Deoarece cheia combinată este prestabilită de cheia rând, aceasta permite aplicației să definească ordinea de sortare dorită. De asemenea, permite gruparea logică a celulelor și asigurați-vă că toate celulele cu aceeași cheie de rând sunt co-localizate pe același server.

10) Explicați ștergerea în Hbase? Menționează care sunt cele trei tipuri de markeri de piatră funerară din Hbase?

Când ștergeți celula din Hbase, datele nu sunt de fapt șterse, dar este setat un marcator de piatră funerară, ceea ce face ca celulele șterse să fie invizibile. Hbase șterse sunt de fapt eliminate în timpul compactărilor.

Există trei tipuri de markeri de piatră funerară:

  • Marker ștergere versiune: pentru ștergere, marchează o singură versiune a unei coloane
  • Marcaj ștergere coloană: pentru ștergere, marchează toate versiunile unei coloane
  • Marker de ștergere a familiei: pentru ștergere, marchează toate coloanele pentru o familie de coloane

11) Explicați cum șterge Hbase de fapt un rând?

În Hbase, orice scrieți va fi stocat de pe memorie RAM pe disc, aceste scrieri pe disc sunt compactabile imuabile. În timpul procesului de ștergere în Hbase, procesul de compactare major șterge markerul, în timp ce compacțiile minore nu. În cazul ștergerilor normale, rezultă un marker de ștergere a pietrei funerare - aceste date de ștergere pe care le reprezintă sunt eliminate în timpul compactării.

De asemenea, dacă ștergeți date și adăugați mai multe date, dar cu un timestamp mai devreme decât timestamp-ul, este posibil ca Gets ulterioare să fie mascate de markerul de ștergere / tombstone și, prin urmare, nu veți primi valoarea inserată decât după compactarea majoră.

12) Explicați ce se întâmplă dacă modificați dimensiunea blocului unei familii de coloane pe o bază de date deja ocupată?

Când modificați dimensiunea blocului familiei de coloane, noile date ocupă noua dimensiune a blocului, în timp ce datele vechi rămân în dimensiunea blocului vechi. În timpul compactării datelor, datele vechi vor lua noua dimensiune a blocului. Fișierele noi pe măsură ce sunt spălate, au o nouă dimensiune de bloc, în timp ce datele existente vor continua să fie citite corect. Toate datele ar trebui transformate la noua dimensiune a blocului, după următoarea compactare majoră.

13) Menționează diferența dintre Hbase și baza de date relațională?

Hbase Baza de date relațională
  • Este fără schemă
  • Este un magazin de date orientat pe coloane
  • Este folosit pentru a stoca date de-normalizate
  • Conține tabele slab populate
  • Partiționarea automată se face în Hbase
  • Este o bază de date bazată pe schemă
  • Este un magazin de date orientat pe rând
  • Este folosit pentru a stoca date normalizate
  • Conține mese subțiri
  • Nu există o astfel de prevedere sau suport încorporat pentru partiționare

14) Ce este clasa HBaseFsck?

Există un nume de instrument numit înapoi, disponibil în HBase, care este implementat de clasa HBaseFsck. Oferă mai multe comutatoare de linie de comandă care îi influențează comportamentul.

15) Care sunt principalele structuri cheie ale HBase?

Cheia rând și cheia coloană sunt cele mai importante două structuri cheie folosite în HBase

16) Discutați despre modul în care puteți utiliza filtrele în Apache HBase

Filtre în HBase Shell. A fost introdus în Apache HBase 0.92, care vă ajută să efectuați filtrarea de pe server pentru accesarea HBase prin shell HBase sau economisire.

17) HBase suportă structura de sintaxă, cum ar fi SQL da sau nu?

Nu, din păcate, suportul SQL pentru HBase nu este disponibil momentan. Cu toate acestea, folosind Apache Phoenix, putem prelua date din HBase prin interogări SQL.

18) Care este semnificația compactării în HBase?

În momentul scrierilor grele de intrare, este imposibil să se obțină performanțe optime având un fișier per magazin. HBase vă ajută să combinați toate aceste fișiere HF pentru a reduce numărul de semințe de disc pentru fiecare citire. Acest proces este cunoscut sub numele de Compactare în HBase.

19) Cum veți implementa asocierile în HBase?

HBase, nu acceptă asocierile direct, dar folosește joburile MapReduce, interogările de asociere pot fi implementate prin recuperarea datelor cu ajutorul diferitelor tabele HBase.

20) Explicați JMX cu privire la HBSE

Java Management Extensions sau JMX este o stare de export a aplicațiilor Java este standardul pentru acestea.

21) La ce folosește MasterServer?

Master sever vă ajută să atribuiți o regiune și serverului de regiune. De asemenea, vă ajută să gestionați echilibrarea încărcării pe care o utilizăm MasterServer.

22) Definiți termenul de economisire

Apache Thrift este scris în C ++. Oferă compilatoare de scheme pentru diverse limbaje de programare precum C ++, Perl, PHP, Python, Ruby și multe altele.

23) De ce să folosim clasa HColumnDescriptor?

Detaliile referitoare la familia de coloane, cum ar fi setările de compresie, numărul de versiuni, sunt stocate în HColumnDescriptor.

24) Ce este o celulă în HBase?

O celulă din HBase este cea mai mică unitate a unui tabel Hbase. Vă ajută să păstrați o bucată de date sub forma unui tuplu {rând, coloană, versiune}

25) Ce este un filtru Bloom?

HBase acceptă Bloom Filter vă ajută să îmbunătățiți randamentul general al clusterului. Un filtru HBase Bloom este un mecanism eficient din punct de vedere spațial pentru a testa dacă un fișier H include anumite rânduri sau celule rând-col.

26) Spuneți-mi despre tipurile de operații HBase?

Răspuns. Două tipuri de operații HBase sunt:

  • Citiți Operațiunea
  • Operațiune de scriere

27) La ce folosește HBase HMaster?

Principalele responsabilități ale unui maestru sunt:

  1. Coordonarea serverelor de regiune
  2. Funcții de administrare

28) Ce tehnică puteți utiliza în HBase pentru a accesa HFile direct fără ajutorul HBase?

Pentru a accesa HFile direct fără a utiliza HBase, folosim metoda HFile.main ().

29) Serverul de regiune poate fi localizat pe toate DataNodes?

Da, serverele de regiune rulează pe aceleași servere ca un DataNodes

30) Denumiți filtrul care acceptă dimensiunea paginii ca parametru în HBase

Un filtru numit PageFilter acceptă dimensiunea paginii ca parametru.

Acest document a fost compus cu instrumentele instantanee de conversie HTML.