Operațiile de tabel, cum ar fi tabelele de creare, modificare și eliminare în Hive, pot fi observate în acest tutorial.
În imaginea de mai jos, creăm un tabel cu coloane și modificăm numele tabelului.
1. Crearea tabelului guru_sample cu două nume de coloane precum „empid” și „empname”
2. Afișarea tabelelor prezente în baza de date guru99
3. Guru_sample afișare sub tabele
4. Modificarea tabelului "guru_sample" ca "guru_sampleNew"
5. Din nou, când executați comanda „show”, acesta va afișa noul nume Guru_sampleNew
Dropping table guru_sampleNew:
Tipuri de tabel și utilizarea acestuia:
Venirea la tabele este la fel ca modul în care creăm în bazele de date relaționale tradiționale. Funcționalitățile precum filtrarea, îmbinările pot fi realizate pe tabele.
Hive se ocupă de două tipuri de structuri de tabel, cum ar fi tabelele interne și externe , în funcție de încărcarea și proiectarea schemei în Hive.
Mese interne
- Tabelul intern este strâns cuplat în natură. În acest tip de tabel, mai întâi trebuie să creăm tabelul și să încărcăm datele.
- Îl putem numi ca date despre schemă .
- Prin eliminarea acestui tabel, atât datele, cât și schema vor fi eliminate.
- Locația stocată a acestui tabel va fi la / utilizator / stup / depozit.
Când alegeți tabelul intern:
- Dacă datele de procesare disponibile în sistemul de fișiere local
- Dacă dorim ca Hive să gestioneze ciclul de viață complet al datelor, inclusiv ștergerea
Exemplu de fragment de cod pentru tabelul intern
1. Pentru a crea tabelul intern
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Încărcați datele în tabelul intern
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Afișați conținutul tabelului
Hive>select * from guruhive_internaltable;
4. Pentru a renunța la tabelul intern
Hive>DROP TABLE guruhive_internaltable;
Dacă ați eliminat guruhive_internaltable, inclusiv metadatele sale și datele sale vor fi șterse din Hive.
Din următoarea captură de ecran, putem observa ieșirea
În codul de mai sus și din captura de ecran, urmăm lucrurile,
- Creați tabelul intern
- Încărcați datele în tabelul intern
- Afișați conținutul tabelului
- Pentru a renunța la tabelul intern
Tabelele externe
- Tabelul extern este cuplat în natură. Datele vor fi disponibile în HDFS. Tabelul va fi creat pe date HDFS.
- Într-un alt mod, putem spune ca crearea unei scheme pentru date .
- În momentul scăderii tabelului, scade doar schema, datele vor fi încă disponibile în HDFS ca înainte.
- Tabelele externe oferă o opțiune pentru a crea mai multe scheme pentru datele stocate în HDFS în loc să ștergeți datele de fiecare dată când se actualizează schema
Când alegeți tabelul extern:
- Dacă prelucrarea datelor este disponibilă în HDFS
- Util când fișierele sunt utilizate în afara Hive
Exemplu de fragment de cod pentru tabel extern
1. Creați tabel extern
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Dacă nu specificăm locația în momentul creării tabelului, putem încărca datele manual
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Afișați conținutul tabelului
Hive>select * from guruhive_external;
4. Pentru a renunța la tabelul intern
Hive>DROP TABLE guruhive_external;
Din următoarea captură de ecran, putem observa ieșirea
În codul de mai sus, urmăm lucrurile
- Creați tabelul extern
- Încărcați datele în tabelul extern
- Afișați conținutul tabelului
- Cadere tabel extern
Diferența dintre tabelele interne Vs externe
Caracteristică | Intern | Extern |
---|---|---|
Schemă | Date despre schemă | Schema privind datele |
Locație de stocare | / usr / stup / depozit | Locație HDFS |
Disponibilitatea datelor | În cadrul sistemului de fișiere local | În cadrul HDFS |