Top 50 de întrebări despre interviu Teradata & Răspunsuri

Anonim

Descărcați PDF

1) Cum definiți Teradata? Oferiți câteva dintre caracteristicile principale ale aceluiași.

Teradata este practic un RDMS care este utilizat pentru a conduce Datamart, Datawarehouse, OLAP, OLTP, precum și DSS Appliances ale companiei. Unele dintre caracteristicile principale ale Teradatei sunt prezentate mai jos.

  • Este capabil să ruleze pe noduri unice, precum și pe mai multe noduri.
  • Paralelismul este integrat în sistem.
  • Foarte compatibil cu standardele ANSI.
  • Tinde să acționeze în același mod ca un server.
  • Este un sistem deschis care se execută practic pentru UNIX MR-RAS, Suse Linux ETC, WIN2K etc.

2) Care sunt caracteristicile nou dezvoltate ale Teradata?

Unele dintre caracteristicile nou dezvoltate ale Teradata sunt: ​​-

  • Analize temporale automate
  • Extinderea capacităților de compresie care permite compresia flexibilă a datelor de aproximativ 20 de ori mai multe date decât versiunea precedentă.
  • Inovație asociată clientului, cum ar fi punctul de vedere al tetradatei.

3) Evidențiați câteva dintre componentele importante ale Teradatei.

Unele dintre componentele importante ale Teradata sunt: ​​-

  • Bynet
  • Procesor modul de acces (AMP)
  • Motor de analiză (PE)
  • Discul virtual (vDisk)
  • Sistem de stocare virtuală (VSS)

4) Menționați procedura prin care putem rula joburi Teradata într-un mediu UNIX.

Tot ce trebuie să faceți este să executați execuția în UNIX în modul menționat mai jos.

$ Sh> BTEQ <[Cale cale]> [Cale fișier jurnal]

sau

$ Sh> BTEQ <[Script Path] TEE [Logfile Path]

5) În Teradata, cum generăm secvența?

În Teradata, generăm secvență utilizând coloana de identitate

6) În timpul afișării, cum este secvența generată de Teradata?

Tot ce trebuie să faceți este să utilizați CSUM.

7) O anumită sarcină este impusă pe masă și și asta, la fiecare oră. Traficul dimineața este relativ redus, iar cel al nopții este foarte mare. Conform acestei situații, care este cel mai recomandat utilitar și cum se presupune că acesta trebuie încărcat?

Cea mai sugerabilă utilitate aici trebuie să fie Tpump. Folosind dimensiunea pachetului în scădere sau în creștere, traficul poate fi ușor gestionat.

8) Dacă Fast Load Script nu reușește și numai tabelele de erori vă sunt puse la dispoziție, atunci cum veți reporni?

În principiu, există două modalități de repornire în acest caz.

  • Executarea vechiului fișier - Asigurați-vă că nu eliminați complet tabelele de erori. În schimb, încercați să corectați erorile prezente în script sau fișier și apoi executați din nou.
  • Rularea unui fișier nou - În acest proces, scriptul este executat pur și simplu folosind instrucțiunile de încărcare finală și de început. Acest lucru va ajuta la eliminarea blocării care a fost pusă pe tabela țintă și ar putea elimina, de asemenea, înregistrarea dată din tabelul de înregistrare rapidă. După ce ați făcut acest lucru, sunteți liber să rulați din nou întregul script.

9) Menționați câteva dintre instrumentele ETL care intră sub Teradata.

Unele dintre instrumentele ETL care sunt utilizate în mod obișnuit în Teradata sunt DataStage, Informatica, SSIS etc.

10) Evidențiați câteva dintre avantajele pe care le au instrumentele ETL față de TD.

Unele dintre avantajele pe care le au instrumentele ETL față de TD sunt: ​​-

  • Pot fi exploatate mai multe destinații eterogene, precum și surse.
  • Procesul de depanare este mult mai ușor cu ajutorul instrumentelor ETL datorită suportului GUI complet.
  • Componentele instrumentelor ETL pot fi reutilizate cu ușurință și, ca rezultat, dacă există o actualizare a serverului principal, atunci toate aplicațiile corespunzătoare conectate la server sunt actualizate automat.
  • De-pivotarea și pivotarea se pot face cu ușurință folosind instrumente ETL.

11) Care este semnificația cache-ului în Teradata?

Caching-ul este considerat un avantaj suplimentar al utilizării Teradata, deoarece funcționează în primul rând cu sursa care rămâne în aceeași ordine, adică nu se modifică frecvent. Uneori, memoria cache este de obicei partajată între aplicații.

12) Cum putem verifica versiunea Teradata pe care o folosim în prezent?

Doar dați comanda .VERSIUNEA SHOW.

13) Oferiți un motiv justificat pentru care încărcarea multiplă acceptă NUSI în loc de USI.

Rândul sub-tabel index se întâmplă să fie pe același amplificator în același mod ca rândul de date din NUSI. Astfel, fiecare amplificator este operat separat și în mod paralel.

14) Cum este repornit sistemul client MLOAD după executare?

Scriptul trebuie să fie trimis manual, astfel încât să poată încărca cu ușurință datele de la punctul de control care vine ultimul.

15) Cum este repornit MLOAD Teradata Server după executare?

Procesul se desfășoară practic de la ultimul punct de control cunoscut și, odată ce datele au fost efectuate după executarea scriptului MLOAD, serverul este repornit.

16) Ce se înțelege prin nod?

Un nod este denumit practic un asortiment de componente hardware și software. De obicei, un server este denumit nod.

17) Să spunem că există un fișier care constă din 100 de înregistrări din care trebuie să omitem prima și ultimele 20 de înregistrări. Ce va fi fragmentul de cod?

Pentru a realiza această sarcină, trebuie să folosim utilitarul BTEQ. Skip 20, precum și Repeat 60 vor fi utilizate în script.

18) Explicați PDE.

PDE reprezintă, în principiu, Parallel Data Extension. PDE se întâmplă practic să fie un strat de interfață de software prezent deasupra sistemului de operare și oferă bazei de date șansa de a opera într-un mediu paralel.

19) Ce este TPD?

TPD reprezintă, în principiu, Trusted Parallel Database și funcționează practic sub PDE. Teradata se întâmplă să fie o bază de date care funcționează în principal sub PDE. Acesta este motivul pentru care Teradata este denumită de obicei Trusted Parallel sau Pure Parallel database.

20) Ce se înțelege prin un driver de canal?

Un driver de canal este un software care acționează ca un mijloc de comunicare între PE și toate aplicațiile care rulează pe canale atașate clienților.

21) Ce se înțelege prin Teradata Gateway?

La fel ca driverul de canal, Teradata Gateway acționează ca un mijloc de comunicare între Parse Engine și aplicațiile atașate clienților de rețea. Este atribuit un singur Gateway pentru fiecare nod.

22) Ce se înțelege prin disc virtual?

Discul virtual este practic o compilație dintr-o întreagă gamă de cilindri care sunt discuri fizice. Uneori este denumită matrice de discuri.

23) Explicați semnificația Amp?

Amp reprezintă, în principiu, Access Module Processor și se întâmplă să fie un procesor care funcționează practic și este utilizat în principiu pentru gestionarea unei singure porțiuni din baza de date. Această parte specială a bazei de date nu poate fi partajată de niciun alt amplificator. Astfel, această formă de arhitectură este denumită în mod obișnuit arhitectură fără nimic partajat.

24) Ce conține Amp și care sunt toate operațiunile pe care le efectuează?

Amp constă în principiu dintr-un subsistem Manager de baze de date și este capabil să efectueze operațiunile menționate mai jos.

  • Efectuarea DML
  • Efectuarea DDL
  • Implementarea agregărilor și alăturărilor.
  • Eliberarea și aplicarea încuietorilor etc.

25) Ce se înțelege prin motor de analiză?

PE se întâmplă să fie un Vproc bun. Funcția sa principală este de a lua cereri SQL și de a furniza răspunsuri în SQL. Acesta constă dintr-o gamă largă de componente software care sunt folosite pentru a împărți SQL în mai mulți pași și apoi pentru a trimite acei pași către AMP-uri.

26) Ce vrei să spui prin analiză?

Analiza este un proces care se referă la analiza simbolurilor șirurilor care sunt fie în limbajul computerului, fie în limbajul natural.

27) Care sunt funcțiile unui analizor?

Un analizor: -

  • Verifică erorile semantice
  • Verifică erorile sintactice
  • Verifică existența obiectului

28) Ce se înțelege prin dispecer?

Dispecerul ia o întreagă colecție de cereri și apoi le păstrează stocate într-o coadă. Aceeași coadă este păstrată pe tot parcursul procesului pentru a furniza mai multe seturi de răspunsuri.

29) Câte sesiuni de MAX este capabil să gestioneze PE într-un anumit moment?

PE poate gestiona un total de 120 de sesiuni într-un anumit moment.

30) Explicați BYNET.

BYNET servește practic ca mijloc de comunicare între componente. Este responsabil în primul rând de trimiterea mesajelor și, de asemenea, de efectuarea fuziunii, precum și de operațiile de sortare.

31) Ce se înțelege prin Clique?

Un Clique este practic cunoscut ca fiind un sortiment de noduri care este partajat între unitățile de disc comune. Prezența Clique este extrem de importantă, deoarece ajută la evitarea eșecurilor nodurilor.

32) Ce se întâmplă atunci când un nod suferă o cădere?

Ori de câte ori există o scădere a nivelului de performanță al unui nod, toate Vprocs-urile corespunzătoare migrează imediat la un nou nod din nodul de eșec pentru a recupera toate datele de pe unitățile comune.

33) Enumerați toate formele de LOCURI disponibile în Teradata.

În principiu, există patru tipuri de LOCURI care intră sub Teradata. Acestea sunt: ​​-

  • Citiți Lock
  • Blocare acces
  • Blocare exclusivă
  • Scrie blocare

34) Care este nivelul special desemnat la care se poate aplica un LOCK în Teradata?

  • Nivel tabel - Toate rândurile care sunt prezente în interiorul unui tabel vor fi cu siguranță blocate.
  • Blocare nivel bază de date - Toate obiectele prezente în baza de date vor fi blocate.
  • Row Hash Level Lock - Se vor bloca numai acele rânduri care corespund rândului respectiv.

35) În Indexul primar, care este scorul AMP-urilor care sunt implicate activ?

Doar un singur AMP este implicat activ într-un index primar.

36) În Teradata, care este semnificația comenzii UPSERT?

UPSERT reprezintă, în principiu, Update Else Insert. Această opțiune este disponibilă numai în Teradata.

37) Evidențiați avantajele PPI (Partition Primary Index).

PPI este utilizat în principiu în scopuri de stocare a datelor bazate pe domenii sau pe categorii. Când vine vorba de interogările Range, nu este nevoie de utilizarea scanării complete a tabelului, deoarece se deplasează imediat la partiția consecventă, omitând astfel toate celelalte partiții.

38) Dați dimensiunile SMALLINT, BYTEINT și INTEGER.

SMALLINT - 2 octeți - 16 mușcături -> -32768 până la 32767

BYTEINT - 1 octeți - 8 biți -> -128 până la 127

INTEGER - 4 octeți - 32 biți -> -2.147.483.648 până la 2.147.483.647

39) Ce se înțelege printr-un plan pentru cel mai mic cost?

Un plan pentru cel mai mic cost se execută practic în mai puțin timp pe cea mai scurtă cale.

40) Evidențiați punctele diferențelor dintre baza de date și utilizatorul din Teradata.

  • O bază de date este practic pasivă, în timp ce un utilizator este activ.
  • O bază de date stochează în principal toate obiectele bazei de date, în timp ce un utilizator poate stoca orice obiect, fie că este vorba despre un macro, tabel, vizualizare etc.
  • Baza de date nu are parolă în timp ce utilizatorul trebuie să introducă parola.

41) Evidențiați diferențele dintre cheia primară și indicele primar.

  • Indicele primar este destul de obligatoriu, în timp ce cheia primară este opțională.
  • Indicele primar are o limită de 64 de tabele / coloane, în timp ce cheia primară nu are nicio limită.
  • Indexul principal permite duplicate și valori nul, în timp ce cheia primară nu.
  • Indicele primar este un mecanism fizic, în timp ce cheia primară este un mecanism pur logic.

42) Explicați cum este utilizat spațiul bobinei.

Spațiul spool în Teradata este utilizat în esență pentru executarea interogărilor. Din spațiul total disponibil în Teradata, 20% din spațiu este alocat practic spațiului de spool.

43) Evidențiați necesitatea reglării performanței.

Reglarea performanței în Teradata se face practic pentru a identifica toate blocajele și apoi pentru a le rezolva.

44) Comentează dacă blocajul este o eroare sau nu.

Din punct de vedere tehnic, blocajul nu este o formă de eroare, dar cu siguranță provoacă o anumită întârziere în sistem.

45) Cum pot fi identificate blocajele?

În principiu, există patru moduri de identificare a unui blocaj. Acestea sunt: ​​-

  • Explicați vizual Teradata
  • Explicați modificarea cererii
  • Manager Teradata
  • Monitor de performanță

46) Ce se înțelege printr-un plan cu cel mai mare cost?

Conform Planului cu cel mai mare cost, timpul necesar pentru executarea procesului este mai mare și necesită cea mai lungă cale disponibilă.

47) Evidențiați toate modurile care sunt prezente sub Nivelul de încredere.

Low, No, High și Join sunt cele patru moduri care sunt prezente sub nivelul de încredere.

48) Numiți cele cinci faze care intră sub utilitatea MultiLoad.

Faza preliminară, faza DML, faza de achiziție a datelor, faza de aplicare și faza finală.

49) Evidențiați limitele TPUMP Utility.

Următoarele sunt limitările utilitarului TPUMP: -

  • Nu putem folosi instrucțiunea SELECT.
  • Fișierele de date nu pot fi concatenate.
  • Operatorii agregați și exponențiali nu sunt acceptați.
  • Funcțiile aritmetice nu pot fi acceptate.

50) În BTEQ, cum sunt setați parametrii modului de sesiune?

.set tranzacție sesiune BTET -> Mod tranzacție Teradata

.set sesiune tranzacție ANSI -> mod ANSI

Aceste comenzi vor funcționa numai atunci când sunt introduse înainte de a vă conecta la sesiune.