Ce este schema multidimensională?
Schema multidimensională este special concepută pentru modelarea sistemelor de depozitare a datelor. Schemele sunt concepute pentru a răspunde nevoilor unice ale bazelor de date foarte mari proiectate în scop analitic (OLAP).
Tipuri de schemă de depozit de date:
Următoarele sunt 3 tipuri principale de scheme multidimensionale, fiecare având avantajele sale unice.
- Schema stelelor
- Schema fulgului de zăpadă
- Schema Galaxy
În acest tutorial, veți afla mai multe despre-
- Ce este o schemă stelară?
- Ce este o schemă de fulgi de zăpadă?
- Schema stelelor vs schema fulgului de zăpadă: diferențele cheie
- Ce este o schemă Galaxy?
- Ce este schema clusterului stelar?
Ce este o schemă stelară?
Schema de stele în depozitul de date, în care centrul stelei poate avea un tabel de date și un număr de tabele de dimensiuni asociate. Este cunoscut sub numele de schemă stelară, deoarece structura sa seamănă cu o stea. Modelul de date Star Schema este cel mai simplu tip de schemă Data Warehouse. Este, de asemenea, cunoscut sub numele de Star Join Schema și este optimizat pentru interogarea seturilor mari de date.
În următorul exemplu de schemă stelară, tabelul de informații se află în centru, care conține chei pentru fiecare tabel de dimensiuni, cum ar fi Dealer_ID, ID model, Date_ID, Product_ID, Branch_ID și alte atribute precum Unități vândute și venituri.
Caracteristicile schemei stelare:
- Fiecare dimensiune dintr-o schemă stelară este reprezentată cu singurul tabel cu o singură dimensiune.
- Tabelul de dimensiuni ar trebui să conțină setul de atribute.
- Tabelul de dimensiuni este unit cu tabelul de date folosind o cheie străină
- Tabelul de dimensiuni nu este unit unul cu celălalt
- Tabelul de date ar conține cheia și măsura
- Schema Star este ușor de înțeles și oferă o utilizare optimă a discului.
- Tabelele de dimensiuni nu sunt normalizate. De exemplu, în figura de mai sus, Country_ID nu are tabel de căutare Country, așa cum ar avea un design OLTP.
- Schema este susținută pe scară largă de BI Tools
Ce este o schemă de fulgi de zăpadă?
Schema fulgului de zăpadă în depozitul de date este o aranjare logică a tabelelor într-o bază de date multidimensională astfel încât diagrama ER să semene cu o formă de fulgi de zăpadă. O schemă de fulgi de zăpadă este o extensie a unei scheme de stele și adaugă dimensiuni suplimentare. Tabelele de dimensiuni sunt normalizate, ceea ce împarte datele în tabele suplimentare.
În următorul exemplu de schemă de fulgi de zăpadă, Țara este normalizată în continuare într-un tabel individual.
Caracteristicile schemei fulg de zăpadă:
- Principalul beneficiu al schemei fulgi de zăpadă este că folosește spațiu mai mic pe disc.
- Mai ușor de implementat o dimensiune este adăugată la schemă
- Datorită mai multor tabele, performanța interogării este redusă
- Principala provocare cu care vă veți confrunta în timp ce utilizați schema fulgului de zăpadă este că trebuie să efectuați mai multe eforturi de întreținere din cauza mai multor tabele de căutare.
Schema stelelor vs schema fulgului de zăpadă: diferențele cheie
Următoarea este o diferență cheie între Schema stelelor și schema fulgului de zăpadă:
Schema stelelor | Schema fulgului de zăpadă |
---|---|
Ierarhiile pentru dimensiuni sunt stocate în tabelul dimensional. | Ierarhiile sunt împărțite în tabele separate. |
Conține un tabel de date înconjurat de tabele de dimensiuni. | Un tabel de fapt înconjurat de tabelul de dimensiuni, care sunt la rândul lor înconjurat de tabelul de dimensiuni |
Într-o schemă stelară, numai unirea unică creează relația dintre tabelul de fapte și orice tabele de dimensiuni. | O schemă de fulgi de zăpadă necesită multe îmbinări pentru a prelua datele. |
Design simplu DB. | Proiectare DB foarte complexă. |
Structura și interogarea datelor denormalizate rulează, de asemenea, mai repede. | Structura de date normalizată. |
Nivel ridicat de redundanță a datelor | Redundanță de date la nivel foarte scăzut |
Tabelul cu dimensiuni unice conține date agregate. | Datele împărțite în diferite tabele de dimensiuni. |
Procesarea cubului este mai rapidă. | Procesarea cubului poate fi lentă din cauza îmbinării complexe. |
Oferă interogări cu performanțe superioare utilizând Optimizarea interogării Star Join. Mesele pot fi conectate cu mai multe dimensiuni. | Schema fulgului de zăpadă este reprezentată de un tabel de fapte centralizat, care este puțin probabil conectat cu mai multe dimensiuni. |
Ce este o schemă Galaxy?
O schemă Galaxy conține două tabele de fapt care împart tabele de dimensiuni între ele. Se mai numește Schema de constelație a faptelor. Schema este privită ca o colecție de stele, de unde și numele Galaxy Schema.
După cum puteți vedea în exemplul de mai sus, există două tabele de fapte
- Venituri
- Produs.
În dimensiunea partajării schemei Galaxy se numesc dimensiuni conforme.
Caracteristicile schemei Galaxy:
- Dimensiunile din această schemă sunt separate în dimensiuni separate pe baza diferitelor niveluri ale ierarhiei.
- De exemplu, dacă geografia are patru niveluri de ierarhie, cum ar fi regiunea, țara, statul și orașul, schema Galaxy ar trebui să aibă patru dimensiuni.
- Mai mult, este posibil să se construiască acest tip de schemă prin împărțirea schemei de o stea în mai multe scheme de stele.
- Dimensiunile sunt mari în această schemă, care este necesară pentru a construi pe baza nivelurilor de ierarhie.
- Această schemă este utilă pentru agregarea tabelelor de date pentru o mai bună înțelegere.
Ce este schema clusterului stelar?
Schema fulgului de zăpadă conține ierarhii complet extinse. Cu toate acestea, acest lucru poate adăuga complexitate schemei și necesită îmbinări suplimentare. Pe de altă parte, schema stelară conține ierarhii complet prăbușite, ceea ce poate duce la redundanță. Așadar, cea mai bună soluție poate fi un echilibru între aceste două scheme, care este designul Star Cluster Schema.
Dimensiunile suprapuse pot fi găsite ca furculițe în ierarhii. Un fork se întâmplă atunci când o entitate acționează ca părinte în două ierarhii dimensionale diferite. Entitățile furculiței au fost identificate apoi ca clasificare cu relații unu-la-mai multe.
Rezumat:
- Schema multidimensională este special concepută pentru modelarea sistemelor de depozitare a datelor
- Schema stea este cel mai simplu tip de schemă Data Warehouse. Este cunoscut sub numele de schemă stelară, deoarece structura sa seamănă cu o stea.
- O schemă de fulgi de zăpadă este o extensie a unei scheme de stele și adaugă dimensiuni suplimentare. Se numește fulg de zăpadă, deoarece diagrama sa seamănă cu un fulg de zăpadă.
- Într-o schemă stelară, numai unirea simplă definește relația dintre tabelul de fapt și orice tabel de dimensiuni.
- Schema stelelor conține un tabel de date înconjurat de tabele de dimensiuni.
- Schema fulgului de zăpadă este înconjurată de tabelul de dimensiuni, care, la rândul său, este înconjurat de tabelul de dimensiuni
- O schemă de fulgi de zăpadă necesită multe îmbinări pentru a prelua datele.
- O schemă Galaxy conține două tabele de fapt care partajează tabele de dimensiuni. Se mai numește Schema de constelație a faptelor.
- Schema clusterului stelar conține atribute ale schemei Star și fulg de zăpadă.