Arhitectură SAP HANA, LandScape, dimensionare: Tutorial complet

Baza de date SAP HANA este platforma de gestionare a datelor centrată pe memoria principală. Baza de date SAP HANA rulează pe SUSE Linux Enterprises Server și se bazează pe limbajul C ++.

Baza de date SAP HANA poate fi distribuită la mai multe mașini.

Avantajele SAP HANA sunt cele menționate mai jos -

SAP HANA este util deoarece este foarte rapid datorită tuturor datelor încărcate în memorie și nu este nevoie să încărcați date de pe disc.
SAP HANA poate fi utilizat în scopul OLAP (analize on-line) și OLTP (tranzacții on-line) pe o singură bază de date.

Baza de date SAP HANA constă dintr-un set de motoare de procesare în memorie. Motorul de calcul este principalele motoare de procesare în memorie în SAP HANA. Funcționează cu alte motoare de procesare, cum ar fi Motorul bazei de date relaționale (motorul rând și coloană), motorul OLAP etc.

Tabelul bazei de date relaționale se află în depozitul de coloane sau rânduri.

Există două tipuri de stocare pentru tabelul SAP HANA.

Stocare tip rând (Pentru tabelul rândurilor).
Stocare tip coloană (Pentru tabelul coloanelor).

Datele text și datele grafice se află în Text Engine și, respectiv, în Graph Engine. Există mai multe motoare în baza de date SAP HANA. Datele pot fi stocate în aceste motoare atâta timp cât este disponibil suficient spațiu.

În acest tutorial, veți învăța-

Arhitectura SAP HANA
Peisaj SAP HANA
Dimensiunea SAP HANA

Arhitectura SAP HANA

Datele sunt comprimate prin diferite tehnici de compresie (de exemplu, codificarea dicționarului, codificarea lungimii de rulare, codificarea redusă, codificarea clusterelor, codificarea indirectă) în magazinul de coloane SAP HANA.

Când se atinge limita de memorie principală în SAP HANA, toate obiectele bazei de date (tabel, vizualizare etc.) care nu sunt utilizate vor fi descărcate din memoria principală și salvate pe disc.

Aceste nume de obiecte sunt definite de aplicația semantică și reîncărcate în memoria principală de pe disc atunci când este necesar din nou. În circumstanțe normale, baza de date SAP HANA gestionează automat descărcarea și încărcarea datelor.

Cu toate acestea, utilizatorul poate încărca și descărca manual date dintr-un tabel individual selectând un tabel în studioul SAP HANA în Schema respectivă- făcând clic dreapta și selectând opțiunea „Descărcare / Încărcare”.

Serverul SAP HANA este format din

Server index
Server preprocesator
Server de nume
Server de statistici
Motor XS

Server index SAP HANA
Baza de date SAP HANA Serverul principal este server index. Detaliile fiecărui server sunt cele de mai jos-

Este componenta principală a bazei de date SAP HANA
Conține stocuri de date reale și motorul pentru prelucrarea datelor.
Index Server procesează instrucțiunile SQL sau MDX de intrare.

Mai jos este arhitectura Index Server.

Prezentare generală a serverului de index SAP HANA

Manager sesiune și tranzacții: componenta sesiunii gestionează sesiunile și conexiunile pentru baza de date SAP HANA. Managerul de tranzacții coordonează și controlează tranzacțiile.

Procesor SQL și MDX: Componenta procesorului SQL interogă date și le trimite în motorul de procesare a interogărilor, adică SQL / SQL Script / R / Calc Engine. Procesorul MDX interogă și manipulează date multidimensionale (de exemplu, Vizualizare analitică în SAP HANA).

SQL / SQL Script / R / Calc Engine: Această componentă execută scriptul SQL / SQL și conversia datelor de calcul în modelul de calcul.

Depozit: Depozitul menține versiunea obiectului de metadate SAP HANA, de exemplu (Vizualizare atribut, Vizualizare analitică, Procedură stocată).

Stratul de persistență: acest strat folosește caracteristica încorporată „Disaster Recovery” din baza de date SAP HANA. Backup-ul este salvat în acesta ca puncte de salvare în volumul de date.

Server preprocesator

Acest server este utilizat în analiza textului și extrage date dintr-un text atunci când este utilizată funcția de căutare.

Server de nume

Acest server conține toate informațiile despre peisajul sistemului. În serverul distribuit, serverul de nume conține informații despre fiecare componentă care rulează și locația datelor pe server. Acest server conține informații despre serverul pe care există date.

Server Statistic

Serverul statistic este responsabil pentru colectarea datelor legate de stare, alocarea / consumul resurselor și performanța sistemului SAP HANA.

Server XS

XS Server conține XS Engine. Permite aplicațiilor externe și dezvoltatorilor să utilizeze baza de date SAP HANA prin intermediul clientului XS Engine. Aplicația client externă poate utiliza HTTP pentru a transmite date prin intermediul motorului XS pentru serverul HTTP.

Peisaj SAP HANA

„HANA” înseamnă High Performance Analytic Appliance este o combinație de platformă hardware și software.

Datorită schimbării arhitecturii computerului, computerul mai puternic este disponibil în termeni de procesor, memorie RAM și hard disk.
SAP HANA este soluția pentru blocajul de performanță, în care toate datele sunt stocate în memoria principală și nu este nevoie să transferați frecvent date de pe I / O de disc în memoria principală.

Mai jos sunt SAP HANA Innovation în domeniul Hardware / Software.

Există două tipuri de magazine de date relaționale în SAP HANA: Magazin de rânduri și Magazin de coloane.

Magazin Row

Este la fel ca baza de date tradițională, de exemplu (Oracle, SQL Server). Singura diferență este că toate datele sunt stocate în zona de stocare pe rând în memoria SAP HANA, spre deosebire de o bază de date tradițională, unde datele sunt stocate pe hard disk.

Magazin de coloane

Stocarea coloanelor este partea din baza de date SAP HANA și gestionează datele în mod coloane în memoria SAP HANA. Tabelele de coloane sunt stocate în zona de stocare a coloanelor. Magazinul de coloane oferă performanțe bune pentru operațiile de scriere și, în același timp, optimizează operația de citire.

Citiți și scrieți performanța operației optimizată cu o structură de date de mai jos de două.

Depozitare principală

Stocarea principală conține partea principală a datelor. În stocarea principală, se aplică o metodă adecvată de compresie a datelor (codificare dicționar, codificare cluster, codificare spartă, codificare lungime rulare etc.) pentru comprimarea datelor cu scopul de a economisi memoria și a accelera căutările.

În stocarea principală, operațiile de scriere pe date comprimate vor fi costisitoare, astfel încât operațiunea de scriere nu modifică direct datele comprimate în stocarea principală. În schimb, toate modificările sunt scrise într-o zonă separată din stocarea coloanelor cunoscută sub numele de „Delta Storage”.
Stocarea Delta este optimizată pentru o operație de scriere și utilizează compresie normală. Operațiile de scriere nu sunt permise pe stocarea principală, dar sunt permise pe stocarea delta. Operațiile de citire sunt permise pe ambele depozite.

Putem încărca manual datele în memoria principală prin opțiunea „Încărcare în memorie” și descărcați datele din memoria principală prin opțiunea „Descărcați din memorie”, așa cum se arată mai jos.

Depozitare Delta

Depozitarea Delta este utilizată pentru o operație de scriere și utilizează compresia de bază. Toate modificările necomandate în datele tabelului de coloane stocate în stocarea delta.

Când vrem să mutăm aceste modificări în stocarea principală, atunci utilizăm „operațiunea de delega fusion” din studioul SAP HANA după cum urmează -

Scopul operației de combinare delta este de a muta modificările, care sunt colectate în stocarea delta în stocarea principală.
După efectuarea operației Delta Merge pe tabelul coloanei SAP, conținutul stocării principale este salvat pe disc și recalcularea compresiei.

Procesul de mutare a datelor din Delta în stocarea principală în timpul combinării delta

Există un magazin tampon (L1-Delta), care este stocarea pe rând. Deci, în SAP HANA, tabelul de coloane acționează ca un magazin de rânduri datorită L1-delta.

Utilizatorul execută o interogare de actualizare / inserare pe tabel (Physical Operator este instrucțiuni SQL).
Datele merg mai întâi la L1. Când L1 mută datele în continuare (L1- Date necompromise)
Apoi, datele se îndreaptă către bufferul L2-delta, care este orientat pe coloane. (L2- Date angajate)
Când procesul L2-delta este finalizat, datele merg în stocarea principală.

Deci, stocarea coloanei este optimizată la scriere și optimizată la citire datorită L1-Delta și, respectiv, stocării principale. L1-Delta conține toate datele neacceptate. Datele angajate se mută în Magazinul principal prin L2-Delta. Datele din magazinul principal merg la stratul de persistență (Săgeata care indică aici este un operator fizic care trimite declarația SQL în Magazinul de coloane). După Procesarea Instrucțiunii SQL în depozitul de coloane, datele trec la stratul de persistență.

De exemplu, mai jos este tabelul pe rânduri

Datele din tabel sunt stocate pe disc în format liniar, deci mai jos este formatat modul în care datele sunt stocate pe disc pentru tabelul de rânduri și coloane -

În memoria SAP HANA, acest tabel este stocat în Row Store pe disc ca format -

Adresa de memorie

Și în Coloană, datele sunt stocate pe disc ca -

Adresa de memorie

Datele sunt stocate în coloane în format liniar pe disc. Datele pot fi comprimate prin tehnica comprimării.

Deci, magazinul de coloane are avantajul economisirii memoriei.

Dimensiunea SAP HANA

Dimensionarea este un termen care este utilizat pentru a determina cerințele hardware pentru sistemul SAP HANA, cum ar fi RAM, hard disk și CPU etc.

Principala componentă importantă de dimensionare este memoria, iar a doua componentă importantă de dimensionare este CPU. A treia componentă principală este un disc, dar dimensionarea este complet dependentă de memorie și CPU.

În implementarea SAP HANA, una dintre sarcinile critice este de a determina dimensiunea corectă a unui server în funcție de cerințele afacerii.

SAP HANA DB diferă în ceea ce privește dimensionarea cu DBMS normal în ceea ce privește -

Cerința principală de memorie pentru SAP HANA (dimensionarea memoriei este determinată de metadate și date de tranzacție în SAP HANA)
Cerința procesorului pentru SAP HANA (CPU estimat este estimat că nu este corect).
Cerință de spațiu pe disc pentru SAP HANA (este calculată pentru persistența datelor și pentru înregistrarea datelor)

CPU server de aplicații și memoria serverului de aplicații rămân neschimbate.

Pentru calculul dimensionării, SAP a furnizat diverse linii directoare și metode pentru a calcula dimensiunea corectă.

Putem folosi mai jos metoda-