- 8th noiembrie 2016
- Posted by: Plaut Romania
- Category: data connection, datawarehouse
Date adunate de marile companii au nevoie de un mediu de stocare în care să poată fi colectate și organizate pentru a le pregăti pentru analizele viitoare. Un astfel de mediu se numește Datawarehouse ( depozit de date), un mediu în care sunt adunate datele din diferitele surse de date ale unei companii. Aceste date pot veni din sistemele tranzacționale, cum ar fi sistemele de marketing, vânzări, CRM și ERP, precum și surse externe, cum ar fi web. Datele sunt astfel stocate încât să poată fi utilizate pentru rapoartele de procesare și pentru a genera analize.
Pe scurt, reprezintă sursa pentru tot ce ar fi nevoie să cunoști despre compania ta.
Stocarea datelor într-un astfel de mediu este critică pentru rularea unui soft BI.
Sursele de date sunt, de obicei, sisteme de tranzacționare, adică sunt proiectate și construite pentru a utiliza datele atunci când se efectuează funcții specifice. Rularea rapoartelor și a analizelor din datele deținute în aceste sisteme tranzacționale ar întrerupe probabil operațiunile lor normale, ceea ce face imposibilă efectuarea analizelor BI și a rulării afacerii în același timp.
Datawarehouses, pe de altă parte, sunt concepute special pentru analize, ceea ce face posibilă utilizarea tuturor înregistrărilor din toate sursele, în același timp, pentru a răspunde la întrebări.
Un alt motiv pentru care datawarehouses sunt necesare este că datele trebuie să fie stocate adesea în moduri diferite pentru tipuri diferite de analize.
O deosebire importantă în modurile în care datele pot fi stocate este diferența dintre o bază de date relaționale și multidimensionale:
- O bază de date relațională poate fi gândită ca folosind o structură cu două dimensiuni. Imaginați-vă o bază de date simplă, cum ar fi o foaie de calcul Excel. Datele sunt organizate folosind rânduri și coloane și trebuie să fie normalizate astfel încât fiecare atribut să poată fi pus în locul potrivit și intrările să poată fi sortate.
- O bază de date multidimensională, după cum sugerează și numele, stochează date bazate pe mai mult de două dimensiuni. Mai degrabă decât o intrare fiind definită de rând și coloana sa ca într-o foaie de calcul, fiecare entitate dintr-o bază de date multidimensională poate conține un număr de atribute diferite ce pot exista independent de alte intrări.
Un exemplu al unei baze de date relaționale ar putea fi un tabel cu diferite produse, precum și numărul de unități vândute în fiecare stat într-un an calendaristic dat. În acest tabel, rândurile pot fi etichetate cu produsele, cu coloanele atribuite stărilor și valorile numerice completate în mod corespunzător. Tabelul ar putea fi apoi sortat pentru fiecare stat în funcție de numărul de vânzări.
În acest exemplu, dacă doriți să analizați alte atribute – de exemplu, numărul de vânzări în fiecare lună – ar fi nevoie de o bază de date relațională separată. Asta ar putea fi un tabel pentru fiecare produs, cu coloanele reprezentând fiecare stat și rândurile reprezentând fiecare lună.
În comparație, o bază de date multidimensionale ar putea deține toate aceste informații, în aceeași bază de date. Fiecare produs poate fi gândit ca entitate proprie în baza de date, cu valori stocate pentru vânzări în fiecare stat, vânzări pe lună, etc.
Analitic vs Transacțional
Datawarehouses sunt, cel mai adesea, construite în jurul bazelor de date multidimensionale.
Motivul este faptul că bazele de date relaționale sunt optime pentru sistemele tranzacționale – adică, sistemele implicate în procesarea operațiunilor de afaceri de zi cu zi – în timp ce bazele de date multidimensionale suportă mai bine sistemele analitice – adică cele care sunt utilizate pentru business intelligence.
Sistemele tranzacționale și analitice au cerințe foarte diferite. Atunci când procesează tranzacțiile, scopul este de a face acest lucru cât mai repede posibil, astfel încât structura simplă a unei baze de date relaționale este ideală.
În sistemele analitice cel mai important lucru este de a avea toate informațiile relevante stocate împreună, bazele de date multidimensionale fiind mai la îndemână.