Samenvatting/aantekeningen Sterren en Dimensies (Dr. H. van der Lek, F Habers, M shmitz). Zeer globale samenvatting, die je zéker zal helpen bij het studeren voor je tentamen zonder het boek van /- 250 blz door te lezen.
Data Vault: manier om datawarehouses te modelleren en bouwen. Ontwikkeld in 2002. Alle
bronsystemen schrijven (door middel van een ETL) data naar de Data vault. Het DWH schrijft deze
vervolgend door (ETL) naar multidimensionale databases, olaps en sterren. Een datavault is:
Genormaliseerd
Flexibele en aanpasbaar per bedrijf
Snelle, paralelle dataverwerking
Gemaakt door Dan Linstedt
De data vault bestaat uit:
HUBS: Bedrijfsentiteiten
LINKS: relaties tussen bedrijfsentiteiten
SATTELITES: eigenschappen van HUBS en LINKS
HUBS bevatten:
Surrogate key (sequalnumber) die ‘meaningles’ is
Business key (bedrijfssleutel die herkenbaar is voor het bedrijf zoals artikelID)
LDTS (Loaddate Timestamp) Wanneer is de record naar de datavault geschreven
Record Source (Welke brondatabase komt het record vandaan)
LINKS worden gemaakt wanneer:
Een Foreign Key to Primary Key reference bestaat
Veel op veel relatie bestaat
Als er een transactie is (HUB artikel en HUB Klant en HUB Verkoper LINK Verkoop)
LINKS bevatten:
Surrogate Key (sequalnumber) die ‘meaningles’ is
HUB 1 Surrogate key
HUB 2 Surrogate key
HUB N Surrogate key
LDTS
Recourdsource
Stappen voor modelleren:
1. Wat zijn de entiteiten HUBS
2. Relaties tussen de HUBS LINKS
3. Eigenschappen van al deze HUBS en LINKS SATTELITES
4. Business Keys staan altijd in HUBS
, 5. SATTELITES zijn maar aan één HUB/LINK gekoppeld LINKS zijn verbonden met HUBS of andere
links. 6. Er kunnen SATTELITES naar LINKS wijzen maar HUBS kunnen niet direct aan elkaar verbonden
zijn.
Kleine transacties Bulk load
Veel kleine queries Weinig grote queries en tabelscans
Standaard lijsten Ad-hoc
Data op detaillevel Samengevoegde data (gemiddelde/aggregate)
Veel gebruikers Weinig gebruikers
Routine werk Analysten en managers
Kritiek voor bedrijfsprocessen Kan regelmatig offline (buiten gebruik) zijn
Moeilijk aanpasbaar Flexibel
Waterval ontwikkelmethode Incrementeel ontwikkelmethode
Een feitentabel bestaat uit FK’s (naar dimensies) en measures (wat wil je meten). Dimensies worden
gevonden door ‘w’-vragen te stellen:
- Wat? Product
- Waar? Winkel
- Wanneer tijd
- Aan wie? Klant
- Welke omstandigheden/waarom? Promotie
Bij dimensies hoeft geen ruimte te worden bespaard. Dit moet wel bij de feitentabel omdat deze met
iedere kolom in de dimensie 10 of 100x groter kan worden als er 1 extra optie in een dimensie wordt
gezet.
ETL Extract, Transfer, Load. In de ETL wordt data opgeschoond, gecorrigeerd en in de ster geladen.
Wanneer data uit de bron komt wordt deze meteen in het DWH gezet.
De datavault bevat álle data uit de bronnen + De bron en geschiedenis. Een dwh kan vaak gemaakt
worden zonder de entiteiten van het bedrijf te weten en het bedrijf te raadplegen. De etl van de
bron naar de dwh kan bijna volledig geautomatiseerd worden. Onderhoud aan de ETL is voor
rekening van de IT, Bedrijfsregels en informatiebehoefte wordt bepaald door het bedrijf.
Normale dimensies hebben minimaal 1 hiërarchie en bevatten sleutels die als een fk naar de pk in de
feitentabel wijzen.
Causale dimensies hebben geen hiërarchie. In een causale dimensie is ook een record opgenomen
waarbij de dimensie geen deel uitmaakt van de resultaten in de feitentabel (bij geen promotie
bijvoorbeeld). De promotiekey maakt geen (Kimball) of wel (van der lek) deel uit van de PK in de
feitentabel.
Soms is het makkelijk om een monsterdimensie in een dwh op te splitsen in een mini-dimensie
waarbij gegevens worden opgenomen die vaak in groepen veranderen (NAW-gegevens). In de
monster dimensie wordt dan een sleutel opgenomen die naar de mini-dimensie wijst. In de
feitentabel gebeurt dit ook. Deze komt niet uit de PK van de monsterdimensie of de feitentabel.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Breudje92. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.24. You're not tied to anything after your purchase.