Samenvatting/aantekeningen Sterren en Dimensies (Dr. H. van der Lek, F Habers, M shmitz). Zeer globale samenvatting, die je zéker zal helpen bij het studeren voor je tentamen zonder het boek van /- 250 blz door te lezen.
Data Vault: manier om datawarehouses te modelleren en bouwen. Ontwikkeld in 2002. Alle
bronsystemen schrijven (door middel van een ETL) data naar de Data vault. Het DWH schrijft deze
vervolgend door (ETL) naar multidimensionale databases, olaps en sterren. Een datavault is:
Genormaliseerd
Flexibele en aanpasbaar per bedrijf
Snelle, paralelle dataverwerking
Gemaakt door Dan Linstedt
De data vault bestaat uit:
HUBS: Bedrijfsentiteiten
LINKS: relaties tussen bedrijfsentiteiten
SATTELITES: eigenschappen van HUBS en LINKS
HUBS bevatten:
Surrogate key (sequalnumber) die ‘meaningles’ is
Business key (bedrijfssleutel die herkenbaar is voor het bedrijf zoals artikelID)
LDTS (Loaddate Timestamp) Wanneer is de record naar de datavault geschreven
Record Source (Welke brondatabase komt het record vandaan)
LINKS worden gemaakt wanneer:
Een Foreign Key to Primary Key reference bestaat
Veel op veel relatie bestaat
Als er een transactie is (HUB artikel en HUB Klant en HUB Verkoper LINK Verkoop)
LINKS bevatten:
Surrogate Key (sequalnumber) die ‘meaningles’ is
HUB 1 Surrogate key
HUB 2 Surrogate key
HUB N Surrogate key
LDTS
Recourdsource
Stappen voor modelleren:
1. Wat zijn de entiteiten HUBS
2. Relaties tussen de HUBS LINKS
3. Eigenschappen van al deze HUBS en LINKS SATTELITES
4. Business Keys staan altijd in HUBS
, 5. SATTELITES zijn maar aan één HUB/LINK gekoppeld LINKS zijn verbonden met HUBS of andere
links. 6. Er kunnen SATTELITES naar LINKS wijzen maar HUBS kunnen niet direct aan elkaar verbonden
zijn.
Kleine transacties Bulk load
Veel kleine queries Weinig grote queries en tabelscans
Standaard lijsten Ad-hoc
Data op detaillevel Samengevoegde data (gemiddelde/aggregate)
Veel gebruikers Weinig gebruikers
Routine werk Analysten en managers
Kritiek voor bedrijfsprocessen Kan regelmatig offline (buiten gebruik) zijn
Moeilijk aanpasbaar Flexibel
Waterval ontwikkelmethode Incrementeel ontwikkelmethode
Een feitentabel bestaat uit FK’s (naar dimensies) en measures (wat wil je meten). Dimensies worden
gevonden door ‘w’-vragen te stellen:
- Wat? Product
- Waar? Winkel
- Wanneer tijd
- Aan wie? Klant
- Welke omstandigheden/waarom? Promotie
Bij dimensies hoeft geen ruimte te worden bespaard. Dit moet wel bij de feitentabel omdat deze met
iedere kolom in de dimensie 10 of 100x groter kan worden als er 1 extra optie in een dimensie wordt
gezet.
ETL Extract, Transfer, Load. In de ETL wordt data opgeschoond, gecorrigeerd en in de ster geladen.
Wanneer data uit de bron komt wordt deze meteen in het DWH gezet.
De datavault bevat álle data uit de bronnen + De bron en geschiedenis. Een dwh kan vaak gemaakt
worden zonder de entiteiten van het bedrijf te weten en het bedrijf te raadplegen. De etl van de
bron naar de dwh kan bijna volledig geautomatiseerd worden. Onderhoud aan de ETL is voor
rekening van de IT, Bedrijfsregels en informatiebehoefte wordt bepaald door het bedrijf.
Normale dimensies hebben minimaal 1 hiërarchie en bevatten sleutels die als een fk naar de pk in de
feitentabel wijzen.
Causale dimensies hebben geen hiërarchie. In een causale dimensie is ook een record opgenomen
waarbij de dimensie geen deel uitmaakt van de resultaten in de feitentabel (bij geen promotie
bijvoorbeeld). De promotiekey maakt geen (Kimball) of wel (van der lek) deel uit van de PK in de
feitentabel.
Soms is het makkelijk om een monsterdimensie in een dwh op te splitsen in een mini-dimensie
waarbij gegevens worden opgenomen die vaak in groepen veranderen (NAW-gegevens). In de
monster dimensie wordt dan een sleutel opgenomen die naar de mini-dimensie wijst. In de
feitentabel gebeurt dit ook. Deze komt niet uit de PK van de monsterdimensie of de feitentabel.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Breudje92. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,99. Je zit daarna nergens aan vast.