Excellent summary, especially show the concepts well, a pity that there are few pictures in it.
Seller
Follow
corwaning
Reviews received
Content preview
LEERBOEK BUSINESS INTELLIGENCE – HOOFDSTUK 1
Wat is Business Intelligence
Business Intelligence is een overkoepelende term waarmee applicaties, infrastructuur en
hulpmiddelen en aangeraden werkwijzen worden bedoeld, die als doel hebben om
gegevens beschikbaar te stellen ten einde de juiste beslissingen te kunnen nemen op
basis van correcte, betrouwbare informatie.
Samenvatting Business Intelligence
Business Intelligence is iedereen in een organisatie op het juiste moment van de juiste
informatie te voorzien met als doel competitief voordeel te behalen door verbeterende
besluitvorming te realiseren.
Voor wie is Business Intelligence?
Business Intelligence is voor iedereen. Het is zowel interessant voor grote als voor kleine
bedrijven. Het is in elke branche interessant. Binnen een bedrijf biedt het meerwaarde aan
alle soorten functies, van hoog tot laag. Selfservice BI draait het om het in staat stellen van
eindgebruikers om zelf in hun informatiebehoefte te voorzien zonder anderen te vragen
oplossingen voor ze te bouwen ten einde de juiste informatie op het juiste moment ter
beschikking te stellen.
Selfservice Business Intelligence
Selfservice BI betekent dat eindgebruikers hun eigen rapporten en analyses ontwerpen en
in gebruik nemen, gebruikmakend van goedgekeurde tools en een ondersteunende BI-
architectuur.
Wat is informatieanalyse?
Informatieanalyse is het achterhalen wat de behoeftes, wensen en eisen van de beoogde
eindgebruikers van een systeem zijn.
Datawarehouse
Een datawarehouse is een centrale database gevuld met gegevens uit één of meer aparte
bronnen met als doel het maken van rapportages en het uitvoeren van data-analyses.
Een datawarehouse heeft een aantal voordelen:
• Historische gegevens kunnen worden bijgehouden;
• De kwaliteit van de gegevens kan beter worden gecontroleerd;
• Gegevens uit verschillende bronnen kunnen worden geïntegreerd;
• De performance kan worden geoptimaliseerd voor het doel: rapporten en
analyseren;
• Alle rapportages komen nu vanuit één bron, wat de eenduidigheid van de
rapportages bevordert.
,ETL-proces
Het ETL-proces zorg voor de juiste vulling van het datawarehouse en daarmee voor de
kwaliteit van de rapportages die je maakt en de analyses die je doet.
De letters ETL staan voor:
• Extract – haal gegevens uit bronsystemen;
• Transform – pas de gegevens aan aan de eisen die het datawarehouse stelt aan de
gegevens;
• Load – laad de gegevens in het datawarehouse.
Staging area of staging database
Een staging database is een database waarin gegevens tijdelijk worden opgeslagen
tijdens het ETL-proces alvorens ze worden overgehaald naar het datawarehouse.
Tools zoals SQL Server Integration Services kunnen ervoor zorgen dat de gegevens
rechtstreeks vanuit de bron het datawarehouse overhaalt. Praktisch gezien wordt er vaak
gekozen voor een tussenlaag: de staging area of staging database. Bij grote
implementaties worden vaak meerdere staging-lagen gebruikt voordat de gegevens het
datawarehouse ingaan.
Datamarts
Door deze staging-lagen kan het ook voorkomen dat de rapportages niet rechtstreeks uit
het datawarehouse komt, maar uit één van deze staging-lagen, dat is afhankelijk van de
datawarehousestrategie. Deze lagen worden datamarts genoemd. De datamarts zijn
kleine datawarehousjes die gemaakt zijn voor specifieke rapport- en analysedoeleinden.
ODS
ODS betekent: Operational Data Store.
Een ODS is een eerste plek waar gegevens landen nadat ze uit het bronsysteem zijn
gehaald. Het kan dienen als tussenstop voor gegevens die naar het datawarehouse gaan.
In die zin is het een staging database. Soms worden rapportages gebaseerd op deze
ODS, dan wordt het ook wel een rapportagedatabase genoemd.
Semantisch model
Een semantisch model is een abstractielaag die betekenis en verbanden toevoegt aan de
gegevens in een database.
Bij veel Business Intelligence-implementaties kan een datawarehouse niet voldoen aan
alle wensen en eisen. Er kan een aantal problemen optreden:
• Er kunnen nog performanceproblemen zijn omdat achter veel rapporten zware
query's schuilgaan.
• Veel rapportage- en analysehulpmiddelen (BI-tools) hebben moeite goede query's
te genereren.
• Eindgebruikers willen gemakkelijk en snel op een flexibele, niet vooraf
gedefinieerde wijze door de gegevens heen kunnen browsen.
Semantische modellen kunnen hierbij helpen. Een semantisch model vertaalt een
technische database naar voor de eindgebruikers betekenisvolle entiteiten.
,Kubus
Een kubus is een meerdimensionale draaitabel.
Een kubus is een soort database, een multidimensionale database. Tegelijkertijd is een
kubus ook een model. Bij het ontwerpen van een kubus wordt rekening gehouden met de
betekenis van gegevens en worden onderlinge verbanden beschreven. Ook wordt het
jargon van de betreffende organisatie gebruikt.
Datamining
Datamining is het gericht zoeken naar (statische) verbanden in gegevensverzamelingen
met als doel profielen op te stellen voor wetenschappelijk of commercieel gebruik.
Datamining wordt gebruikt om in grote data naar (nog) niet bekende verbanden en te
zoeken en van daaruit patronen en voorspellingen te doen. Met datamining komt men uit
bij Predictive Analyses.
Machine learning
Machine learning is een toepassing van artificial intelligence (AI) waarmee systemen
automatisch leren op basis van ervaring zonder expliciet geprogrammeerd te worden.
Predictive analyses en machine learning kan er voorspelt worden hoeveel ijs bijvoorbeeld
morgen verkocht gaat worden. Op deze data kan er beslist worden hoeveel ingekocht
moet worden en hoeveel personeel er ingepland moet worden.
Big Data en RDBMS
Big data refereert aan datasets waarbij de hoeveelheid aan gegevens, de snelheid
waarmee gegevens verwerkt worden en/of de diversiteit van die gegevens een probleem
wordt als de gegevens op een klassieke manier worden behandeld.
In dit hoofdstuk wordt uitgegaan van dat de datawarehouse een relationele database is.
De gegevens worden beheerd een RDBMS (Relational Database Management System).
Een RDBMS levert veel voordelen op rond beheer van gegevens en consistentie van
gegevens. De consequentie is wel dat er overhead is met het werken van gegevens.
Om dit te voorkomen is Big Data verzonnen, hier hebben drie aspecten mee te maken:
• Volume – de hoeveelheid van gegevens;
• Velocity – de snelheid waarmee gegevens ontstaan en opgeslagen (en verwerkt)
moeten worden;
• Variety – de diversiteit van de gegevens.
Aan Big Data kan gedacht worden aan Twitter, Facebook, blogs, fora, enzovoort:
• Er worden zoveel tweets gepost dat het nooit in een tabel gezet kan worden;
• Daarnaast is de snelheid van het aantal nieuwe tweets zo snel dat de lees- en
schrijfdruk zo groot is dat het systeem het nauwelijks aan kan;
• Daarnaast zit er weinig structuur in de tweets.
Al deze zaken maken tweets moeilijk te verwerken in een klassieke datawarehouse. De
informatie en potentie is wel enorm. Je kunt namelijk de data gebruiken om voorspellingen
te doen (tweets over nieuwe films, bioscopen kunnen vooraf schatten hoeveel bezoekers
, er komen). Voor deze data zijn er nieuwe soorten databases gemaakt, die vallen onder de
noemer noSQL.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller corwaning. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.05. You're not tied to anything after your purchase.