Week 1: Data analytic
Type beslissing;
Structured, deze data is opgeslagen in
databases en managers kunnen deze data
makkelijk gebruiken om de effectiviteit van de
organisatie te meten (AR, AP, Orders etc.)
Semistructred, gegevens die niet kunnen
worden georganiseerd in relationele databases
of die geen strikt structureel kader hebben,
maar wel een aantal structurele eigenschappen
of een los organisatorisch kader.
Semigestructureerde gegevens omvatten tekst
die per onderwerp of onderwerp is
georganiseerd of die in een hiërarchische programmeertaal past (e-mails, foto’s, lay-out)
Unstructured, Ongestructureerde data is data die niet een gespecificeerd format volgen voor Big
Data. Het is data die niet verblijven in een traditionele rij-kolom database (goedkeuringen,
aankopen, ontwikkelingen).
Type control;
Operational, is meer gericht op interne informatiebronnen en heeft gevolgen voor kleinere
eenheden of aspecten van de organisatie, zoals het productieniveau.
Managerial, het proces waarmee managers andere leden van de organisatie beïnvloeden om de
strategie van de organisatie te implementeren" of dat deelaspect van management, dat zich
richt op het vergroten van de kans dat medewerkers doelgericht gedrag vertonen (tactical,
planning)
Strategic planning, managers willen weten of het bedrijf op de goede weg is en of de huidige
trends en veranderingen in het bedrijf hen op het goede pad houden (top-level, long range)
Kenmerken van een systeem:
Boundary
Inputs and outputs
Interacts with it’s environment
Is governed by processes, rules, and procedures
Data zijn feiten die zijn verzameld, opgenomen en opgeslagen. Op basis van alleen data kan je geen
beslissingen maken. Informatie is verwerkte data die gebruikt kan worden voor beslissingen.
Big data is de toenemende beschikbare informatie, de drie criteria hiervan’
1) Volume, de hoeveelheid data die moet worden opgeslagen;
2) Velocity, de snelheid waarmee deze data wordt verwerkt;
3) Variety, de verschillende soorten data die kan worden opgeslagen (structured, unstructured &
semi), vroeger konden alleen Excel-sheets opgeslagen worden nu ook foto’s, PDFs etc.
Data scientist: en professional met de opleiding en de nieuwsgierigheid om ontdekkingen te doen in de
wereld van big data. Zij zijn verantwoordelijk voor het vormen van theorieën, het testen van ingevingen,
en het vinden van patronen om te voorspellen op basis van ongestructureerde data.
Week 2: Database concept and data modelling
, Database: a shared computerized structure that captures, stores, and relates data (stores facts about
real word entities from daily business operations)
Database system: a system of hardware, software, people, procedures, and data that allow the capture,
storage, management, and use of data within a database environment.
Database management system, a group of programs that manipulate the database and provide the
interface between the database and the user.
Procedure, the instructions, and rules that govern the design and use of the software outside
programming.
Database warehouse, a database used for analyzing data to support decision-making (multiple
databases).
Eigenschappenvan een data warehouse zijn als volgt:
1) Relational, dit zorgt ervoor dat de data georganiseerd wordt
2) Include metadata, data over data
3) Subject oriented, het levert informatie over een specifiek thema
4) Integrated, data van verschillende bronnen kan gecombineerd worden
5) Client/server, de applicatie kan aangepast worden obv input client
6) Web-based, kan overal vandaan (web) geopend worden
7) Time-variant, de data wordt periodiek ingeladen, in de tussentijd kan er niet aangepast worden
8) Multi-dimensional, data wordt in kubus vorm weergegeven waardoor je meerder dimensies hebt
9) Nonvolatile, data die in het systeem is gezet kan niet meer gewijzigd worden
10) Summarized, er kunnen overzichten weergegeven worden die als samenvatting dienen
11) Not normalized, data wordt gecombineerd zodat vragen snel uitgevoerd kunnen worden
A data mart is a simple section of the data warehouse that delivers a single functional data set. Data
marts might exist for the major lines of business, but other marts could be designed for specific products.
Examples include seasonal products, lawns, and gardens, or toys.
Om toegang tot data te krijgen gebruiken we het ELT (Extraction, Transformation, Load) process:
Extraction, data uit de databases halen
Transformation, de extracted data converteren vanuit de eerste vorm tot de vorm data welke we
nodig hebben voor onze analyse
Loading, de data vanuit de databases in het data warehouse plaatsen