Dit betreft een volledige samenvatting waarin de stof tot in haar volledigheid behandeld is en benaderd. Op het einde berust nog een vraag die op eigen inzicht beantwoord kan worden.
Hoofdstuk 1 - Inleiding
Vraag: Waarom Big data belangrijk is in deze tijd en wat is de overeenkomst met geld?
Het is net zo lastig om aan veel geld te komen als aan veel (goede) gegevens. Bovendien heeft geld waarde
omdat je er dingen voor kunt kopen en Big Data heeft waarde omdat er veel (verborgen) informatie in te
vinden is.
De drie grootste stappen bij het proces van Big Data:
➔ Big Data verzamelen; dit gaat vooral over de verschillen met ‘gewone databasesystemen’ en de gevolgen
die dit meebrengt bij het opzetten van een computersysteem voor het verwerken ervan
➔ Big Data onderzoeken; dit bespreekt de belangrijkste technieken om Big Data te onderzoeken, geeft hun
belangrijkste voor- en nadelen en beschrijf elk van deze technieken voor welk soort onderzoek ze gebruikt
worden
➔ Big Data laten spreken; dit kan alleen als de sterke en zwakke punten bekend zijn, en dat met een goed
zicht op de beperkingen. Geen enkele techniek geeft de absolute waarheid. Bovendien speelt mee dat
verkeerd gebruik of verkeerd vertalen van de resultaten van onderzoek van Big Data erg snel de grens van
het ethisch toelaatbare kan overschrijden. Het inzicht dat Big Data ook hier ‘op het scherp van de snede’
werkt is van het grootste belang bij het vertalen van de uitkomsten
Voor wie is Big Data bestemd?
➔ Gebruiker van Big Data; deze persoon heeft algemene kennis nodig van de manier waarop Big Data
onderzocht wordt en hoe de resultaten tot stand komen. Dit betekent kennis van de principes van
verwerking, opslag, onderzoek en rapportage
➔ Analist van Big Data; deze persoon heeft naast een algemene kennis van het hele proces een diepgaande
kennis nodig van de technieken voor het onderzoeken van Big Data en de nauwkeurigheid en
trefzekerheid van dergelijke onderzoeken
➔ Programmeur van Big Data; deze persoon heeft naast de bovenstaande kennisfronten een diepgaande
kennis nodig betreffende het doelmatig benaderen van grote hoeveelheden informatie en aangaande het
verwerken van deze informatie
➔ Ontwerper van Big Data; deze persoon heeft naast algemene kennis van het hele proces een diepgaande
kennis nodig van de opbouw van de systemen die het verzamelen, opslaan en beschikbaar stellen van
grote hoeveelheden gegevens en informatie mogelijk maken
➔ Manager van Big Data; deze persoon heeft naast algemene kennis van het hele proces een brede kennis
nodig om een team dat vaak op de grens van het technisch haalbare zoekt naar bedrijfskundig
verantwoorde oplossingen bij het gebruik van Big Data te begeleiden en te enthousiasmeren
, Hoofdstuk 2 - Big Data
Wat is data?
Een verzamelnaam voor gegevens die in een computersysteem staan opgeslagen
Wat is Big Data?
Dit is een zo grote hoeveelheid ongestructureerde en (soms) niet complete set gegevens dat verwerking met
conventionele databasesystemen niet mogelijk is
(de drie V’s betekenis)
De verzamelingen van gegevens van grote hoeveelheden, (volume) nieuwe gegevens die ontstaan (velocity) en
de onderlinge variatie (variety)
Welke 4 eigenschappen kunnen we afleiden van Big Data?
1. Grote hoeveelheden gegevens
2. Geen controle op het compleet zijn van elk onderdeel
3. Afwezig zijn van enige ordening
4. De hoeveelheid gegevens kan op elk moment sterk veranderen
Wat is datamining?
De technieken die gebruikt worden bij het hanteren van Big Data
5 voorbeelden waarvoor Big Data ontwikkeld is:
Google; Bekend door hun zoekmachine
Map Reduce-techniek ontwikkeld om het parallel verwerken van informatie mogelijk te maken.
NASA; Amerikaanse ruimtevaartorganisatie
NASA gebruikt Big Data-technieken in haar NCCS, een centrum voor simulatie van het klimaat. In dit centrum
wordt meer dan 32 PB aan meetgegevens en gegevens uit computersimulaties van weermodellen bewaard en
onderzocht.
Facebook; Eén van de meest bekende socialmediasites
Moet als bedrijf en systeem 350 miljoen foto’s per dag die geüpload worden beheren en het toegankelijk
houden van meer dan 1 miljard actieve gebruikersprofielen. Dit kan alleen met Big Data en ook hier geldt dat
het opbouwen van een geordende gestructureerde database niet haalbaar is.
CERN; Conceil Européen pour la Recherche Nucleaire, oftewel een kernfysisch onderzoek die o.a. de Large
Hadron Collider beheert (deeltjesversneller)
Deze produceert 15 petabyte aan informatie op jaarbasis, om deze enorme hoeveelheid informatie op te slaan
en te verwerken beschikt CERN over het grootste gedistribueerde computernetwerk ter wereld
*Game-company; (deze is anders) in de vorige toepassingen werd de noodzaak benoemd om het gebruik van
Big Data te onderbouwen. Ook ging het om zeer grote instellingen en was geen informatie beschikbaar over
het traject naar het inzetten van Big Data.
Game-company is een bedrijf dat internetspelletjes maakt en geld verdient via abonnementen op dit soort
spelletjes. Wanneer omzet terugloopt, wordt geprobeerd de oorzaak te achterhalen door de beschikbare
informatie over de spelers en hun gedrag te analyseren. De traditionele aanpak werkte hier niet voor dus
gebruikte het bedrijf Big Data. Dit bleek geweldig te werken want de informatie laat duidelijk zien waar de
problemen liggen en welke mogelijkheden er zijn om deze problemen aan te pakken.
Hier wordt duidelijk aangetoond dat de kracht van Big Data ligt in het omhoog halen van verborgen
informatie achter veel standaard beschikbare bedrijfsgegevens.
Praktijkvoorbeeld begrijpen P.29 en P.157
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller DJEC. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.12. You're not tied to anything after your purchase.