Inleiding
De eerste industriële was de overgang van handmatig naar vervaardiging door machines (steenkool
en stoommachines). De tweede revolutie was eigenlijk een voortzetting van de eerste (staal- en
elektrotechnische industrie).
De derde industriële revolutie kenmerkt zich als de opkomst van het internet de moderne
informatietechnologie. Net zoals de tweede op de eerste, spreekt Klaus Schwab van een vierde
industriële revolutie als voortzetting op de derde. De kern van deze revolutie is de informatie-
extractie uit ongestructureerde data en het zogenaamde ‘self-learning’, het leren zonder expliciet
geprogrammeerd te zijn.
Eerste en tweede revolutie: converteren van energie
Derde en vierde revolutie: converteren van informatie
Belangrijke krachten achter het proces van digitalisering:
1. Big Data
2. Internet of Things
3. Kunstmatige Intelligentie
Big Data
Allereerst heeft een reeks technologische ontwikkelingen ertoe geleid dat zeer grote hoeveelheden
data kunnen worden gegenereerd, opgeslagen en verwerkt: Big Data. Overheden en bedrijven zijn
steeds beter in staat om uit deze grote hoeveelheid ongestructureerde, zeer gevarieerde en vaak
‘real-time’ gegevens relevante informatie te destilleren. Deze informatie kan vervolgens worden
gebruikt ten behoeve van (automatische) besluitvorming. Dit proces van dataverzameling, analyse en
gebruik wordt aangeduid als het Big Data-proces.
Internet of Things
Een tweede fenomeen, het IoT, ziet op de ontwikkeling waarbij steeds meer ‘alledaagse’ apparaten
met het Internet verbonden raken, zoals verlichting of een verwarming die op afstand kunnen
worden aangezet, een smartwatch die de hartslag registreert, of een koelkast die bijhoudt welke
producten moeten worden bijgekocht. Dit soort apparaten kan data waarnemen en doorgeven en
draagt zo bij aan een vergaande digitalisering van de fysieke wereld.
Kunstmatige Intelligentie
Ten slotte richt AI zich op computers en apparaten die intelligentie kunnen nabootsen; het is een
verzamelterm voor een veelheid aan technologieën. Een belangrijk deelgebied van AI is ‘Machine
Learning’. Machine Learning-technieken stellen computers in staat zelf te ‘leren’ om taken uit te
voeren, zonder daartoe expliciet geprogrammeerd te zijn. In een geavanceerde vorm van Machine
Learning, ‘Deep Learning’, wordt gebruikgemaakt van neurale netwerken die zijn gemodelleerd naar
het menselijk brein. Via deze gelaagde analyses kunnen complexe, verborgen verbanden in datasets
worden ontdekt, en daarmee kan nieuwe kennis worden gegenereerd. AI kan op allerlei manieren
worden toegepast, bijvoorbeeld in expertsystemen die, al redenerend, verkregen kennis op nieuwe
feiten kunnen toepassen, of in robots die ‘intelligente’ handelingen uitvoeren.
Big Data
Grote datasets (Big Data) kunnen worden uitgelegd door de drie (vijf) V’s:
1. Volume (volume)
2. Variety (verscheidenheid)
Volume
Kenmerkend voor Big Data is dat er gestreefd wordt naar een verzameling en analyse van een
volledige, uitputtende hoeveelheid data. Dit staat in contrast met traditionele data-analyses, waarbij
een beperkte hoeveelheid data wordt verzameld en geanalyseerd. Het verzamelen en analyseren van
een volledige populatie is ondoenlijk, dus wordt er een representatieve steekproef genomen. Deze
beperking geldt niet bij Big Data, omdat het verzamelen, opslaan en analyseren van grote
hoeveelheden gegevens vele malen eenvoudiger is geworden.
Variety
Een niet uitputtende lijst van bronnen van data omvat het internet, sociale media,
smartphoneapplicaties, door de overheid beheerde databases etc. Deze bronnen opereren in
verschillende domeinen, die in toenemende mate onderling verbonden zijn. De verscheidene
bronnen bevatten daarnaast ook verschillende ‘soorten’ data.
Oorspronkelijk analoge data
Oorspronkelijk digitale data
Gestructureerde data
Ongestructureerde data
Velocity
Waar traditionele data-analyse gebruik moest maken van op een specifiek tijdstip verzamelde data,
worden data bij Big Data-analyses constant, veelal real-time verzameld en geanalyseerd. Dit betekent
dat er direct actie kan worden ondernomen naar aanleiding van de real-time data-analyse.
Big Data Process: het hele process gericht op kennis en ontdekkingen in grote datasets. Het Big Data
Process bestaat uit drie fasen:
1. Verzamelen
2. Analyseren
3. Gebruik
Verzamelen
Wil Big Data-analyse toegevoegde waarde hebben, dan is het van belang data gereed te maken voor
analyse. Big Data-analyse is mede mogelijk doordat in de fase van datavoorbereiding een grote
verscheidenheid aan data, afkomstig uit verschillende bronnen met een verschillende afkomst en
structuur samen wordt gebracht. Door middel van data fusion kunnen al deze data worden omgezet
naar een gestructureerde, homogene dataverzameling.
Er zijn drie perioden te onderscheiden in de eerste fase, het verzamelen:
1. Klassieke middelen
2. Lijst van zeven van het OECD
3. Opgevoerde frequentie
Klassiek
In de eerste periode, waar gebruikt gemaakt werd van klassieke middelen om de data die nodig was
te verzamelen. Dit werd gedaan aan aangifteformulieren, verrichten van boekenonderzoeken en het
, Samenvatting Introduction Tax & Technology
versturen van vragenbrieven. Kenmerkend voor deze instrumenten is dat ze voornamelijk opereren
in één relatie, namelijk die tussen de belastingdienst en belastingplichtigen. Ook hier werd soms wel
eens data vergeleken met data uit andere bronnen, maar niet structureel en ook niet
geautomatiseerd.
Lijst van zeven van het OECD
In de twee periode verzamelden belastingdiensten niet enkel direct van de belastingplichtigen
gegevens maar werd gebruik gemaakt van meerdere bronnen. De OESO noemt er zeven:
1. Data welke automatisch is verzameld door apparaten zoals camera’s
2. Data van financiële instellingen
3. Data van afnemers van belastingplichtigen
4. Data van toeleveranciers van belastingplichtigen.
5. Ongestructureerde data
6. Data van andere nationale overheden.
7. Internationale gegevensuitwisseling.
Daar komt nu één bron bij, namelijk wat de belastingdienst van Singapore al doet: het analyseren van
sociale netwerken om zo to een betere risicoselectie te komen.
Opgevoerde frequentie
De derde periode wordt gekenmerkt door niet enkel het gebruik van meerdere bronnen maar door
het opvoeren van de frequentie waarin data wordt opgevraagd door belastingdiensten. In plaats dat
de gegevens worden verkregen via maandelijkse btw-aangifte worden gegevens nu in realtime
verkregen.
Bijvoorbeeld de Slimme Meter
Waste data: gegevens waar niet specifiek naar gezocht wordt maar als ‘bijproduct’ worden
verzameld.
Analyse
De analysefase is cruciaal in het Big Data-proces. Zonder analyse zou er geen verschil bestaan tussen
input en output. Om de waarde van grote hoeveelheden data te benutten, is het noodzakelijk hieruit
relevante informatie te vergaren. Het geheel van technologieën waarmee kennis kan worden
vergaard uit grote datasets valt onder de noemer Big Data analytics.
Datamining is een van de voornaamste technologieën die wordt ingezet ten behoeve van Big Data-
analyse. Bij datamining worden op geautomatiseerde wijze, door middel van algoritmes, patronen
ontdekt in grote datasets. Datamining stelt de gebruiker spreekwoordelijk in staat om door de
bomen van data het bos weer te zien. Er zijn vier datamining-algoritmes:
1. Classificatietechnieken
2. Clustertechnieken
3. Regressietechnieken
4. Associatietechnieken
Classificatietechnieken
Gegevens onderbrengen in vooraf vastgestelde categorieën (class attribution). Het algoritme “leert”
van een set reeds geclassificeerde voorbeelden uit de verschillende categorieën (class induction).
Vervolgens zijn (data-)kenmerken gedestilleerd. Kenmerken worden tenslotte toegepast op indeling
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Viscalist. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $10.71. You're not tied to anything after your purchase.