100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Alle verplichte literatuur Introduction Tax & Technology $6.43   Add to cart

Summary

Samenvatting Alle verplichte literatuur Introduction Tax & Technology

1 review
 76 views  8 purchases
  • Course
  • Institution

Samenvatting van alle voorgeschreven literatuur van het vak Introduction Tax & Technology 2022 van Tilburg University. Ik heb per verplichte literatuur volgens de Syllabus een samenvatting gemaakt en dit allemaal in één bestand verwerkt. Hiermee heb ik het tentamen in één keer gehaald.

Preview 4 out of 49  pages

  • June 2, 2022
  • 49
  • 2021/2022
  • Summary

1  review

review-writer-avatar

By: xmmagdakrawczyk • 1 year ago

avatar-seller
Samenvatting Literatuur Introduction Tax & Technology


SAMENVATTING ALGORITMES EN GRONDRECHTEN
Big Data
Drie technologische ontwikkelingen die het mogelijk hebben gemaakt dat relevante informatie beter
is te destilleren uit grote hoeveelheden data:
- Mogelijkheid om gegevens te verzamelen enorm gegroeid
- De capaciteit voor gegevensopslag verdubbelt elke twee tot drie jaar
- Technologieën om data met elkaar te verbinden en om te zetten naar relevante informatie
zijn sterk verbeterd

Big Data wordt veelal omschreven aan de hand van drie kenmerken:
1. Volume
2. Variety
3. Velocity

Volume
Kenmerkend voor Big Data is dat er gestreefd wordt naar een verzameling en analyse van een
volledige, uitputtende hoeveelheid data. Dit staat in contrast met traditionele data-analyses, waarbij
een beperkte hoeveelheid data wordt verzameld en geanalyseerd. Het verzamelen en analyseren van
een volledige populatie is ondoenlijk, dus wordt er een representatieve steekproef genomen. Deze
beperking geldt niet bij Big Data, omdat het verzamelen, opslaan en analyseren van grote
hoeveelheden gegevens vele malen eenvoudiger is geworden.

Variety
Een niet uitputtende lijst van bronnen van data omvat het internet, sociale media,
smartphoneapplicaties, door de overheid beheerde databases etc. Deze bronnen opereren in
verschillende domeinen, die in toenemende mate onderling verbonden zijn. De verscheidene
bronnen bevatten daarnaast ook verschillende ‘soorten’ data.

Oorspronkelijk analoge data komen voor uit de fysieke, offlinewereld en worden vervolgens omgezet
naar een digitale vorm.
- Stemopnames, met een camera vastgelegde visuele informatie

Oorspronkelijk digitale informatie daarentegen is specifiek gecreëerd voor de digitale wereld
- E-mail- en internetverkeer

Gestructureerde data refereert aan vormen van sterk georganiseerde data, bijvoorbeeld data die
is geordend in kolommen en rijen.

Ongestructureerde data betreft data die niet zijn weergegeven in strak georganiseerde databases,
maar waarbij het bijvoorbeeld gaat om tekst in facebookposts, foto’s en video’s.
- Circa 95% van alle data is ongestructureerd .

Velocity
Waar traditionele data-analyse gebruik moest maken van op een specifiek tijdstip verzamelde data,
worden data bij Big Data-analyses constant, veelal real-time verzameld en geanalyseerd. Dit betekent
dat er direct actie kan worden ondernomen naar aanleiding van de real-time data-analyse.

,Samenvatting Literatuur Introduction Tax & Technology


Naast de drie V’s wordt er nog een veelvoud aan andere kenmerken aan Big Data verbonden. De
meestgenoemde kenmerken zijn:
- Data-gedreven analyse
- Op correlatie georiënteerde aard van Big Data

Data-gedreven analyse
Oorspronkelijk werden datasets geanalyseerd met als doel het verifiëren van specifieke,
vooraf opgestelde hypotheses. Big Data-analyse daarentegen is data-gedreven. Het doel van de data-
gedreven analyse is het vinden van relevante patronen en verbanden in datasets. Hiertoe worden
algoritmes gebruikt die niet beperkt worden door specifieke hypotheses. Deze algoritmes
testen grote hoeveelheden verbanden en proberen op deze wijze relevante informatie uit
de data te destilleren.

Oriëntatie op correlatie
Data-gedreven analyses richten op het vinden van statistische verbanden (correlaties), die niet per
definitie causaal van aard zijn. Causaliteit betekent dat A de oorzaak is van B, terwijl een correlatie
slechts indiceert dat A en B in samenhang voorkomen. In veel situaties zal een statistisch verband
een voldoende basis bieden voor het nemen van besluiten. Er moet dus voorzichtig worden gedaan
met het baseren van beslissingen op geconstateerde correlaties.

Het gehele proces van kennisvergaring en -benutting wordt aangeduid als het Big Data-proces. De
WRR heeft dit proces onderverdeeld in drie stappen:
- Verzameling
- Analyse
- Gebruik

Verzameling
Wil Big Data-analyse toegevoegde waarde hebben, dan is het van belang data gereed te maken voor
analyse. Big Data-analyse is mede mogelijk doordat in de fase van datavoorbereiding een grote
verscheidenheid aan data, afkomstig uit verschillende bronnen met een verschillende afkomst en
structuur samen wordt gebracht. Door middel van data fusion kunnen al deze data worden omgezet
naar een gestructureerde, homogene dataverzameling.

Analyse
De analysefase is cruciaal in het Big Data-proces. Zonder analyse zou er geen verschil bestaan tussen
input en output. Om de waarde van grote hoeveelheden data te benutten, is het noodzakelijk hieruit
relevante informatie te vergaren. Het geheel van technologieën waarmee kennis kan worden
vergaard uit grote datasets valt onder de noemer Big Data analytics.

Datamining is een van de voornaamste technologieën die wordt ingezet ten behoeve van Big Data-
analyse. Bij datamining worden op geautomatiseerde wijze, door middel van algoritmes, patronen
ontdekt in grote datasets. Datamining stelt de gebruiker spreekwoordelijk in staat om door de
bomen van data het bos weer te zien. Er zijn vier datamining-algoritmes:
1. Classificatietechnieken
2. Clustertechnieken
3. Regressietechnieken
4. Associatietechnieken

,Samenvatting Literatuur Introduction Tax & Technology


1. Classificatietechnieken zijn er op gericht om gegevens in verschillende, reeds door programmeurs
gecreëerde categorieën onder te brengen. De algoritmes die aan deze techniek ten grondslag liggen
‘leren’ van een set aan reeds geclassificeerde voorbeelden door systematisch verschillen en
overeenkomsten tussen de verschillende categorieën te vergelijken. Vervolgens zijn de algoritmes in
staat om hieruit regels te destilleren en toe te passen op nieuwe gevallen.
- Bijvoorbeeld spamfilters op mails

2. Bij clustertechnieken richten algoritmes zich op het groeperen van gegevens die sterk
overeenkomen. Het verschil met classificatietechnieken is dat classificatie gebaseerd is op reeds
bestaande, van te voren gedefinieerde klassen, terwijl clustering erop gericht is dergelijke klassen te
creëren op basis van de data-analyse. Sterk verwant aan clusteren is het opsporen van zogenaamde
‘uitbijters’ (outlier detection). Dit betekent dat een algoritme onregelmatigheden in data ontdekt.
- Bijvoorbeeld typen klanten in klantenbestand van een winkel

3. Regressietechnieken formuleren numerieke voorspellingen op basis van in datasets
geïdentificeerde verbanden.
- Bijvoorbeeld bank die kan voorspellen wat de kans is dat een lening wordt terugbetaald

4. Bij associatietechnieken zoeken algoritmes naar correlaties tussen gegevens en worden op basis
van deze correlaties associatieregels geformuleerd.
- Bijvoorbeeld de ‘aanbevolen voor jou’ op Netflix

Profileren is ook een relevante techniek bij de analyse van data. Bij profileren worden algoritmes
ingezet om profielen op te stellen, waaronder van personen of groepen van personen. Aan
profilering liggen veelal dataminingtechnieken ten grondslag. Om die reden wordt profileren ook wel
gezien als het op personen toegepaste datamining. Binnen profileren kan globaal onderscheid
gemaakt worden tussen groepsprofielen en persoonsprofielen.

Een persoonsprofiel bestaat uit een verzameling van eigenschappen (ook wel ‘attributen’)van een
persoon. Een voorbeeld is het profiel van mevrouw Jansen, die 46 jaar oud is, vier kinderen heeft en
€45.000 per jaar verdient. Bij het verder verfijnen van een persoonsprofiel kan datamining worden
ingezet om attributen te voorspellen. Zo kunnen op basis van de berichten die mevrouw Jansen liket
op Facebook haar seksuele voorkeur, etniciteit, politieke voorkeur, intelligentie, geluk en mogelijke
drugsproblematiek worden voorspeld. Voor het opstellen van een individueel profiel is de hiervoor
beschreven regressietechniek geschikt.

Een groepsprofiel bestaat uit een verzameling attributen van een groep personen. Bij een zogeheten
distributieve groep zijn de attributen van de groep aanwezig bij alle personen die zich in de groep
bevinden. Zo is ‘niet getrouwd zijn’ een attribuut van alle personen in de groep vrijgezelle
Nederlanders. De meeste groepsprofielen kennen een niet-distributief karakter. Dit betekent dat de
voor de groep geldende attributen niet noodzakelijkerwijs voor alle individuen in de groep gelden.
Dergelijke attributen worden vaak uitgedrukt in gemiddelden en percentages. Zo kan een groep
personen met een bepaalde postcode gemiddeld €60.000 verdienen. Dit betekent echter niet dat
alle personen in deze groep dit inkomen hebben. Profiling kan door het maken van groepsprofielen
ook worden gebruikt voor het opstellen van risicoprofielen, bijvoorbeeld ten aanzien van de kans dat
iemand zijn lening niet terugbetaald of een terrorist is. Voor het opstellen van deze profielen wordt
veelal gebruikgemaakt van classificatie- en clusteralgoritmes.

, Samenvatting Literatuur Introduction Tax & Technology


Gebruik
Het uiteindelijke doel van Big Data-analyse is het faciliteren van evidence-based decisonmaking.
Een analyse leidt tot actionable knowledge, waarbij op basis van uit de analyse verkregen inzichten
besluiten kunnen worden genomen of beleid kan worden gemaakt. Deze fase van het gebruik van de
uitkomsten van de data-analyses is getypeerd als de minst technische, maar wel als de belangrijkste
fase vanuit een maatschappelijk perspectief.

Kunstmatige Intelligentie
Het Latijnse homo sapiens staat voor ‘wijze mens’. Intelligentie definieert ons mens-zijn. Maar
intelligentie is niet voorbehouden aan mensen. Reeds in 1950 stelde de Britse wiskundige Alan Turing
de vraag ‘Can machines think?’ Deze vraag heeft geleid tot de opkomst van een wetenschappelijke
discipline met de naam Kunstmatige Intelligentie (AI). AI richt zich niet op begrip van menselijke
intelligentie, maar gaat een stap verder: er wordt gestreefd naar het creëren van intelligente
artefacten.

Het definiëren van AI is niet eenvoudig, voornamelijk omdat het niet duidelijk is wat onder
intelligentie moet worden verstaan. De mogelijkheid om over intelligentie te beschikken wordt
primair aan mensen toegedicht, maar wat menselijke intelligentie inhoudt is niet volledig helder. De
definitie van intelligentie wordt daardoor veelal geassocieerd met specifieke uitingsvormen van
menselijke intelligentie, zoals het gebruik van taal en leervaardigheid. Deze uitingsvormen zijn niet
vastomlijnd en op zichzelf niet altijd eenvoudig te begrijpen. John McCarthy, pionier op het gebied
van AI, heeft in lijn met het voorgaande aangegeven dat ‘the problem is that we cannot yet
characterize in general what kinds of computational procedures we want to call intelligent.’ In hun
standaardwerk Artificial Intelligence: A Modern Approach beschrijven Russell en Norvig definities die
in twee categorieën kunnen worden onderverdeeld. Volgens de definities ziet AI respectievelijk op:
- Menselijk of rationeel denken: apparaten of machines bezitten AI wanneer zij in staat
zijn om beslissingen te nemen, problemen op te lossen en te leren.
- Menselijk of rationeel handelen: apparaten of machines bezitten AI wanneer zij in staat
zijn om activiteiten uit te voeren die intelligentie zouden vereisen als ze door mensen
zouden worden uitgevoerd.

AI richt zich volgens voorgaande definities op artefacten die autonoom opereren, leren, begrijpen,
reageren op hun omgeving en zich aanpassen aan veranderingen om zo – in het licht van de
omstandigheden – te komen tot ‘een zo goed mogelijke uitkomst’.

AI kent een veelheid aan deelgebieden:
- Natural language processing
- Expert systems
- Robotica

De gebieden overlappen en zijn niet altijd van elkaar te onderscheiden, doordat de onderliggende
technologieën en algoritmes overeenkomen. De combinatie van ontwikkelingen in al deze
deelgebieden heeft ertoe geleid dat AI een breed spectrum aan toepassingen bestrijkt. Een belangrijk
AI-deelgebied houdt zich bezig met technologieën die computers in staat stellen om te leren zonder
hiertoe expliciet geprogrammeerd te zijn: Machine Learning.

Machine Learning is gebaseerd op algoritmes die zijn in staat om te leren op basis van eerdere
ervaringen, zogenaamde zelflerende algoritmes. Het is dit zelflerende karakter dat Machine Learning

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller Viscalist. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.43. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

72042 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$6.43  8x  sold
  • (1)
  Add to cart