Dit document bevat twee oefententamens die erg overeenkomen met het werkelijke tentamen van het vak Introduction Tax & Technology. Als je deze oefententamens goed leert, haal je het vak gegarandeerd in één keer.
Door middel van algoritmes geautomatiseerd patronen ontdekken in data.
B. Noem twee verschillen tussen classificatie- en clustertechnieken.
Classificatietechnieken
- Gegevens onderbrengen in vooraf vastgestelde categorieën
- Groepen zijn vooraf vastgesteld
- Algoritme leert van een set geclassificeerde voorbeelden
- Categorieën moeten elkaar uitputten en uitsluiten
Clustertechnieken
- Gegevens groeperen in homogene (vergelijkbare) groepen
- Groepen zijn vooraf niet vastgesteld
- Groepen worden gevormd op basis van samenhang in de data
- Groepen kunnen elkaar overlappen
C. Zet uiteen wat een false positive is en geef een voorbeeld.
Bij een false positive geeft de uitkomst ten onrechte aan dat een bepaald verband aanwezig is. Het
verband is er “in de echte wereld” niet. Bijvoorbeeld het dat het bezitten van een teckel in verband
staat met het verkeerd invullen van je aangifte.
Deel II: Machine learning en SyRi
Verschillende overheidspartijen, waaronder de Belastingdienst, hebben in het kader van
de ontwikkeling van een algoritme, genaamd Systeem Risico-indicatie,
persoonsgegevens met elkaar uitgewisseld.
Volgens voorstanders kan het algoritme helpen bij het opsporen van fraude door data te
koppelen en te analyseren. Tegenstanders zijn echter van mening dat het algoritme grote
groepen burgers, in de praktijk vooral bewoners van kwetsbare wijken, van meet af aan
als potentiële fraudeur zou bestempelen.
Bij de beantwoording van de navolgende vragen mag u aannemen dat het een vorm van
machine learning betrof. Daarnaast mag u aannemen dat het model getraind wordt op
behandelde fraudegevallen uit het verleden.
D. Mag de overheid zomaar gegevens uitwisselen met andere overheidspartijen?
Nee, dat mag niet zomaar. Artikel 67 AWR is hier van toepassing. Er moet een uitzondering op de
geheimhoudingsplicht gelden volgens het tweede of derde lid van dit artikel, met name het derde lid.
E. Welke vorm van machine learning wordt hier toegepast?
Het model wordt getraind op gevallen waarvan de fraude-uitkomst vaststaat. Daardoor is de data
waarop getraind wordt voorzien van een label. Gelet op het labelen door een persoon, is er sprake
van supervised learning.
, F. Wat is een zogenaamde “recall bias” en wanneer kan een dergelijke bias in de onderhavige casus
spelen?
Een recall bias ontstaat als gevolg van het inconsequent labelen van de data waarop getraind
is/wordt. Er is sprake van een recall bias als er feitelijk sprake is geweest van fraude en dat in relatie
tot een identiek geval wel gedetecteerd, maar dat blijkt niet uit de behandeling van het betreffende
fraudegeval en vice versa.
G. In onder andere het rapport van de Autoriteit Persoonsgegevens (AP) “toezicht op AI &
algoritmes” wordt besproken dat artificiële intelligentie & algoritmes het risico van oneerlijke,
bevoordeelde of zelfs discriminatoire uitkomsten herbergen. Wat kunnen, naar het rapport van de
AP, de oorzaken voor dergelijke uitkomsten zijn? Noem er drie.
- Het kan een bewuste keuze zijn.
- Het kan een gevolg zijn van een slecht stappenplan
- De dataset kan oneerlijke, bevoordeelde of discriminatoire gedragingen bevatten
- De data set kan het gedrag of de voorkeuren van de meerderheid reflecteren
H. Onderscheid tussen burgers maken (“discrimineren”) is niet altijd geoorloofd. Wat is het
toetsingskader om te bepalen of het gemaakte onderscheid daadwerkelijk geoorloofd is?
1. De tegenovergestelde gevallen zijn in relevante opzichten voldoende vergelijkbaar
2. Er is onderscheid gemaakt tussen de gevallen
3. Het onderscheid heeft tot nadeel geleid in de behandeling
4. Het onderscheid is niet redelijk en objectief gerechtvaardigd
a. Op basis van een legitieme doelstelling
b. Redelijke en proportionele verhouding tussen het onderscheid en daarmee het
beoogde doel
In het model werden veel verschillende categorieën persoonsgegevens gebruikt. Niet
limitatief werden onder andere de volgende categorieën gegevens verwerkt (artikel 5a.1.
Besluit SUWI):
a. Arbeidsgegevens, zijnde gegevens waarmee een door een persoon verrichte
werkzaamheden vastgesteld kunnen worden
b. Gegevens inzake bestuursrechtelijke maatregelen en sancties, zijnde gegevens
waaruit blijkt dat een natuurlijke persoon of een rechtspersoon een bestuursrechtelijke
boete opgelegd heeft gekregen dan wel dat een andere bestuursrechtelijke maatregel is
getroffen
c. Gegevens roerende en onroerende goederen, zijnde gegevens waarmee het bezit en
het gebruik van bepaalde goederen door een natuurlijk persoon of rechtspersoon kunnen
worden vastgesteld
d. Huisvestingsgegevens, zijnde gegevens waarmee de (daadwerkelijke) verblijfs- of
vestigingsplaats van een natuurlijk persoon of rechtspersoon kunnen worden
vastgesteld
e. Re-integratiegegevens, zijnde uitsluitend de gegevens waarmee kan worden
vastgesteld of aan een persoon re-integratieverplichtingen zijn opgelegd en of deze
worden nageleefd;
I. Leg aan de hand van de werking van een machine learning model uit dat de in de casus
besproken vrees van tegenstanders waarheid kan worden als huisvestigingsgegevens gebruikt
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Viscalist. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,99. Je zit daarna nergens aan vast.