Dit document bevat twee oefententamens die erg overeenkomen met het werkelijke tentamen van het vak Introduction Tax & Technology. Als je deze oefententamens goed leert, haal je het vak gegarandeerd in één keer.
Door middel van algoritmes geautomatiseerd patronen ontdekken in data.
B. Noem twee verschillen tussen classificatie- en clustertechnieken.
Classificatietechnieken
- Gegevens onderbrengen in vooraf vastgestelde categorieën
- Groepen zijn vooraf vastgesteld
- Algoritme leert van een set geclassificeerde voorbeelden
- Categorieën moeten elkaar uitputten en uitsluiten
Clustertechnieken
- Gegevens groeperen in homogene (vergelijkbare) groepen
- Groepen zijn vooraf niet vastgesteld
- Groepen worden gevormd op basis van samenhang in de data
- Groepen kunnen elkaar overlappen
C. Zet uiteen wat een false positive is en geef een voorbeeld.
Bij een false positive geeft de uitkomst ten onrechte aan dat een bepaald verband aanwezig is. Het
verband is er “in de echte wereld” niet. Bijvoorbeeld het dat het bezitten van een teckel in verband
staat met het verkeerd invullen van je aangifte.
Deel II: Machine learning en SyRi
Verschillende overheidspartijen, waaronder de Belastingdienst, hebben in het kader van
de ontwikkeling van een algoritme, genaamd Systeem Risico-indicatie,
persoonsgegevens met elkaar uitgewisseld.
Volgens voorstanders kan het algoritme helpen bij het opsporen van fraude door data te
koppelen en te analyseren. Tegenstanders zijn echter van mening dat het algoritme grote
groepen burgers, in de praktijk vooral bewoners van kwetsbare wijken, van meet af aan
als potentiële fraudeur zou bestempelen.
Bij de beantwoording van de navolgende vragen mag u aannemen dat het een vorm van
machine learning betrof. Daarnaast mag u aannemen dat het model getraind wordt op
behandelde fraudegevallen uit het verleden.
D. Mag de overheid zomaar gegevens uitwisselen met andere overheidspartijen?
Nee, dat mag niet zomaar. Artikel 67 AWR is hier van toepassing. Er moet een uitzondering op de
geheimhoudingsplicht gelden volgens het tweede of derde lid van dit artikel, met name het derde lid.
E. Welke vorm van machine learning wordt hier toegepast?
Het model wordt getraind op gevallen waarvan de fraude-uitkomst vaststaat. Daardoor is de data
waarop getraind wordt voorzien van een label. Gelet op het labelen door een persoon, is er sprake
van supervised learning.
, F. Wat is een zogenaamde “recall bias” en wanneer kan een dergelijke bias in de onderhavige casus
spelen?
Een recall bias ontstaat als gevolg van het inconsequent labelen van de data waarop getraind
is/wordt. Er is sprake van een recall bias als er feitelijk sprake is geweest van fraude en dat in relatie
tot een identiek geval wel gedetecteerd, maar dat blijkt niet uit de behandeling van het betreffende
fraudegeval en vice versa.
G. In onder andere het rapport van de Autoriteit Persoonsgegevens (AP) “toezicht op AI &
algoritmes” wordt besproken dat artificiële intelligentie & algoritmes het risico van oneerlijke,
bevoordeelde of zelfs discriminatoire uitkomsten herbergen. Wat kunnen, naar het rapport van de
AP, de oorzaken voor dergelijke uitkomsten zijn? Noem er drie.
- Het kan een bewuste keuze zijn.
- Het kan een gevolg zijn van een slecht stappenplan
- De dataset kan oneerlijke, bevoordeelde of discriminatoire gedragingen bevatten
- De data set kan het gedrag of de voorkeuren van de meerderheid reflecteren
H. Onderscheid tussen burgers maken (“discrimineren”) is niet altijd geoorloofd. Wat is het
toetsingskader om te bepalen of het gemaakte onderscheid daadwerkelijk geoorloofd is?
1. De tegenovergestelde gevallen zijn in relevante opzichten voldoende vergelijkbaar
2. Er is onderscheid gemaakt tussen de gevallen
3. Het onderscheid heeft tot nadeel geleid in de behandeling
4. Het onderscheid is niet redelijk en objectief gerechtvaardigd
a. Op basis van een legitieme doelstelling
b. Redelijke en proportionele verhouding tussen het onderscheid en daarmee het
beoogde doel
In het model werden veel verschillende categorieën persoonsgegevens gebruikt. Niet
limitatief werden onder andere de volgende categorieën gegevens verwerkt (artikel 5a.1.
Besluit SUWI):
a. Arbeidsgegevens, zijnde gegevens waarmee een door een persoon verrichte
werkzaamheden vastgesteld kunnen worden
b. Gegevens inzake bestuursrechtelijke maatregelen en sancties, zijnde gegevens
waaruit blijkt dat een natuurlijke persoon of een rechtspersoon een bestuursrechtelijke
boete opgelegd heeft gekregen dan wel dat een andere bestuursrechtelijke maatregel is
getroffen
c. Gegevens roerende en onroerende goederen, zijnde gegevens waarmee het bezit en
het gebruik van bepaalde goederen door een natuurlijk persoon of rechtspersoon kunnen
worden vastgesteld
d. Huisvestingsgegevens, zijnde gegevens waarmee de (daadwerkelijke) verblijfs- of
vestigingsplaats van een natuurlijk persoon of rechtspersoon kunnen worden
vastgesteld
e. Re-integratiegegevens, zijnde uitsluitend de gegevens waarmee kan worden
vastgesteld of aan een persoon re-integratieverplichtingen zijn opgelegd en of deze
worden nageleefd;
I. Leg aan de hand van de werking van een machine learning model uit dat de in de casus
besproken vrees van tegenstanders waarheid kan worden als huisvestigingsgegevens gebruikt
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Viscalist. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.43. You're not tied to anything after your purchase.