100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Tentamenstof week 5 Big data Informatieveiligheid €4,48   In winkelwagen

Samenvatting

Samenvatting Tentamenstof week 5 Big data Informatieveiligheid

2 beoordelingen
 131 keer bekeken  1 keer verkocht

Alle tentamenstof week 5 big data

Voorbeeld 7 van de 20  pagina's

  • 1 november 2016
  • 20
  • 2016/2017
  • Samenvatting
Alle documenten voor dit vak (36)

2  beoordelingen

review-writer-avatar

Door: crvtje • 7 jaar geleden

review-writer-avatar

Door: huykha10 • 7 jaar geleden

avatar-seller
lucasbonset
Kernpunten informatieveiligheid week 5 : Big data

Artikel: Machine Bias

‘’ Software gebruikt om toekomstige criminelen te voorspellen ‘’

- Na 2 afzonderlijke delicten (41-jarige veelpleger en minderjarige scholier) een computerprogramma
voorspelt de kans op een toekomstige misdaad voor beide personen
- Uiteindelijk blijkt de minderjarige scholier een groot risico (vanwege zijn huidskleur), de 41-jarige
veelpleger een laag risico

Risico-evaluatie > laag of hoog risico > frequenter toegepast. (risk-assessment). High, Medium, Low.

- gebruikt om beslissingen te informeren (meer vrijheid, verdachten vrijheid).
- Deze risico-evaluaties worden aan de rechtbanken en jury’s gegeven.

Tegenwoordig > vaker gebruik van gecombineerde evaluaties (revalidatie-behoeften meegenomen).

Risico-scores zorgen mogelijk voor een Bias (= vooroordeel).

- Geïndividualiseerde en gelijke behandeling
- Voorspellende waarde is laag > maar 20% van mensen waarvan voorspeld was dat zij gewelddadige
misdaden zouden plegen, plegen daadwerkelijk deze misdrijven
- Ras-verschillen
- Witte verdachten waren vaker verkeerd gelabeld als laag risico dan zwarte verdachten.
- Algoritme werkt discriminatie in de hand
- Organisaties geven geen publieke uitleg over de berekeningen die verdachten indelen in risico-scores,
dus ook niet duidelijk wat drijfveren zijn achter de verschillen
- A.h.v. 137 vragen (beantwoord door verdachten of uit criminele statistieken) > ras is geen vraag
- Vragen over vechtpartijen, drugs, etc.
- Groot aandeel zwarte mensen in Amerikaanse gevangenissen, ontstaan door het justitiële proces dat
in handen van mensen ligt die geleid worden door hun instincten en persoonlijke biases.
- Scores worden uitgebracht door Northpointe’s software.
- Validiteit ontbreekt in onderzoeken, en de onderzoeken uitgevoerd door dezelfde personen die het
instrument/onderzoek hadden ontworpen
- Het toenemende gebruik van risico-scores is controversieel en veel media-aandacht
- Risico-scores voornamelijk ontwikkeld, in eerste instantie om een gepaste behandeling aan te bieden
voor drugs of psychische zorg
- Beide partijen (jury en verdachte met risicoscore) zouden volledige inzage in de berekeningen en
gegevens moeten krijgen.

De grafieken uit dit document geven simpelweg aan:

‘’ Dat de scores voor blanke verdachten zijn afgenomen naar lagere risico categorieën ‘’, dit geldt niet voor
zwarte verdachten ‘’.

De risico-score geeft bovendien niet aan of een persoon gevaarlijk is of naar de gevangenis zou moeten:

Voorbeeld: Een man die een klein kind een jaar lang elke dag mishandeld kan een laag risico krijgen omdat hij
waarschijnlijk een baan heeft.

De baan is dan de voorwaarde in de risico-evaluatie.

Oorzaken van misdaad kunnen aanwijzen > quantitative taxonomy (intelligentie, extraversie, introversie).
COMPAS > niet alleen risico’s, maar ook criminogene behoeften (persoonlijkheid, isolatie, misbruik) en
stabiliteit. > verdachten ingedeeld in laag, midden, hoog per categorie



1

, - Geen evaluatie van eerder gebruikte risk-assessments (geen raciale verschillen)
- Het is moeilijk om een score te maken dat geen items bevat die gecorreleerd zijn aan ras (zoals
armoede, werkloosheid etc)
- Rechtbank niet toegestaan om mensen met hogere scores langere straffen te geven, wel om
behandelingsprogramma’s aan te kunnen bieden

Gelabeld als hoog risico, maar niet opnieuw delict gepleegd > white 23.5%, african american 44.9%
Gelabeld als laag risico, maar wel opnieuw delict gepleegd > white 47.7%, african american 28%

Kortom, rechters hebben gebruikgemaakt van deze risicoscores in hun strafbepalingen.

- De risicoscore alleen zou niet de straf van een verdachte mogen bepalen
- Nooit nagedacht over dat het instrument bedoeld was om misdaad te verminderen, maar dat
uiteindelijk het verminderen of vermeerderen van straffen ontstond.
- Scores gebruikt om te bepalen wanneer iemand vervroegd vrijgelaten wordt
- Andere factoren gebruiken in scores: type misdaad, banden met maatschappij
- Door de scores ontstaan moeilijkheden bij het vinden van bijvoorbeeld een baan = ongelijkheid en
privacy-schendend.

Artikel: Managing Threats: Used of Social Media for Policing Domestic Extremism and Disorder.

‘’ Gebruik van sociale media voor het toezicht op binnenlands extremisme en wanorde ‘’

‘’ Profielen van gedrag in de openbare ruimte die bekeken moeten worden ‘’


- Van reactiviteit naar proactiviteit
- Overheidsinstanties > big data analyse om te voorspellen, voorrang nemen en reageren in
werkelijkheid van sociale problemen
- Ontbreken van onderzoek > verschillende manieren waarop instanties gebruik maken van big data, en
verandert de manier waarop instanties onderzoeken, prioriteren en acteren in sociale en politieke
situaties
- Big data > efficiënt, rationeel en objectieve beslissing-making
- Maar ook onderdrukking, ongelijkheid en discriminatie
- Collectie van data > identificeren van problemen en potentiele dreigingen.
- Het gebruik van persoonlijke informatie is een zorg
- Hoe sociale media data gebruikt in het maken van beslissingen.

Het onderzoek onderzoekt twee sleutelgebieden van sociale media in beleidsmaking:

(1) De manier waarop sociale media communicatie en data geïdentificeerd zijn als potentiele
binnenlandse dreigingen
(2) De manier waarop het beleid wordt vormgegeven door middel van sociale media om deze
dreigingen te managen en minimaliseren


Doelen:

1. Begrijpen van de natuurlijke algoritmische geproduceerde intelligentie
2. Welke aspecten van social media gebruikt om binnenlands extremisme te identificeren
3. Hoe het beleid actief gecommuniceerd wordt op sociale media platforms

Resultaten:

- Gebruik van sociale media voor het maken van beleid voor binnenlands extremisme en wanorde >
actuele ontwikkeling



2

, - Toenemend gebruik van OSINT = Open Source Intelligence (informatie verzamelen via openbare
bronnen)
- Deze vorm van datacollectie meer proportioneel en eerlijk. Zorgt voor een substantiele bron voor
situatie-bewustzijn, voornamelijk in de aanloop van grote evenementen, zoals protesten en
demonstraties.
- Ondanks dat deze data als publiek geclassificeerd is, toch een aantal beperkingen voor de verzameling
van data voor beleidsdoeleinden. (hoe lang politie data kan bewaren etc)
- Politie maakt geen eigen software of algoritmes die voorspellende analyses maken. (door de
commerciele sector).

Politie gebruikt deze middelen in dezelfde wijze als marketing en sociale-wetenschappen onderzoek.

Voor het beleid omtrent protesten wordt data gefilterd en geanalyseerd om sleutelwoorden te identificeren:

- En dreigingswoorden: guns, flares, knife
- Risk-assessment
- Resourcing
- Speciale verzamelplekken van data
- Sentimentele analyses (stemming publiek)
- Big data analyse > geen geïsoleerde bedoeling, maar geïntegreerd met andere vormen van beleids-
intelligentie, zoals human intelligence en bestaande databases.
- Professionele jury’s

Social media gebruikt door politie voor strategieen:

- preventief arrest
- Onderschepping activiteiten
- Benadering bijzondere individuen en groepen
- Veranderen van tactieken tijdens evenementen

Gebruik van social media door politie om actief te betrekken en communiceren met potentiele dreigingen is
minder gangbaar.

Het gebruik van big data om samenlevingsbehoeften te identificeren en zorgen om inzet doeleinden als een
manier van beheer van binnenlands extremisme en wanorde is nog geen onderdeel van de politie praktijk. Er
is bezorgdheid over de hoeveelheid overlapping tussen intelligentie en betrokkenheid.

Uitdagingen big data:

- Geen overwegingen meegenomen over de gebruikers intentie en aard van de toestemming in
datacollectie en analyse
- Gat in kennis over algoritmes die voorspellende analyses produceren voor politieke doeleinden
creeren bezorgdheid over de verantwoording van politie tactieken gebaseerd op deze algoritmes
- Mate waarin deze kennis (gebruik commerciele en marketing-gedreven software) bruikbaar is voor
beleidsdoeleinden
- Menselijke input centraal in ontwerpen algoritme en analyseren van data > corrigeert imperfectie van
het systeem.
- Het opent mogelijkheden voor reeds bestaande menselijke biases om door te gaan met voorspellend
beleid met de bedoeling van een objectieve en neutrale data-analyse.
- In het bijzonder, vragen rondom de interpretatie van enige onvoorspelbaarheid in voorspellende
analyses als een risico, kunnen onnodige vormen van interventie door de politie veroorzaken.

Bevindingen kort samengevat:

1. Verschil publieke en private ruimte valt weg (overheid interacteert op het internet in de publieke ruimte)
2. Algoritmen om sociale media te volgen onbekend bij de politie
3. Algoritmen ontwikkeld voor marketing-doeleinden



3

,4. Algoritmen zijn niet neutraal, kan vooroordelen bevestigen; bovendien volgt altijd nog een menselijk
oordeel dat dit probleem vermindert of juist verergert
5. Handhaving en intelligence door private partijen
6. Lang niet iedereen is actief op social media, het is geen aselecte (proefpersonen zelfde kans om in
populatie te komen, willekeurig) steekproef, hoe is dit dan voorspellend te gebruiken?

Artikel: 7’V

- Big data op grote schaal
- Nieuwe inzichten verkrijgen
- Nieuwe vormen van economische waarde
- Invloed op markten, organisaties en relatie tussen burger en overheid
- Verwerking en verzameling grotere computerkracht vereist
- Wanneer de technologie de grootte van data niet meer aan kan
- Technologie tegenwoordig > grote hoeveelheden data analyseren en interpreteren. Gedrag van
mensen preciezer geanalyseerd en voorspeld worden.

(1) Volume = Omvang en verwerkingscapaciteit

- Verzameling blijft toenemen
- Computercapaciteit voor opslag en verwerking eveneens

(2) Variety = Gebruik meerdere datasets en verschillende soorten data

- Structuur data, tijdstip, mate openbaarheid
- Variatie aan gegevens die opgeslagen, verwerkt en geanalyseerd worden
- GPS data, medische dossiers etc.
- Ongestructureerde gegevens maken verwerking/categorisering complex

(3) Velocity = Verandersnelheid

- Hoe up-to-date zijn resultaten
- Weergave van het moment
- Real time
- Verandersnelheid van gegevens en verwijst naar tijdelijke waarde van deze gegevens

Hoe groter deze drie V’s, moeilijker een oplossing vinden voor technische vraagstukken, maar grotere
kansen voor de voorspellende waarde van big data

Door de snelle ontwikkeling in sociale netwerken, mobiele technologie, cloud putting en integratie van
communicatiekanalen 4 nieuwe V’s toegevoegd.

(4) Viscosity = Traagheid bij navigatie door gegevens

- Door verscheidenheid aan bronnen of complexiteit benodigde verwerking

(5) Virality = Snelheid gegevens door netwerk verspreiden

- Tijd
- Verspreidingssnelheid
- Andere snelheid dan velocity (= up to date resultaten)

(6) Veracity = Waarheidsgetrouwheid gegevens

- Kwaliteit en oorsprong gegevens
- Aanmerken als twijfelachtig, conflicterend, niet zuiver
- Informatie waarvan men niet zeker weet hoe ermee om te gaan



4

,(7) Value = Waarde uit gegevens

- Welke waarde uit gegevens halen
- Hoe met big data betere resultaten krijgen uit opgeslagen gegevens

Artikel: Big data in een vrije en veilige samenleving

- Verantwoord gebruik van Big data door Nederlandse overheid
- Big data analyses door politie, justitie, inlichtingen en veiligheidsdiensten en verschillende organisaties
en samenwerkingsverbanden op gebied van fraudebestrijding
- Big data kansen voor opsporing en surveillance
- Big data vraagt om sterkere waarborgen voor vrijheidsrechten van burgers
- Zwaartepunt in huidige juridische regelgeving ligt op regulering van het verzamelen van data.
- Bestaande wetgeving aanvullen met regulering van en toezicht op de fases van (1) analyse en (2)
gebruik van big data

Big data en veiligheid:

- Hoeveelheid beschikbare data toegenomen > veel data automatisch geproduceerd en bijproduct van
dagelijkse handelingen (internet, social media)
- Handelingen individuen geregistreerd
- Opslagcapaciteit neemt toe, kosten nemen af
- Combinatie krachtige computer, betere software, zelflerende algoritmen en machine learning biedt
kansen voor big data
- Koppelen van databases > nieuwe praktische bruikbare kennis. (door overheid en private partijen)
- Geheimhouding en experimentele karakter > vermoeilijkt manifestatie
- Kleine organisaties minder behoefte om grootschalige data-gedreven analyses uit te voeren.

Kansen en risico’s:

Kansen
- Criminaliteit (fraude) > positieve resultaten met inzet big data
- Geautomatiseerde analyse van grote gecombineerde gegevensbestanden levert tijdswinst op
- Mits zorgvuldig uitgevoerd > nauwkeurige uitkomsten (gerichte inspecties)
- Reconstructie aanslagen en criminele netwerken in kaart brengen > opsporing daders beter.
- Behulpzaam zijn bij real time volgen van ontwikkelingen in crisissituaties en crowd control bij
evenementen > goed beeld situatie ter plaatse
- Steeds verdere koppelingen van databronnen
- Grens tussen data uit publieke en private bronnen zal vervagen

Risico’s:

- Grootschalige inmenging in persoonlijke levenssfeer
- Privacy en vrije meningsuiting in gevaar (gevoel) > waardoor zij hun gedrag aanpassen
- Profielen, algoritmen en methoden van big data door de overheid nauwelijks transparant of volgbaar
- Gebrek transparantie
- Toename sociale stratificatie = ongelijkheidsverhouding tussen maatschappelijke groepen
- Dit gebeurt doordat big data onregelmatigheden en afwijkingen in datasets kan reproduceren,
resulterend in uitkomsten die een onevenredige sociale impact hebben. Zonder correctie leidt dit op
termijn tot een cumulatief nadeel (discriminatie en oneerlijke behandeling).
- Big data toepassingen gevoelig voor function creep > gebruik van data voor andere doeleinden dan
waarvoor ze zijn verzameld. (secundair gebruik data levert een grote meerwaarde).




5

,Mismatch tussen big data en huidige wet- en regelgeving:

- Juridische kaders van gegevensverwerking > gericht op verzameling en deling
- Belangrijke uitgangspunten onder druk > doelbinding en noodzakelijkheid

Big data = Gebaseerd op principe van ongerichte gegevensverzameling en secundair gebruik van reeds
verzamelde gegevens voor andere doeleinden, hetgeen botst met regelgevende kaders.

- Wettelijke normen voor verzameling gegevens vereisen aanvulling
- Verzwaren huidige kader > nadruk op regulering van verzamelen en handhaving van doelbinding en
noodzakelijkheid

Versterking van de regulering van fases van analyse en gebruik van big-data processen (in plaats van het
zwaarder reguleren van het verzamelen van gegevens (wat het principe van Big data onderuit zou halen).

Regulering van data-analyse en gebruik:

Hiaat in regelgeving = keuzes in de analysefase van eminent belang (algoritme, categorisering, wegingsfactor).

Hier doen zich risico’s voor zoals:

- Discriminatie
- Te veel pretenderende gegevensanalyses
- Negatieve sociale effecten op persoonlijke vrijheden (vrije meningsuiting) die een vitale rol spelen in
democratische rechtsstaat.

Aanvullende normering nodig:

Wettelijk omschreven zorgplicht = algemene vereisten kwaliteit data en deugdelijkheid gehanteerde
analysemethoden.

- Duidelijk maken hoe gegevensverwerkende partijen tot bepaalde uitkomsten komen
- Externe review door toezichthouder (audits aanscherpen bij gebreken)
- Autoriteit Persoonsgegevens en de Commissie van Toezicht op de Inlichtingen en Veiligheidsdiensten
CTIVD hun technische en statistische capaciteit en expertise versterken
- Vooraf evaluatiemoment
- Horizon van 3 tot 5 jaar voor grote big data toepassingen
- Problematiek rond samenstellen van profielen. Kracht van big data ligt in algemene conclusies en
structurele patronen.
- Bij de toepassing daarvan op concrete situaties en specifieke individuen bestaat altijd een mismatch,
omdat een profiel zowel over- als onder-inclusief is
- Profileren strakker reguleren (regels toelaatbare foutmarges) e.d.
- Voorkomen van geautomatiseerde besluitvorming
- Juridisch verankeren dat data-analyses en profielen niet leiden tot een feitelijke verlegging van de
bewijslast.

Toezicht, transparantie en rechterlijke toetsing:

- Versteviging van onafhankelijke toezicht
- Toezicht op gegevensverwerking slecht > onvoldoende toegerust in bevoegdheden, expertise en
financiele middelen
- Door nieuwe Europese verordening gegevensbescherming > bevoegdheden en middelen Autoriteit
Persoonsgegevens verstevigd > toch nationale invulling vereist.
- Transparantie > te vaak nog een blackbox
- Individuen kunnen vaak niet weten dat over hen gegevens zijn verzameld en zullen dus niet zo snel
hun informatierecht inroepen.



6

, - Grotere mate van transparantie (ondanks geheimhouding in sommige sectoren)
- Convenanten en besluiten over gegevensverwerking niet erg toegankelijk, wel openbaar
- Organisaties en big data > beleidsplan opstellen (welke methoden, kosten, en resultaten)
- Beschikbaarheid en verantwoording van deze informatie > grotere maatschappelijke
aanvaardbaarheid
- Positie NGO’s en burgerrechtenorganisaties in juridische procedures versterken
- Beperkte mogelijkheden voor collectieve procedures bij rechter na privacy-schending (vooral
individueel)
- Te weinig mogelijkheden om besluitvorming op basis van Big data processen te bevragen zolang zij
geen gezamenlijke persoonlijke benadeling kunnen aanvoeren
- Rechter > selectief zaken toelaten die recht doen aan collectieve zorgen en bijdragen aan de opbouw
van jurisprudentie.

Reactie op WRR rapport big data in een vrije en veilige samenleving: (Efficiency-voordelen overheid niet de
privacy-rechten van burgers overschrijden)

Zorgen over:

1. Ongerichte surveillance en gebrek aan doelbinding (uitgangspunten rechtsstaat)
2. Ontbreken van noodzaak (aantonen noodzaak bij iedere inbreuk op privacy)
3. Schadelijke effecten binnen een democratische rechtsstaat:

A: Vrije meningsuiting en zelfcensuur (individuen zichzelf beperkingen opleggen)

B: Verstoring relatie tussen overheid en burger (inmenging persoonlijke levenssfeer)

C: Individuele rechtsbescherming in het gedrang (bewijzen ten onrechte met een profiel te zijn geassocieerd)

D: Vals positieven (maatschappelijk slecht te legitimeren, mensen plaatsen in hokjes/onterecht label)

E: Institutionele vooroordelen (datasets samengesteld door mensen met menselijke vooringenomenheid)

F: Vertrouwen in digitale communicatie aangetast (wantrouwen richt maatschappelijke schade aan, verlies
vertrouwen digitale infrastructuur)


- Big data is niet nieuw

Twee fundamentele problemen: ongerichte surveillance en gebrek aan doelbinding

Overheidsuitgangspunt: ‘’ Een burger die niets verkeer doet wordt niet in de gaten gehouden ‘’

- Gerichte surveillance wordt losgelaten, evenals doelbinding.

Beiden vormen een groot probleem met het mensenrechtelijk kader, meer specifiek gaat het voorbij aan het
recht op respect voor het privéleven, zoals vastgelegd in artikel 8 EVRM.

Ontbreken noodzaak > noodzaak big-data toepassingen nergens aangetoond.

‘’ De overheid kan niet ontslagen worden van haar plicht tot het aantonen van de noodzaak van iedere
inbreuk op de privacy van de burger, enkel door de ontwikkeling van de technologische mogelijkheden ‘’.

Chilling effect = Mensen die zich bekeken voelen, passen hun gedrag aan naar door hen als wenselijk
gepercipieerd gedrag.

- Effect treedt het sterkst op bij kwetsbare groepen




7

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lucasbonset. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €4,48. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 64438 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€4,48  1x  verkocht
  • (2)
  Kopen