100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Data Sience (python + statistiek) $7.92
Add to cart

Summary

Samenvatting Data Sience (python + statistiek)

1 review
 24 views  1 purchase
  • Course
  • Institution

Dit is een nette en ordelijke samenvatting van een uitgebreide cursus, voornamelijk theorie. In deze samenvatting zit zowel statistiek als python verwerkt. Wat Data Science nu net is lees je hieronder! Datawetenschap, vaak ook onvertaald in het Engels: data science, is een interdisciplinair onde...

[Show more]

Preview 4 out of 60  pages

  • January 4, 2023
  • 60
  • 2021/2022
  • Summary

1  review

review-writer-avatar

By: amaviyaovi • 1 year ago

avatar-seller
THEORI DATA SIENCE
E



Deel 1




INLEIDING
 Data Sience draait rond het werken met en het analyseren van “data” = gegevens

Waarom?
 Data scientist als carrière
 Als IT-er ondersteun je de business
o Veel data zit in databanken
o Meer en meer real-time data
o Noodzaak om trends, verbanden, .. te zoeken in data om aan de beslissingsnemers business
relevante informatie op te leveren
 Als IT-er heb je zelf behoefte aan informatie
 Als IT-er bied je services aan, aan je interne en externe klanten of gebruikers
 Als IT-er dien je de IT services geleverd door jou IT-leveranciers op te volgen



SITUERING

WAT IS DATA?
 Data type
o Transactionele data
 veranderd voortdurend en betreft dagdagelijkse businessactiviteiten
 beschrijft gebeurtenissen
o Master data
 data die niet vaak verandert en wordt door de business steeds op dezelfde manier
gebruikt
o Analytische data
 date over de performantie van de business




[NAAM VAN AUTEUR] 1

, Soort data
o Structured data
 Georganiseerd
 vooraf gedefinieerd data model
 Informatie in rijen en kolommen
 makkelijke tocumegang en gebruik
 Efficiënt om te analyseren
 naam of adres van een klant

o Unstructured data
 ongeorganiseerd – onsamenhangend en verspreid
 niet vooraf gedefinieerd data model
 moeilijke toegang en gebruik
 preprocessing vooraleer het kan gebruikt worden in de analyse

 Nieuwe opdelingen van data
o ‘schema-then-capture’-data
 hierbij wordt eerst bepaald welke data men nodig heeft voor een analyse om
vervolgens deze data te gaan verzamelen

o ‘capture-first-ask-question-later’-date
 hierbij wordt data verzameld om achteraf te kijken welke vragen/analyses men met
deze data zou kunnen beantwoorden

o streaming data
o static data

o attitudinal data
 weerspiegelen het belang dat een klant hecht aan bepaalde eigenschappen van
aangeboden producten en diensten
 Hoe voelt een klant zich?

o behavioural data
 omvat onder andere het koopgedrag en merkvoorkeur van consumenten en wordt
gebruikt om promotiecampagne uit te werken
 Wat doet een klant?

o demographic data
 data die sociaaleconomisch van aard is, zoals de populatie, ras, inkomen onderwijs
en werkgelegenheid, die specifieke geografische locaties vertegenwoordigen en vaak
geassocieerd is met de tijd
 Wie is de klant?




[NAAM VAN AUTEUR] 2

,  Big data
o datasets met een omvang ie buiten het vermogen vallen
o 3V-model
 het dient aan 2 van de 3 eigenschappen te voldoen
 een hoge data velocity
o de snelheid waaraan data gegenereerd, gecapteerd en/of afgeleverd
wordt
 een groot volume
 een grote variëteit
o diversiteit, data komt van vele verschillende bronnen en zit in
meerdere databanken in niet uniforme vormen
o De essentie van wat ‘big data’ is, komt neer op het feit dat
gewone of gebruikelijke dataverwerking er niet op
toegepast kan worden

 Smart data
o niet altijd valide
o kan onvolledig zijn
o kan inconsistenties bevatten
o data enrichment/management
 de selectie (capteren, verzamelen), opkuisen / zuiveren (verifiëren, valideren
corrigeren), verwerking (classificeren, transformeren) en voorbereiding (in juiste
formaat zetten) van data om te komen tot smart data is arbeids- en tijdsintensief
o de selectie zorgt voor relevante data
o opkuisen / zuiveren zorgt voor correcte data
o het verwerken en voorbereiden zorgt voor computer verwerkbare data


WAT ZIJN MEETSCHALEN? / WAT ZIJN MEETNIVEAUS?
 Verschillende soorten ruwe data
 De soort bepaald wat je al dan niet wiskundig met de data kan doen
 Deze soorten zijn meetniveaus, maar worden ook wel meetschalen genoemd

 Meetniveaus
o kwalitatieve
 kan niet worden uitgedrukt in getallen
 bepaald meestal een categorie
o kwantitatieve
 wordt voorgesteld door getallen

 Kwalitatieve gegevens
o nominaal
 iedere waarde is een omschrijving (String)
 onderscheidingsvermogen
 man-vrouw




[NAAM VAN AUTEUR] 3

,  afstudeerrichting
 groenten


o ordinaal
 iedere waarde is een omschrijving (String)
 onderscheidingsvermogen
 er bestaat een grootte orde
 natuurlijke ordening
o rangen in het leger
o tevredenheidsscores

 Kwantitatieve gegevens
o interval
 iedere waarde is een getal
 onderscheidingsvermogen
 er bestaat een grootte orde
 er is een meeteenheid
 je kan enkel over verschillen spreken
 negatieve getallen zijn ook mogelijk
 ofwel bestaat er een meetinstrument (thermometer) ofwel is er een “fysieke” eenheid
dat geteld kan worden (euro’s)
o ratio
 iedere waarde is een getal
 onderscheidingsvermogen
 er bestaat een grootte orde
 er is een meeteenheid
 er is een absoluut nulpunt
 je kan ook over verhoudingen spreken
 negatieve getallen zijn niet mogelijk
 temperatuur in Kelvin
 aantal liter geproduceerde wijn

 Verschillende meetschalen
o een eigenschap kan op vier verschillende meetniveaus, ook wel meetschalen genoemd,
gemeten worden
o een meetniveau of meetschaal wordt gedefinieerd aan de hand van de aanwezigheid of
afwezigheid van vier karakteristieken
 onderscheidingsvermogen
 indien het verschillende getallen aan verschillende waarden van de
eigenschap toekent
 grootteorde
 indien grotere getallen een grotere aanwezigheid van de eigenschap
weergeven
 meeteenheid
 aanwezig indien gelijke verschillen tussen getallen eenzelfde verschil in de
eigenschap weergeven
 absoluut nulpunt
 wanneer het getal 0 de afwezigheid van de eigenschap weergeeft




[NAAM VAN AUTEUR] 4

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller anouckcelis. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $7.92. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

52510 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$7.92  1x  sold
  • (1)
Add to cart
Added