100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Data science 1 - theorie P3 €5,99   In winkelwagen

Samenvatting

Samenvatting Data science 1 - theorie P3

 18 keer bekeken  0 keer verkocht

Een samenvatting van de theorie van data science 1 uit periode 3 van toegepaste informatica aan kdg.

Voorbeeld 4 van de 89  pagina's

  • 17 januari 2023
  • 89
  • 2021/2022
  • Samenvatting
Alle documenten voor dit vak (4)
avatar-seller
compie
DATA SCIENCE
P3




KDG | 2021-22

,Inhoudsopgave

1. Data Science Inleiding ................................................................................................................................. 4

1.1 Wat is data?.................................................................................................................................................. 4
1.1.2 Klassieke opdeling van data .................................................................................................................. 4
1.1.3 Andere, nieuwere opdeling van data .................................................................................................... 5
1.1.4 Big data ................................................................................................................................................. 6
1.1.5 Smart data ............................................................................................................................................ 7

1.2 Meetschalen of meetniveaus ........................................................................................................................ 7
1.2.1 De verschillende meetschalen .............................................................................................................. 8
1.2.2 Bepalen van de meetschaal .................................................................................................................. 9
1.2.3 Wat mag en wat mag niet? ................................................................................................................. 11

1.3 Discrete en continue variabelen.................................................................................................................. 13

1.4 Betrouwbaarheid en validiteit van data ..................................................................................................... 13

1.5 Hoe uit data informatie halen? ................................................................................................................... 15
1.5.1 Business Intelligence (BI) .................................................................................................................... 16
1.5.2 Data Analytics ..................................................................................................................................... 16

2 Data Science Processes .............................................................................................................................. 17

2.1 Wat is Data Science? .................................................................................................................................. 17
2.1.1 Data Science vs. Statistics vs AI vs ...................................................................................................... 17
2.1.2 Wat doet een data scientist (en wat doet hij niet)? ........................................................................... 18

2.2 De levenscyclus van een ‘Data Science’-project .......................................................................................... 18

2.3 Data Science Pipeline .................................................................................................................................. 19
2.3.1 Collecting Data .................................................................................................................................... 20
2.3.2 Data Engineering ................................................................................................................................. 20
2.3.3 Data Modeling .................................................................................................................................... 21
2.3.4 Information Distilation ........................................................................................................................ 21

3. Programmeren met Python ....................................................................................................................... 22

3.1 Algemene kenmerken ................................................................................................................................. 22

3.2 Bibliotheken in Python ................................................................................................................................ 22

3.3 Python als rekenmachine ............................................................................................................................ 23

3.4 Variabelen................................................................................................................................................... 23
3.4.1 IEEE 754 .............................................................................................................................................. 24

3.5 Lijsten van gegevens ................................................................................................................................... 25
3.5.1 Python list ........................................................................................................................................... 25
3.5.2 Numpy array ....................................................................................................................................... 27
3.5.3 Pandas series ...................................................................................................................................... 28

3.6 Kwalitatieve gegevens ................................................................................................................................ 30

3.7 Data frames ................................................................................................................................................ 31
3.7.1 Aanmaken ........................................................................................................................................... 31

1

, 3.7.2 Lezen en manipuleren......................................................................................................................... 32
3.7.3 Inlezen en wegschrijven ...................................................................................................................... 34
3.7.4 CVS bestanden .................................................................................................................................... 34

3.8 Functies ....................................................................................................................................................... 36
3.8.1 Functies declareren............................................................................................................................. 36
3.8.2 Parameters.......................................................................................................................................... 37
3.8.3 Controlestructuren ............................................................................................................................. 38
3.8.4 Functies als parameter........................................................................................................................ 39

4. Data management .................................................................................................................................... 40

4.1 Bibliotheken ................................................................................................................................................ 41

4.2 Voorbeeld ................................................................................................................................................... 41

4.3 Inlezen van bestanden ................................................................................................................................ 42

4.4 Ontbrekende waarden ................................................................................................................................ 45
4.4.1 bij het inlezen...................................................................................................................................... 46
4.4.2 Bij het omzetten ................................................................................................................................. 47
4.4.3 Omgaan met ontbrekende waarden................................................................................................... 48

4.5 Verkeerde waarden wijzigen ...................................................................................................................... 49
4.5.1 Vervangen ........................................................................................................................................... 49
4.5.2 Delen vervangen ................................................................................................................................. 49

4.6 Datatypes.................................................................................................................................................... 50

4.7 Datums en tijdstippen ................................................................................................................................. 52

4.8 Groeperen van data .................................................................................................................................... 53

4.9 Samenvoegen van data .............................................................................................................................. 54

4.10 Samenvatting............................................................................................................................................ 56

5. Frequenties ............................................................................................................................................... 56

5.1 Bibliotheken ................................................................................................................................................ 56

5.2 De ruwe gegevens....................................................................................................................................... 56

5.3 Absolute frequenties ................................................................................................................................... 58

5.4 Klassen ........................................................................................................................................................ 59

5.5 Relatieve frequenties .................................................................................................................................. 61

5.6 Cumulatieve frequenties ............................................................................................................................. 62

5.7 Cumulatieve percentages ........................................................................................................................... 63

5.8 Grafieken .................................................................................................................................................... 64
5.8.1 Tekenen met matplotlib ..................................................................................................................... 64
5.8.2 Taartdiagrammen ............................................................................................................................... 66
5.8.3 Staafdiagrammen en histogrammen .................................................................................................. 66
5.8.4 Andere voorstellingen......................................................................................................................... 69



2

, 6. Centrum- en sprijdingsmaten .................................................................................................................... 70

6.1 Bibliotheken ................................................................................................................................................ 70

6.2 De ruwe gegevens....................................................................................................................................... 70

6.3 Centrummaten ............................................................................................................................................ 71
6.3.1 Modus ................................................................................................................................................. 71
6.3.2 Mediaan .............................................................................................................................................. 72
6.3.3 Rekenkundig gemiddelde ................................................................................................................... 74
6.3.4 ............................................................................................................................................................. 76

6.4 Spreidingsmaten ......................................................................................................................................... 78
6.4.1 Bereik .................................................................................................................................................. 79
6.4.2 Interkwartielafstand ........................................................................................................................... 79
6.4.3 Standaardafwijking ............................................................................................................................. 81

6.5 Uitschieters ................................................................................................................................................. 83

6.6 Eigenschappen ............................................................................................................................................ 86
6.6.1 Transformaties .................................................................................................................................... 86

6.6.2 Z-scores .................................................................................................................................................... 87
6.6.3 Links en rechtse scheefheid ................................................................................................................ 88




3

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper compie. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 62890 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,99
  • (0)
  Kopen