Summary

CADC samenvatting van de lectures mét oefentoets

Rating

Sold

Pages

Uploaded on

15-12-2024

Written in

2024/2025

Het is een uitgebreide samenvatting van alle onderwerpen die nodig zijn om te weten voor het behalen van het tentamen. Er zit ook een begrippenlijst bij en een oefentoets van 30 vragen. Ik heb het hiermee in een keer kunnen halen icm de samenvatting van de literatuur bronnen.

Show more Read less

Institution

Module

Whoops! We can’t load your doc right now. Try again or contact support.

Report Copyright Violation

Written for

Institution: Vrije Universiteit Amsterdam (VU)
Study: Communicatiewetenschap
Module: Computational Analysis of Digital Communication (S_BDCT)

All documents for this subject (18)

Document information

Uploaded on: December 15, 2024
Number of pages: 11
Written in: 2024/2025
Type: Summary

Subjects

cadc
statistiek
lectures
dictionary approach
large language models
practice exam
vu
master communicatiewetenschap

Content preview

Uitgebreide Samenvatting over Geautomatiseerde Tekstanalyse obv de
hoorcolleges

Woordenboekbenaderingen

 Woordenboekbenaderingen classificeren tekst door te zoeken naar specifieke woorden of
woordgroepen die geassocieerd worden met een bepaald concept of sentiment.
 Een veelgebruikt voorbeeld is sentimentanalyse, waarbij positieve en negatieve woorden
worden geteld om het algemene sentiment van een tekst te bepalen.
 De bronnen benadrukken het belang van validatie bij het gebruik van
woordenboekbenaderingen. Dit houdt in dat de resultaten van de geautomatiseerde analyse
worden vergeleken met handmatig gecodeerde gegevens (de 'gouden standaard') om de
nauwkeurigheid en betrouwbaarheid te beoordelen.

Voordelen van Woordenboekbenaderingen:

 Eenvoudig te implementeren en te repliceren.
 Transparant, vooral wanneer het woordenboek wordt gedeeld.
 Efficiënt, met weinig middelen nodig.

Nadelen van Woordenboekbenaderingen:

 Lage validiteit voor complexe concepten, omdat ze gebaseerd zijn op eenvoudige
woordenlijsten.
 Vereisen mogelijk aanzienlijke voorbewerking van de tekst om ambiguïteit te verminderen.
 Moeilijk om grote woordenboeken te maken en te onderhouden.
 Kunnen vooroordelen coderen die aanwezig zijn in de gebruikte gegevens.

Machine learning-technieken:

 Machine learning-algoritmen, zoals neurale netwerken en support vector machines (SVMs),
kunnen worden getraind om tekst te classificeren op basis van een reeks gelabelde
voorbeelden.
 Deze algoritmen leren patronen in de gegevens om voorspellingen te doen over nieuwe,
ongeziene teksten.
 Word embeddings, zoals GloVe, worden gebruikt om woorden te representeren als vectoren
in een multidimensionale ruimte, waarbij woorden met vergelijkbare betekenissen dicht bij
elkaar liggen.
 Het gebruik van word embeddings kan de snelheid en prestaties van machine learning-
modellen verbeteren.

Voordelen van Machine Learning Technieken:

 Generalisatie: Machine learning modellen kunnen generaliseren naar nieuwe, ongeziene
data. Dit betekent dat ze patronen kunnen herkennen in de trainingsdata en deze kennis
kunnen toepassen op nieuwe teksten.

,  Aanpassingsvermogen: Machine learning modellen kunnen worden aangepast aan
specifieke taken en datasets. Door de parameters van het model te optimaliseren, kan de
prestatie voor een bepaalde taak worden verbeterd.
 Schaalbaarheid: Machine learning modellen kunnen worden gebruikt om zeer grote
datasets te analyseren, wat met handmatige codering onmogelijk zou zijn.

Nadelen van Machine Learning Technieken:
 Data-afhankelijkheid: De prestatie van machine learning modellen is sterk afhankelijk van
de kwaliteit en kwantiteit van de trainingsdata. Onvoldoende of vertekende trainingsdata
kan leiden tot onnauwkeurige of bevooroordeelde modellen.
 Zwarte doos: Sommige machine learning modellen, zoals neurale netwerken, zijn complexe
'zwarte dozen'. Het is moeilijk om te begrijpen hoe deze modellen tot hun voorspellingen
komen, wat de interpretatie van de resultaten kan bemoeilijken.
 Computationele kosten: Het trainen van machine learning modellen kan computationeel
duur zijn, vooral voor complexe modellen en grote datasets.

Large Language Models (LLMs):

 LLMs, zoals GPT en Llama, zijn getraind op enorme datasets en kunnen taken uitvoeren zoals
tekstgeneratie, vertaling en vraagbeantwoording.
 Ze kunnen ook worden gebruikt voor tekstanalyse, inclusief zero-shot classificatie, waarbij
het model een taak kan uitvoeren zonder specifieke training op die taak.

Belangrijke Overwegingen:

 De bronnen benadrukken het belang van het kiezen van de juiste benadering voor de
specifieke onderzoeksvraag.
 Zowel woordenboekbenaderingen als machine learning-technieken hebben hun eigen voor-
en nadelen.
 Het is belangrijk om de validiteit van geautomatiseerde tekstanalyses te evalueren en de
ethische implicaties te overwegen.

Rol van Prompt Engineering bij LLMs:
 Zero-shot, one-shot en few-shot learning: De manier waarop een taak wordt geformuleerd
in de prompt heeft invloed op de prestatie van het LLM. Zero-shot classificatie werkt soms
goed omdat het model niet te sterk gebonden is aan specifieke voorbeelden.
 Belang van context: LLMs zijn gevoelig voor de context van de prompt. Het is belangrijk om
de taak duidelijk en ondubbelzinnig te beschrijven en eventueel voorbeelden te geven.

Validatie en Evaluatie:
 Vergelijking met gouden standaard: De validiteit van geautomatiseerde tekstanalyse moet
worden geëvalueerd door de resultaten te vergelijken met een gouden standaard van
handmatig gecodeerde data. Dit helpt om de nauwkeurigheid en betrouwbaarheid van de
gebruikte methode te beoordelen.
 Prestatiematen: Verschillende prestatiematen, zoals nauwkeurigheid, precisie, recall en F1-
score, kunnen worden gebruikt om de prestatie van geautomatiseerde tekstanalyse te
kwantificeren.

Uitdagingen en Beperkingen:
 Interpreteerbaarheid: Het interpreteren van de resultaten van geautomatiseerde
tekstanalyse kan een uitdaging zijn, vooral voor complexe modellen.

$8.78

Get access to the full document:

100% satisfaction guarantee

Immediately available after payment

Both online and in PDF

No strings attached

Get to know the seller

daniellemk

Get to know the seller

daniellemk Hogeschool InHolland

View profile

Sold

Member since

6 year

Number of followers

Documents

Last sold

1 month ago

0.0

0 reviews

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these revision notes.

Didn't get what you expected? Choose another document

No problem! You can straightaway pick a different document that better suits what you're after.

Pay as you like, start learning straight away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

“Bought, downloaded, and smashed it. It really can be that simple.”

Alisha Student

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller daniellemk. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $8.78. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews) 41730 documents were sold in the last 30 days Founded in 2010, the go-to place to buy revision notes and other study material for 15 years now

CADC samenvatting van de lectures mét oefentoets

Written for

Document information

Subjects

Content preview

Get to know the seller

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Didn't get what you expected? Choose another document

Pay as you like, start learning straight away

Frequently asked questions

What do I get when I buy this document?

Satisfaction guarantee: how does it work?

Who am I buying these notes from?

Will I be stuck with a subscription?

Can Stuvia be trusted?