Dit is een samenvatting van énkel de syllabus van ATW2 deel 2 computerlinguïstiek. De doorlopende tekst uit de syllabus omgevormd tot een schematische en makkelijk-begrijpbare samenvatting. (inclusief gastcollege over terminologie)
15 november HC 1 - Inleiding, voorbeelden, Artificiële Intelligentie
22 november HC 2 - Ambiguïteit, methodes & modules
29 november HC 3 - Modules, toepassingen & casussen
6 december HC4 - Toepassingen & casussen
13 december HC 5 - QA cursus, AI & Taalcreativiteit
DEEL 1 – doelstellingen, methodes, problemen & toepassingen
1. Inleiding
Resultaten van onderzoek in de computerlinguïstiek
Google Translate – laat toe om gevonden webpagina’s in vreemde talen automatisch te vertalen
SIRI van Apple – maat toe gesproken vragen te stellen en spraakcommando’s te geven.
Onderzoek in de computerlinguïstiek dat zijn ingang heeft gevonden in alledaagse toepassingen met
wisselend succes bij de gebruikers ervan.
o We gaan het hebben over doelstellingen, methodes, problemen en toepassingen van de
COMPUTERLINGUÏSTIEK
TAAL
uniek menselijke eigenschap die toelaat m.b.v. eindige middelen
(beperkt aantal fonemen en morfemen) een oneindige hoeveelheid aan
ideeën, gevoelens en betekenissen te communiceren
het belangrijkste medium voor de opslag en communicatie van kennis
Doel van Taal- en Spraaktechnologie is om systemen te ontwikkelen die mensen toelaten om in hun eigen
taal te communiceren met computers en informatiesystemen, en systemen die in staat zijn om spraak en tekst te
begrijpen en te produceren
1
, 1.1. Taal- en spraaktechnologie (TST) in de computerlinguïstiek
Tekst & Spraak zijn twee verschillende verschijningsvormen van dezelfde informatie die traditioneel op
verschillende manieren worden bestudeerd in computerlinguïstiek – TST
Spraaktechnologie Taaltechnologie
Probleem v.d. spraaktechnologie Automatisch omzetten van tekst naar betekenis
en omgekeerd.
Spraakherkenning; het automatisch omzetten
van spraak naar tekst
Spraaksynthese; het automatisch omzetten
van tekst naar spraak
Bij automatische vertaling wordt een tekst in de ene taal geanalyseerd en de resulterende betekenis
wordt geproduceerd in een andere taal.
2
,SPRAAK; het produceren (spraaksynthese) en herkennen (spraakherkenning) van spraak is het
domein van de ingenieurs.
o Het gaat hier om de ontwikkeling van transformaties tussen tekst en spraak. LET OP – het
gaat niet om het begrijpen of produceren v.d. inhoud van de tekst.
spraaksynthese redelijk goed opgelost probleem voor de meeste talen MAAR, nog steeds
onderzoek nodig voor ontwikkeling van systemen die ‘natuurlijk’ klinken (vb.
intonatie of bij expressie van emoties)
spraakherkenning onderzoek naar spraakherkenning heeft bruikbare systemen opgeleverd voor
dicteertoepassingen (dictation).
Wat gebeurt daar? – spraakherkenner wordt ‘getraind’ op de stem v.d.
gebruiker ervan, eventuele fouten kunnen onmiddellijk gecorrigeerd wordne
door die gebruiker, die ook het woordenboek v.h. systeem kan uitbreiden.
Deze factoren en de gecontroleerde omstandigheden waarin ze worden
gebruikt (goede microfoon, rustige kamer, zorgvuldig uitgesproken spraak)
maken dat dicteersystemen redelijk accuraat zijn.
Er wordt nog steeds veel onderzoek gedaan naar spraakherkenners die spontane spraak van
meerdere personen kunnen onderscheiden en omzetten (transcriberen) naar tekst.
WAAROM? – ze zijn voor de meeste toepassingen nog niet accuraat genoeg, vooral als verschillende
mensen tegelijk praten of er te veel achtergrondgeluid is.
Bedrijven als Google investeren in spraaktechnologie voor …
1) zoekmachine via spraak kan gebruikt worden in mobiele
toepassingen
2) automatische transcriptie (ondertiteling) van Youtube-filmpjes
Misschien helpt de kennis over hoe mensen spraak herkennen om de kwaliteit te verbeteren?
We gaan niet verder in op de spraaktechnologie en houden ons hier alleen bezig met processen
tussen TEKST & BETEKENIS; taaltechnologie, syn. computerlinguïstiek)
o Binnen die taaltechnologie kijken we uitsluitend naar begrijpen van taal, niet naar productie
ervan. Het produceren van tekst is gemakkelijker dan het begrijpen van tekst, hoewel ook
daar veel onderzoeksproblemen overblijven.
3
, 1.2. Theoretische en toegepaste computerlinguïstiek (CL)
1.2.1. Computerlinguïstiek: een definitie
Wat is computerlinguïstiek? – is een wetenschapsgebied dat het menselijk taalsysteem bestudeert
vanuit computationeel perspectief.
Fundamentele vragen i.d. discipline; leunen hard aan bij die van de taalkunde & psycholinguïstiek
o Hoe wordt tekst omgezet naar betekenis en omgekeerd
o Hoe wordt taalkennis verworven
Belangrijkste verschil met taalkunde is de methode.
TAALKUNDE – theorieën ontwikkelen en toetsen door
corpusonderzoek, experimenten en introspectie
CL – onderzoekt onderzoeksvragen door het bouwen
en toetsen van computermodellen, het sluit beter aan
bij AI dan bij taalkunde
Wat is AI? – Artificial intelligence is een onderdeel v.d. computerwetenschappen dat zich bezighoudt
met het ontwikkelen van computationele modellen van perceptie, cognitie en actie in intelligente
systemen.
Doel; programma’s maken die in staat zijn dingen te doen die wij intelligent vinden als mensen ze
doen.
VB. medische diagnose, schaak op topniveau, vertaling van teksten …
MAAR OOK, dingen die wij heel normaal vinden als mensen ze doen, maar die voor computers/robots
moeilijk zijn
VB. taal begrijpen, evenwicht houden op hellend vlak, fietsen, …
“Intelligent Agent” = organiserend concept binnen AI als wetenschap
Een programma dat zijn omgeving kan waarnemen, kennis heeft (en dus een geheugen), problemen
kan oplossen, leren, en actie kan ondernemen (vb. iets zeggen: speech acts genereren), m.a.w. een
rationeel ding.
o Concept: “bounded rationality” – een IA (intelligent agent) kan zich maar zo slim gedragen
als de kennis die hij heeft toelaat. Hoe meer kennis een IA heeft of zelf kan verwerven > hoe
rationeler zijn gedrag zal zijn > hoe vaker hij de juiste beslissing zal nemen
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller kdgua. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.96. You're not tied to anything after your purchase.