Algemene Taalwetenschap 2: volledige samenvatting computerlinguïstiek.
Met deze samenvatting en de bijhorende samenvatting van ATW2, behaalde ik een 15!
Computerlinguïstiek
1 Inleiding
Resultaten van onderzoek in computerlinguïstiek:
- Google translate (automatische vertaler)
- Automatische spelling- en grammaticacontrole
- SIRI (laat toe gesproken vragen te stellen en spraakcommando’s te geven)
- T9 (Tekst on 9 keys)
Taal = belangrijkste medium voor de opslag en communicatie van kennis.
Doel van taal- en spraaktechnologie:
Systemen ontwikkelen die mensen toelaten om in hun eigen taal te communiceren met computers en informatiesystemen.
1.1 Taal- en spraaktechnologie in de computerlinguïstiek
Taal- en spraaktechnologie (TST)
Spraaktechnologie:
- Spraakherkenning: automatisch omzetten van spraak naar tekst
- Spraaksynthese: automatisch omzetten van tekst naar spraak
Taaltechnologie:
- Automatisch omzetten van tekst naar betekenis
- Automatisch omzetten van betekenis naar tekst
Dictation (dicteertoepassingen) = spraakherkenner wordt getraind op de stem v.d. gebruiker, waarbij fouten gecorrigeerd
kunnen worden door de gebruiker.
ð Zeer accuraat systeem door de gecontroleerde omstandigheden (microfoon, rustige kamer, zorgvuldig
uitgesproken spraak …)
1.2 Theoretische en toegepaste computerlinguïstiek
Computerlinguïstiek = wetenschapsgebied dat menselijke taalsysteem bestudeert vanuit computationeel perspectief.
- Hoe ziet taalkennis eruit?
- Hoe wordt tekst omgezet naar betekenis (en visa versa)?
- Hoe wordt taalkennis verworven?
Verschil computerlinguïstiek en taalkunde: de methode
- Taalkunde: ontwikkelt theorieën en toetst deze door corpusonderzoek, experimenten en introspectie
- Computerlinguïstiek: onderzoekt onderzoeksvragen door het bouwen en toetsen van computermodellen.
Artificiële Intelligentie (AI) = onderdeel van de computerwetenschappen dat zich bezighoudt met het ontwikkelen van
computationele modellen van perceptie, cognitie en actie in intelligente systemen.
Doel: programma’s maken die in staat zijn dingen te doen die wij intelligent vinden (vb. medische diagnose, schaak op
topniveau, vertaling van teksten, …)
1
, Intelligent Agent (IA) = rationeel organiserend concept binnen AI dat zijn omgeving kan waarnemen, kennis heeft,
problemen kan oplossen, kan leren en kan ondernemen.
ð Bounded rationality = hoe meer kennis een Intelligent Agent heeft of zelf kan verwerven, hoe rationeler zijn gedrag
zal zijn.
Computerlinguïstiek: (deeldiscipline van AI) maakt gebruik van de fundamentele vragen van de taalkunde en de methode
van computerwetenschappen.
Centrale hypothese van AI:
Intelligent gedrag kan worden beschreven in termen van abstracte symboolmanipulatie, los van de implementatie ervan in
het menselijke brein. Als we erin slagen de juiste kennis en cognitieve processen (algoritmen) te formuleren, kunnen we
ook de computer intelligent maken.
Voorbeeld: online schaakspel maakt geen gebruik van complexe redeneerprocessen en strategisch inzicht, maar van
relatief eenvoudige zoekalgoritmen, een grote database van eerder gespeelde wedstrijden en computerrekenkracht.
Fysieke symboolhypothese (PSSH) = abstracte symboolmanipulatie is het enige wat noodzakelijk is voor intelligentie.
ð Gaat ervan uit dat een intelligent systeem slechts moet voldoen aan volgende noodzakelijke voorwaarden:
- Concepten implementeren als fysieke entiteiten (symbolen)
- Relaties tussen concepten implementeren als representaties van symbolen
- Cognitieve processen implementeren als transformaties van symboolrepresentaties
- Cognitieve processen zelf weer implementeren als symboolrepresentaties zodat andere processen ze kunnen
manipuleren
Besluit: Computergeheugenplaatsen als implementatie voor symbolen + datastructuren als symboolrepresentaties +
algoritmen voor de manipulatie ervan = voldoende om cognitieve processen (taalbegrip, taalproductie en vertaling) te
implementeren op menselijk niveau
ð Enkel datastructuren en algoritmen ontbreken nog
Turing Test/ Imitation game (Alan Turing)
= test om te bepalen of een computer intelligent is.
Werking: een menselijke ondervrager chat met een computer en met een mens en moet de mens eruit kunnen halen. Als
dit hem niet lukt, is de computer intelligent.
Voordeel: ‘black box – evaluatie’: men hoeft niet te kijken naar de kennis en representaties van de computer om te
bepalen of hij intelligent is.
Vb. om te weten dat een vogel en vliegtuig kunnen vliegen hoeft men het niet volledig te bestuderen.
Kritiek op PSSH (en indirect ook de Turing Test) door filosofen:
John Searle: ‘een simulatie van intelligentie is niet de intelligentie zelf’ (vb. van een simulatie van regen wordt je ook niet
écht nat)
ð Een systeem kan de regels dus lijken te begrijpen maar dit betekent niet dat het systeem het écht begrijpt
Taalkennis = symboolrepresentaties
Taalverwerking = manipulatie van symboolrepresentaties door algoritmen
Taalwerving = opbouwen van symboolrepresentaties m.b.v. lerende algoritmen
1.3 Taaltechnologie
Toegepaste computerlinguïstiek: ontwikkelt samen met spraaktechnologie software die spreekt, luistert en begrijpt.
We hebben bruikbare taaltechnologie nodig:
1. Communicatieprobleem tussen mens en machine
ð Efficiënt gebruik van software stelt nog te vaak hoge eisen aan de computergeletterdheid van de gebruiker.
ð Interactie moet multimodaal zijn (muis gebruiken, tekeningen maken op het scherm …)
2. informatieoverdaad (information overload)
ð Overvloed aan informatie leidt tot een slecht gebruik ervan (leidt tot technostress)
ð Taaltechnologie kan helpen bij het transformeren van deze info naar overzichtelijke samenvatting en kennis
3. vertaalexplosie
ð Behoefte aan vertaling stijgt exponentieel door:
- Europese Unie (belangrijke teksten moeten in alle talen beschikbaar zijn)
- Toenemende globalisering
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper juliedeclercq1. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.