Algemene Taalwetenschap 2: volledige samenvatting computerlinguïstiek.
Met deze samenvatting en de bijhorende samenvatting van ATW2, behaalde ik een 15!
Computerlinguïstiek
1 Inleiding
Resultaten van onderzoek in computerlinguïstiek:
- Google translate (automatische vertaler)
- Automatische spelling- en grammaticacontrole
- SIRI (laat toe gesproken vragen te stellen en spraakcommando’s te geven)
- T9 (Tekst on 9 keys)
Taal = belangrijkste medium voor de opslag en communicatie van kennis.
Doel van taal- en spraaktechnologie:
Systemen ontwikkelen die mensen toelaten om in hun eigen taal te communiceren met computers en informatiesystemen.
1.1 Taal- en spraaktechnologie in de computerlinguïstiek
Taal- en spraaktechnologie (TST)
Spraaktechnologie:
- Spraakherkenning: automatisch omzetten van spraak naar tekst
- Spraaksynthese: automatisch omzetten van tekst naar spraak
Taaltechnologie:
- Automatisch omzetten van tekst naar betekenis
- Automatisch omzetten van betekenis naar tekst
Dictation (dicteertoepassingen) = spraakherkenner wordt getraind op de stem v.d. gebruiker, waarbij fouten gecorrigeerd
kunnen worden door de gebruiker.
ð Zeer accuraat systeem door de gecontroleerde omstandigheden (microfoon, rustige kamer, zorgvuldig
uitgesproken spraak …)
1.2 Theoretische en toegepaste computerlinguïstiek
Computerlinguïstiek = wetenschapsgebied dat menselijke taalsysteem bestudeert vanuit computationeel perspectief.
- Hoe ziet taalkennis eruit?
- Hoe wordt tekst omgezet naar betekenis (en visa versa)?
- Hoe wordt taalkennis verworven?
Verschil computerlinguïstiek en taalkunde: de methode
- Taalkunde: ontwikkelt theorieën en toetst deze door corpusonderzoek, experimenten en introspectie
- Computerlinguïstiek: onderzoekt onderzoeksvragen door het bouwen en toetsen van computermodellen.
Artificiële Intelligentie (AI) = onderdeel van de computerwetenschappen dat zich bezighoudt met het ontwikkelen van
computationele modellen van perceptie, cognitie en actie in intelligente systemen.
Doel: programma’s maken die in staat zijn dingen te doen die wij intelligent vinden (vb. medische diagnose, schaak op
topniveau, vertaling van teksten, …)
1
, Intelligent Agent (IA) = rationeel organiserend concept binnen AI dat zijn omgeving kan waarnemen, kennis heeft,
problemen kan oplossen, kan leren en kan ondernemen.
ð Bounded rationality = hoe meer kennis een Intelligent Agent heeft of zelf kan verwerven, hoe rationeler zijn gedrag
zal zijn.
Computerlinguïstiek: (deeldiscipline van AI) maakt gebruik van de fundamentele vragen van de taalkunde en de methode
van computerwetenschappen.
Centrale hypothese van AI:
Intelligent gedrag kan worden beschreven in termen van abstracte symboolmanipulatie, los van de implementatie ervan in
het menselijke brein. Als we erin slagen de juiste kennis en cognitieve processen (algoritmen) te formuleren, kunnen we
ook de computer intelligent maken.
Voorbeeld: online schaakspel maakt geen gebruik van complexe redeneerprocessen en strategisch inzicht, maar van
relatief eenvoudige zoekalgoritmen, een grote database van eerder gespeelde wedstrijden en computerrekenkracht.
Fysieke symboolhypothese (PSSH) = abstracte symboolmanipulatie is het enige wat noodzakelijk is voor intelligentie.
ð Gaat ervan uit dat een intelligent systeem slechts moet voldoen aan volgende noodzakelijke voorwaarden:
- Concepten implementeren als fysieke entiteiten (symbolen)
- Relaties tussen concepten implementeren als representaties van symbolen
- Cognitieve processen implementeren als transformaties van symboolrepresentaties
- Cognitieve processen zelf weer implementeren als symboolrepresentaties zodat andere processen ze kunnen
manipuleren
Besluit: Computergeheugenplaatsen als implementatie voor symbolen + datastructuren als symboolrepresentaties +
algoritmen voor de manipulatie ervan = voldoende om cognitieve processen (taalbegrip, taalproductie en vertaling) te
implementeren op menselijk niveau
ð Enkel datastructuren en algoritmen ontbreken nog
Turing Test/ Imitation game (Alan Turing)
= test om te bepalen of een computer intelligent is.
Werking: een menselijke ondervrager chat met een computer en met een mens en moet de mens eruit kunnen halen. Als
dit hem niet lukt, is de computer intelligent.
Voordeel: ‘black box – evaluatie’: men hoeft niet te kijken naar de kennis en representaties van de computer om te
bepalen of hij intelligent is.
Vb. om te weten dat een vogel en vliegtuig kunnen vliegen hoeft men het niet volledig te bestuderen.
Kritiek op PSSH (en indirect ook de Turing Test) door filosofen:
John Searle: ‘een simulatie van intelligentie is niet de intelligentie zelf’ (vb. van een simulatie van regen wordt je ook niet
écht nat)
ð Een systeem kan de regels dus lijken te begrijpen maar dit betekent niet dat het systeem het écht begrijpt
Taalkennis = symboolrepresentaties
Taalverwerking = manipulatie van symboolrepresentaties door algoritmen
Taalwerving = opbouwen van symboolrepresentaties m.b.v. lerende algoritmen
1.3 Taaltechnologie
Toegepaste computerlinguïstiek: ontwikkelt samen met spraaktechnologie software die spreekt, luistert en begrijpt.
We hebben bruikbare taaltechnologie nodig:
1. Communicatieprobleem tussen mens en machine
ð Efficiënt gebruik van software stelt nog te vaak hoge eisen aan de computergeletterdheid van de gebruiker.
ð Interactie moet multimodaal zijn (muis gebruiken, tekeningen maken op het scherm …)
2. informatieoverdaad (information overload)
ð Overvloed aan informatie leidt tot een slecht gebruik ervan (leidt tot technostress)
ð Taaltechnologie kan helpen bij het transformeren van deze info naar overzichtelijke samenvatting en kennis
3. vertaalexplosie
ð Behoefte aan vertaling stijgt exponentieel door:
- Europese Unie (belangrijke teksten moeten in alle talen beschikbaar zijn)
- Toenemende globalisering
2
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller juliedeclercq1. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.43. You're not tied to anything after your purchase.