Samenvatting van het vak Intelligente Systemen van de hoorcolleges 1 t/m 7.
Grotendeels Nederlands, maar ook wat Engelse zinnen (vooral het eerste college).
Intelligente Systemen
HC 1: Intelligentie, rationale agenten
4-02-20
4 interpretaties van KI
Doe menselijk en denk menselijk
Turing Test doet menselijk?
Denk:
1. Let a human H solve a problem observe (or ask) and note how H does this;
2. Let a computer C solve a problem and let C generate a ‘trace’ of this process;
3. Check whether C does it in the same way as H
Denk rationeel en doe rationeel
Rational thinking = ‘optimal’ thinking; logically valid thinking, reasoning
Rational agent = one that acts so as to achieve the best outcome or, when there is uncertainty, the best
expected outcome. > is het doel om dit te bouwen.
Verschil met logical thinking: it is often useful to select the right actions. Sometimes it is not possible
to infer what the best behavior is.
Ch 2. How to develop rational agents. Wat moet het bereiken, wat kan het?
TT: What are the kinds of agents, what are de features of the environment that are important?
How well an agent does depend on the environment and the task that the agent must perform in it
- An agent cannot be viewed separately from that task environment
- Different environments require different agents
- How do we determine “how well” an agent does?
o Consequenties van de acties van de agent
o State of the task environment changes as a result
o How do we rate those different states
Agent approach
An agent is an entity that perceives and acts. Agents include people,
robots, software, arguably simple things like thermostats, etc. Agents
move things, itself, etc. Software van agents zijn ook agents, dus je hebt
ook agents in agents. Agents produce actions, and these actions affect the
environment.
The agent function maps ‘percept sequences’ to actions:
f: P* A
* is infinite length or empty.
A = actions
An agent program ran on a physical machine and ‘generates’ f
- Something that generates this behavior
Agent architecture
Agent = architecture + program
- Architecture niet alleen als een fysische machine, maar ook als een
software infrastructuur dat gebruikt wordt door het programma
Ex: vacuum cleaner world. Kan zien of het schoon of vies is in de kamer.
Weet dat het in kamer A of B is. Acties: links, rechts en zuigen.
,Rationality
A performance measure evaluates the range of environmental conditions, for example
- One point per square cleaned up in time t?
- One point per clean square per time step?
- One point per clean square per time step, minus one per move?
- Penalize for > k dirty squares?
A rational agent chooses whichever action maximizes the expected value of the performance measure
given the percept sequence to date.
Rationeel betekent niet altijd dat het goede wordt gedaan, want agent weet niet per se altijd alles, dus
rationeel betekent dat de agent het goede doet, gebaseerd op wat het weet. Rationeel is niet alwetend
of alziend, dus niet per se succesvol.
PEAS description
To design a good rational agent, we need to know the task environment where the agent would
operate. A standard description of task environment is structured intro describing Performance,
Environment, Actuators, Sensors. Ex voor een automatische taxi:
- Performance measure: safe, fast, legal, comfortable trip, maximize profits
- Environment: roads, other traffic, customers, weather
- Actuators: steering, accelerating, braking, horn
- Sensors: camera, LIDAR, speedometer, engine sensors, GPS
Kinds of environments
- Fully observable vs partially observable
o everything that is relevant for decision making of the agent; do you know the exact
state of the environment?
- Deterministic vs nondeterministic
o one possible outcome or multiple?
o Do all actions have unique outcomes?
- Static vs dynamic
o Does the environment change spontaneously, without the agent doing anything
(dynamic), of verandert het alleen als de agent iets doet (static)
Automatic taxi task environment is partially observable, nondeterministic (it actions may fail) and
dynamic (verkeer hangt ook af van andere autos)
Kinds of agents
Four basic kinds of agent programs: simple reflex agents, model based agents, goal based agents and
utility based agents.
Simple reflex agent
Only responds to the most recent observation. Smells food, it responses food. Als je
geen regel hebt, weet je niet wat je moet doen. Sommige environment is highly
dynamic, geen tijd om na te denken, snel reageren, dus is dit handig. Het werkt niet
for any behavior that requires memory; in a partially observable environment.
Model based reflex agent
Builds a model of the world based on previous observations. Je past wat er nu gebeurt
toe op wat je weet van het verleden. Geen expliciet idee van wat het wil, het moet in
de regels staan. Alles is impliciet.
Goal based agent
Heeft een expliciet goal, goals kunnen wel veranderen. Het is een ‘planning agent’.
Ik weet de state van de wereld, hoe acties de state van de wereld veranderen en ik
weet wat ik kan doen/wil. Ik ben hier, ik wil daar naartoe en dan weet ik welke
acties ik moet doen om daar te komen. Hij kan ook plannen naar waar ‘ie heen wil.
, Het werkt niet goed in een hoog dynamic environment, heeft veel tijd nodig om te denken (want heeft
geen hard-gecodeerde regels). Als hij weet welke het beste is, is hij misschien al te laat, omdat hij zo
veel tijd heeft besteed aan de alternatieven afwegen.
Utitlity based agent
Can better distinguish different target states (simply achieving the goal vs
optimizing utility)
Ipv dit is goalstate en in deze state ben ik, zeggen dit heeft utiltiy 7 en deze state
heeft utiltiy 3, etc. Misschien is utiltity state 8 makkelijker te bereiken (in een stap),
dan is het heel waarschijnlijk dat je daar naartoe gaat.
The utility function internalises the performance measure: uitrekenen hoeveel het
kost om ergens te komen, of simpele actieregels volgen.
Je probeert de utility te maximaliseren
Learning agents
Alles kan veranderd worden in een learning agent door het te improven.
Exploitatie vs. exploratie.
Knowledge based agents
Model based reflex agents, goal-based agents, and utility-based agents use a model of the environment.
Het heeft een beeld van de wereld en hoe de wereld verandert kan worden. A model of the
environment is a good idea, because:
- The environment is often complex and non-determinstic
- The environment is often partially observable
- A model is necessary to be flexible
A KB agent uses a knowledge base (KB) to decide what to do
- The KB contains ‘sentences’ in a formal language (Logic)
- Two important routines
o Tell: to add sentences tot the KB
o Ask: to ask questions, the answer must logically follow
- The KB may start with background knowledge
Modelling the environment
How can effects of actions be represented. Elke feature heeft een value. Een actie verandert de feature,
niet waar je bent, oid, alleen of het licht aan of uit is (Bool). We kunnen beschrijven hoe de
verandering werkt.
- States have no internal structure
- Staes are vectors of attribute values
- States consist of objects with properties and mutual relationships
Logical reasoning and planning
Unlike search, planning uses factored representation. This makes it possible to decompose problems
en hierdoor kun je betere acties kiezen om te proberen
States described in propositional logic are also factored (elke propositionele variabele is waar of
onwaar)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller elyvd. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.62. You're not tied to anything after your purchase.