Inteligência Artificial - Agentes Inteligentes

INF 1771 – Inteligência Artificial

Aula 02 – Agentes Inteligentes

Edirlei Soares de Lima

<elima@inf.puc-rio.br>

Agentes Inteligentes

Um agente é algo capaz de perceber seu

ambiente por meio de sensores e de agir

sobre esse ambiente por meio de

atuadores.

Agente

percepções

sensores

?

Ambiente

ações

atuadores

Exemplos

Agente humano

Sensores: Olhos, ouvidos e outros órgãos.

Atuadores: Mãos, pernas, boca e outras partes do

corpo.

Agente robótico

Sensores: câmeras e outros sensores.

Atuadores: vários motores.

Agente de software

Sensores: entrada do teclado, conteúdo de

arquivos e pacotes vindos da rede.

Atuadores: tela, disco rígido, envio de pacotes pela

rede.

Agentes Inteligentes

Agentes são diferente de meros programas,

pois operam sob controle autônomo,

percebem seu ambiente, adaptam-se a

mudanças e são capazes de assumir metas.

Mapeando Percepções em Ações

O comportamento de um agente é dado

abstratamente pela função do agente:

f = P* → A

onde é a P* é uma sequência de percepções

e A é uma ação.

Sequência de percepções: histórico

completo de tudo que o agente percebeu.

Exemplo: O Mundo do Aspirador de Pó

Percepções: Local e conteúdo.

Exemplo: [A, sujo]

Ações: Esquerda, Direita, Aspirar, NoOp

Exemplo: O Mundo do Aspirador de Pó

Sequência de Percepções

Ação

[

A, Limpo]

Direita

Aspirar

Esquerda

Aspirar

Direita

Aspirar

…

A, Sujo]

B, Limpo]

B, Sujo]

A, Limpo], [A, Limpo]

A, Limpo], [A, Sujo]

.

..

[

A, Limpo], [A, Limpo], [A, Limpo]

A, Limpo], [A, Limpo], [A, Sujo]

Direita

Aspirar

…

.

..

Programa: Se o quadrado atual

estiver sujo, então aspirar, caso

contrário mover para o outro lado.

Medindo o Desempenho de um Agente

O agente deve tomar a ação “correta”

baseado no que ele percebe para ter

sucesso.

O conceito de sucesso do agente depende uma

medida de desempenho objetiva.

Exemplos: quantidade de sujeira aspirada, gasto de

energia, gasto de tempo, quantidade de barulho

gerado, etc.

A medida de desempenho deve refletir o resultado

realmente desejado.

Agentes Racionais

Agente racional:

Para cada sequência de percepções

possíveis deve-se selecionar uma ação que

espera-se que venha a maximizar sua

medida de desempenho, dada a evidência

fornecida pela sequência de percepções e

por qualquer conhecimento interno do

agente.

Qual seria a medida de desempenho ideal

para o agente aspirador de pó racional?

Agentes Racionais

Os agentes podem (e devem!) executar ações para

coleta de informações.

Um tipo importante de coleta de informação é a

exploração de um ambiente desconhecido.

Os agentes também podem (e devem!) aprender, ou

seja, modificar seu comportamento dependendo

do que ele percebe ao longo do tempo.

Nesse caso o agente é chamado de autônomo.

Um agente que aprende pode ter sucesso em uma ampla

variedade de ambientes.

Modelagem de um Agente

O processo de modelagem de um agente

envolve a definição de:

Medida de Desempenho

Ambiente

Atuadores

Sensores

Exemplo - Motorista de Táxi Automatizado

Medida de desempenho: viagem segura, rápida,

sem violações às leis de trânsito, confortável para os

passageiros, maximizando os lucros.

Ambiente: ruas, estradas, outros veículos, pedestres,

clientes.

Atuadores: direção, acelerador, freio, embreagem,

marcha, seta, buzina.

Sensores: câmera, sonar, velocímetro, GPS,

acelerômetro, sensores do motor, teclado ou

microfone.

Exemplo - Sistema de Diagnóstico Médico

Medida de desempenho: paciente

saudável, minimizar custos, processos

judiciais.

Ambiente: paciente, hospital, equipe.

Atuadores: exibir perguntas na tela, testes,

diagnósticos, tratamentos.

Sensores: entrada pelo teclado para

sintomas, descobertas, respostas do

paciente.

Exemplo - Robô de seleção de peças

Medida de desempenho: porcentagem de

peças em bandejas corretas.

Ambiente: correia transportadora com

peças; bandejas.

Atuadores: braço e mão articulados.

Sensores: câmera, sensores angulares

articulados.

Propriedades do Ambientes

Completamente Observável:

Os sensores do agente dão acesso ao estado

completo do ambiente em cada instante.

Todos os aspectos relevantes do ambiente são

acessíveis.

Parcialmente Observável:

Os sensores do agente permitem que o agente

tenha acesso a somente parte do ambiente.

Propriedades do Ambientes

Determinístico:

O próximo estado do ambiente é completamente

determinado pelo estado atual e pela ação

executada pelo agente.

Não-Determinístico:

O próximo estado do ambiente é desconhecido.

Não se tem certeza do que pode acontecer com o

ambiente ao executar uma ação.

Propriedades do Ambientes

Estático:

O ambiente não muda enquanto o agente pensa.

Dinâmico:

O ambiente pode mudar enquanto o agente pensa

ou está executando uma ação.

Propriedades do Ambientes

Discreto:

Um número limitado e claramente definido de

percepções, ações e estados.

Contínuo:

Um número possivelmente infinito de percepções,

ações e estados.

Propriedades do Ambientes

Agente Único:

Um único agente operando sozinho no ambiente.

Multi-Agente

Vários agentes interagindo ambiente.

Multi-agente cooperativo

Multi-agente competitivo

Exemplos

Xadrez

Taxista

Automático

Completamente observável

Determinístico

Estático

Sim

Não

Sim

Não

Discreto

Agente único

Tipos Básicos de Agentes

Existem cinco tipos básicos de agentes:

Agentes reativos simples.

Agentes reativos baseados em modelos.

Agentes baseados em objetivos.

Agentes baseados na utilidade.

Agentes com aprendizagem.

Agente Reativo Simples

Agentes reativos selecionam ações com base somente

na percepção atual.

Exemplo: agente aspirador de pó

Função AGENTE-ASPIRADOR-REATIVO ([posição, estado])

retorna ação

Inicio

se estado = sujo então

retorna aspirar

senão se posição = A então

retorna direita

senão se posição = B então

retorna esquerda

Fim

Agente Reativo Simples

O funcionamento do agente reativo é

baseado em regras de condição-ação: if

condição then ação.

São simples, porém limitados:

Funcionará somente se a decisão correta puder ser

tomada com base apenas na percepção atual.

Ambiente completamente observável.

Agentes Reativos Baseados em Modelos

Um agente reativo baseado em modelo pode lidar com

ambientes parcialmente observáveis.

O agente deve controlar as partes do mundo que ele não

pode ver.

O agente deve manter um estado interno que dependa

do histórico de percepções e reflita os aspectos não

observados no estado atual.

Agente baseado em modelo é um agente que usa um

modelo de mundo.

Como o ambiente evoluí independente do agente?

Como as ações do próprio agente afetam o mundo?

Agentes Reativos Baseados em Modelos

Conhecer um modelo do mundo nem

sempre é suficiente para tomar uma boa

decisão.

Exemplo:

Um agente Motorista de Táxi chega a um

cruzamento com três caminhos, qual direção

tomar?

Simplesmente reagir? mas existem três reações

possíveis.

Examinar o modelo de mundo? não ajuda a

decidir qual o caminho.

A decisão depende de onde o táxi está tentando

chegar.

Agentes Baseados em Objetivos

Agentes baseados em objetivos expandem as

capacidades dos agentes baseados em modelos

através de um “objetivo”.

O objetivos descreve situações desejáveis.

Exemplo: estar no destino

A seleção da ação baseada em objetivo pode ser:

Direta: quando o resultado de uma única ação atinge o

objetivo.

Mais complexa: quando será necessário longas

sequências de ações para atingir o objetivo.

Agentes Baseados em Objetivos

Para encontrar sequências de ações que

alcançam os objetivos são utilizados

algoritmos de Busca e Planejamento.

A tomada de decisão envolve a

consideração do futuro, o que não

acontece com o uso de regras de condição-

ação.

“

O que acontecerá se eu fizer isso ou aquilo?”

O quanto isso me ajudará a atingir o objetivo?”

Agentes Baseados em Objetivos

O agente que funciona orientado a objetivos

é mais flexível do que um agente reativo.

Entretanto, o objetivo não garante o

melhor comportamento para o agente,

apenas a distinção entre estados objetivos

e não objetivos.

Agentes Baseados na Utilidade

Agentes baseados na utilidade buscam

definir um grau de satisfação com os

estados. O quanto o agente está “feliz” com

aquele estado.

Se um estado do mundo é mais desejável

que outro, então ele terá maior utilidade

para o agente.

Utilidade é uma função que mapeia um

estado para um número real que

representa o grau de satisfação com este

estado.

Agentes Baseados na Utilidade

Agentes com Aprendizagem

Agentes com aprendizado podem atuar

em ambientes totalmente desconhecidos e se

tornar mais eficientes do que o seu

conhecimento inicial poderia permitir.

Em agentes sem aprendizagem, tudo o que o

agente sabe foi colocado nele pelo projetista.

Agentes com Aprendizagem