Questão de Inteligencia Artificial
No contexto do aprendizado por reforço, o que é uma política?
A
Um conjunto de regras que define como o agente deve explorar o ambiente.
B
A decisão do agente de aprender com base no erro cometido durante o treinamento.
C
A recompensa recebida após a execução de uma ação.
D
A função que define o objetivo do agente dentro de um problema específico.
E
A sequência de ações que o agente executa em um determinado problema.
Ainda não há comentários para esta questão.
Seja o primeiro a comentar!
Aulas em vídeo Em breve
00:00