Questão de Inteligencia Artificial
Em relação ao aprendizado por reforço, selecione a opção correta.
A
Todo o processo de aprendizagem é desenvolvido a partir de ideias baseadas em métodos exatos.
B
O agente só é informado sobre a sua recompensa ao final de um número fixo de iterações para evitar desvios sobre sua política de tomada de decisão.
C
A escolha das ações é fixa ao longo da execução do algoritmo.
D
O agente é informado por exemplos positivos e negativos.
E
Ele dá suporte para maximizar recompensas cumulativas.
Comentários
Ainda não há comentários para esta questão.
Seja o primeiro a comentar!