Questão de Inteligencia Artificial

Em relação ao aprendizado por reforço, selecione a opção correta.

A
Todo o processo de aprendizagem é desenvolvido a partir de ideias baseadas em métodos exatos.
B
O agente só é informado sobre a sua recompensa ao final de um número fixo de iterações para evitar desvios sobre sua política de tomada de decisão.
C
A escolha das ações é fixa ao longo da execução do algoritmo.
D
O agente é informado por exemplos positivos e negativos.
E
Ele dá suporte para maximizar recompensas cumulativas.

Comentários

U

Ainda não há comentários para esta questão.

Seja o primeiro a comentar!