Quando os gradientes se tornam extremamente pequenos, dificultando o treinamento.
Uma variável dependente que o modelo tenta prever.
Dados rotulados e um modelo supervisionado.