Ao se utilizar bancos de dados reais no treinamento de métodos
de aprendizado de máquina é normal se deparar com entradas
que possuem um ou mais parâmetros (campos) ausentes.
Com relação às estratégias para lidar com dados ausentes, analise
as afirmativas a seguir.
I. Só é possível realizar imputation quando o atributo (feature)
ausente é numérico.
II. Ao utilizar o k-nearest neighbors (KNN) para fazer o
imputation é uma boa estratégia primeiro fazer a
normalização ou padronização dos dados.
III. Ao se trabalhar com bancos de dados com poucas amostras
(itens), uma estratégia usualmente utilizada para lidar com as
amostras) que possuem valores ausentes é a remoção.
Está correto o que se afirma em