Durante a etapa do pré-processamento da base de dados, a análise de Outliers é
uma tarefa comum e relevante para obter modelos de aprendizado de máquina consistentes. A
presença de outliers pode levar a modelos imprecisos quando o modelo é testado ou colocado em
produção. Analise as assertivas a seguir e assinale a alternativa correta.
I. Outliers são dados com padrões muito diferentes aos demais, que fogem ao padrão dos dados.
Estes dados precisam ser identificados e analisados.
II. Outliers podem ser produzidos por erros de medição, valores default assumidos durante o
preenchimento de uma base de dados ou podem corresponder a valores corretos, mas
pertencentes a uma base de dados desbalanceada.
III. Na prática, os outliers comumente são eliminados. Porém, pode-se estar negligenciando um
conjunto de instâncias que podem trazer novos conhecimentos acerca do domínio de problema.
IV. A detecção de outliers pode ser feita por meio de técnicas univariadas, que consistem em explorar
cada atributo e variabilidade dos valores em torno da média. Quando a variabilidade é grande,
pode indicar registros, potenciais outliers.