“Processos de mineração de dados são usualmente
aplicados em conjuntos de dados coletados para outros
propósitos, para uso futuro ou aplicações diversas. Por
essa razão, aplicações de mineração de dados quase
nunca podem se beneficiar de estratégias que endereçam
a correção de erros na fonte dos dados.” Entretanto, a
maioria das estatísticas aplicadas em processos de mineração de dados depende da qualidade de dados. Como
prevenir problemas na qualidade dos dados na sua geração
não é uma opção, o processo de limpeza de dados inclui
a seguinte tarefa: