Bases de dados desbalanceadas podem afetar os resultados de muitos algoritmos que tentam identificar padrões
nesses dados. Essa é uma realidade para muitas bases
da saúde, pois a prevalência de uma doença na população
pode ser algo raro. Sobre o processo de rebalanceamento
de bases de dados, avalie se são verdadeiras (V) ou falsas
(F) as afirmativas a seguir.
I. A técnica de oversampling envolve aumentar o número
de instâncias da classe minoritária (menos frequente)
para equilibrar a distribuição das classes.
II. A técnica de undersampling envolve reduzir o número
de instâncias da classe majoritária (mais frequente)
para equilibrar a distribuição das classes.
III. Antes de aplicar a técnica de oversampling, é importante
dividir os dados em conjuntos de treino e teste. A técnica
de oversampling só deve ser aplicada ao conjunto de
testes.
As afirmativas I, II e III são respectivamente: