A equipe de analistas de um órgão público está avaliando o desempenho de dois modelos de machine
leaming: um modelo de classificação e outro de regressão. O modelo de classificação utiliza uma curva ROC
para analisar a performance, enquanto o modelo de regressão utiliza o erro médio absoluto (MAE) como
métrica principal. Durante a avaliação, a equipe percebe que o modelo de classificação está apresentando
sobreajuste (overfitting ). Uma Analista da equipe afirmou, corretamente, que o sobreajuste ocorre quando o
modelo
A é simples demais e não consegue capturar as complexidades dos dados. A curva ROC compara a acurácia geral do modelo de
classificação, enquanto o MAE avalia o desempenho: quanto maior o MAE, melhor é o desempenho do modelo. Para resolver o problema
de sobreajuste, deve-se aumentar o número de variáveis no modelo.
B aprende os padrões específicos do conjunto de treinamento, fornecendo previsões precisas para estes dados, mas com baixo
desempenho em novos dados. A curva ROC avalia a relação entre a taxa de verdadeiros positivos e falsos negativos, enquanto o MAE
mede o desvio médio absoluto entre os valores previstos e os reais. Para mitigar o sobreajuste, técnicas como regularização e parada
antecipada podem ser usadas.
C não consegue aprender os padrões do conjunto de treinamento. A curva ROC mostra a relação entre a taxa de falsos positivos e a taxa de
verdadeiros negativos, enquanto o MAE mede a diferença entre a previsão mais provável e o valor real. Para reduzir o sobreajuste, deve-se remover os dados desbalanceados do conjunto de treinamento.
D aprende as características gerais do conjunto de treinamento, generalizando bem para dados novos. A curva ROC mede a precisão de um
modelo de classificação e o MAE mede a precisão de um modelo de regressão.Para reduzir o sobreajuste, deve-se aumentar a
complexidade do modelo.
E generaliza excessivamente para dados novos e não consegue se adequar aos dados do treinamento. A curva ROC é capaz de calcular o
desempenho do modelo por meio da média entre verdadeiros positivos (especificidade) e falsos positivos (sensibilidade). O MAE é uma
métrica de erro quadrático médio que pode ser usada para melhorar o desempenho do modelo. Para eliminar o sobreajuste, deve-se
aplicar a técnica de balanceamento de dados conhecida como avaliação cruzada.