A ciência de dados (data science) é um processo que emprega técnicas estatísticas
e computacionais para analisar grandes bases de dados, procurando extrair delas conhecimento útil
para utilização. Tipicamente, os projetos de ciência de dados são divididos em quatro macroetapas de
execução. Uma das etapas consiste em aplicar um algoritmo sobre os dados pré-processados, com o objetivo de extrair um modelo estatístico ou de machine learning; esse modelo tem por objetivo identificar padrões de relacionamento entre os itens de dados. Assinale a alternativa que apresenta a etapa citada no texto acima.