Explore as questões disponíveis e prepare-se para seus estudos!
A respeito das medidas de similaridade e dissimilaridade no âmbito da teoria de análise de agrupamentos (cluster), considere as seguintes afirmativas:
1. A distância de Minkowsky entre dois pontos Xl e Xk é muito mais afetada pela presença de valores discrepantes na amostra do que a distância euclidiana. Para λ = 1, a distância de Minkowsky é conhecida como city-block ou Manhattan.
2. O coeficiente de concordância positiva é definido como o número de pares realmente concordantes em relação ao número total de pares. Quanto maior o seu valor, maior é a concordância entre os elementos comparados, razão pela qual é um índice de similaridade.
3. A distância euclidiana média revela que, quanto menor o valor da distância, maior será a similaridade dos elementos comparados; portanto é um índice de discordância ou de dissimilaridade.
4. O coeficiente de Jaccard tem o mesmo objetivo que o coeficiente de concordância positiva. A diferença é que a proporção de pares concordantes é calculada em relação ao número total de pares, excluindo-se os pares do tipo (0 0).
Assinale a alternativa correta.
A partir dessa situação hipotética, julgue o seguinte item.
A análise de clusters é uma técnica multivariada que permite prever a qualidade do ar (boa, moderada ou ruim), com base em variáveis independentes como, por exemplo, os níveis de poluentes e em fatores meteorológicos.
Os dados a seguir referem-se às questões de 26 a 29.
Para analisar o consumo de combustível de um automóvel foram efetuadas 7 viagens, tendo-se registrado a distância percorrida (km) e o consumo (l), obtendo-se, então, os 7 pares de valores seguintes:
As variáveis de agrupamento usadas numa Análise de Conglomerados pelos métodos k-means (quick cluster) e hierárquico são: