No contexto de análise de dados numéricos em aplicações de Big
Data, há casos em que é necessário lidar com a
identificação/isolamento de outliers. Uma das técnicas utilizadas
nesses casos é baseada na fórmula a seguir.
Z = (x – µ) / σ
Na fórmula, “Z” é um fator (ou escore) que permite estabelecer se
o valor numérico “x” deve ser considerado um outlier ou não.
Os símbolos “µ” e “σ” empregados na fórmula significam
respectivamente: