Para a realização de análises preditivas e de agrupamento típicas
de mineração de textos, os dados não estruturados textuais devem
ser preparados antes de serem analisados. Este processo consiste
em quatro etapas: análise lexical, eliminação de termos
irrelevantes, redução da palavra ao seus radical e construção de
uma representação vetorial.
A etapa de análise lexical consiste na