Igor, analista de dados da CVM, escreveu e rodou o código a
seguir.
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
texto = "Eu sou um analista de dados da
CVM!"
stop_words =
set(stopwords.words('portuguese'))
tokens = word_tokenize(texto)
tokens_processados = [w for w in tokens if
not w in stop_words]
print(tokens_processados)
Considerando que o código foi executado sem erros e sabendo
que Igor está usando Python 3.10.12 e NLTK 3.8.1, a saída do
terminal foi: