O Processamento de Linguagem Natural (PLN) busca
melhorar a capacidade das máquinas de entender e interagir com a linguagem humana de forma natural e semanticamente adequada. Ao longo dos anos, a evolução
dos modelos de Machine Learning tem desempenhado um
papel fundamental nesse processo, permitindo avanços
significativos em tarefas como tradução automática, análise
de sentimentos e assistentes virtuais. Esses modelos dependem de uma série de técnicas de pré-processamento
para transformar texto bruto em formas que possam ser
eficientemente analisadas e compreendidas. Numere a
2ª coluna pela primeira, considerando as técnicas e as
respectivas definições.
COLUNA 1
(1) Tokenização,
(2) POS Tagging,
(3) Stemização,
(4) Lematização e
(5) Chunking.
COLUNA 2
( ) Técnica que transforma uma palavra para sua forma de
dicionário, considerando o contexto, a classe gramatical e
outras características linguísticas.
( ) Trata de dividir o texto em unidades menores, como palavras ou partes de palavras, transformando o texto bruto e
preparando-o para ser manipulado por algoritmos de PLN.
( ) Refere-se a reduzir as palavras para suas formas radicais, facilitando a análise de padrões comuns em diferentes
variações da mesma palavra.
( ) Técnica de atribuir a cada palavra em um texto a sua
classe morfossintática, como substantivos, verbos, adjetivos, etc.
( ) Trata de dividir um texto em segmentos mais curtos,
como conjuntos de palavras ou seções de um texto, que
serão tratados separadamente em processos posteriores
como, por exemplo, vetorização.
A sequência correta, de cima para baixo, é: