Com relação a banco de dados textuais, julgue o item seguinte.
Stop words integram uma lista universal de palavras utilizadas para identificar as paradas ou finais de textos, de modo a auxiliar na análise semântica.
Quanto a bancos de dados textuais, julgue o próximo item.
Os dois métodos principais de busca por frases em bancos de
dados textuais de larga escala, utilizando indexação de textos,
são os arquivos invertidos com contadores de posição e índices
para a próxima palavra.
Com referência a conceitos de banco de dados textual, julgue os itens seguintes.
Text mining é o processo que utiliza métodos para navegar, organizar, encontrar e descobrir informações em bases textuais escritas em linguagem natural. Com text mining é possível manipular mais facilmente informações não estruturadas, tais como notícias, textos em websites, blogs e documentos em geral.
Quanto a bancos de dados textuais, julgue os próximos itens.
Um banco de dados textual é uma coleção de documentos, que também pode ser visto como um longo conjunto de registros, em que cada registro contém apenas uma lista de palavras de tamanho arbitrário.
Julgue o item subsequente, relativo a bancos de dados textuais
(BDT).
Recuperação de dados e recuperação de informação são
expressões utilizadas para o mesmo processo: retornar para o
usuário todos os documentos em que exista o termo
pesquisado.
Bancos de dados textuais oferecem várias técnicas de pesquisa direcionadas para consultas de textos livres. Uma delas é representada por uma ferramenta capaz de automaticamente, inovar sinônimos para os argumentos de pesquisa. Assim, o usuário não precisa se lembrar de todos os termos relevantes relacionados à pesquisa.
Exemplo: se uma consulta for feita para a palavra “ automóvel ” , podem ser pesquisados , simultaneamente, os sinônimos “carro” e “veículo”.
Com referência a conceitos de banco de dados textual, julgue os itens seguintes.
Aplicado ao contexto de pesquisas por frases, um arquivo invertido pode ser visto como uma lista ordenada de palavras-chave que contém, para cada palavra, um apontador para cada um dos documentos em que a palavra ocorre, juntamente com a posição da palavra nesse documento. Esse tipo de índice tem a finalidade de tornar as buscas mais eficientes.
Entre os métodos principais de busca em bancos de dados textuais, um utiliza indexação de textos, por meio de arquivos invertidos. Um arquivo invertido é um método de busca que tem como características: a estrutura de busca é chamada vocabulário; suporta uma lista invertida que armazena os identificadores dos registros contendo o termo; as consultas são feitas tomando-se a lista invertida correspondente ao termo procurado; as consultas booleanas são feitas obtendo-se a conjunção ou disjunção entre as listas relativas aos termos presentes na consulta.
O método de busca descrito é conhecido como arquivos invertidos com: