Em relação à busca de frase em um banco de dados textual, considere:
I. Os métodos de arquivos invertidos são caracterizados por possuírem duas partes principais: vocabulário e listas invertidas, sendo que o vocabulário é uma estrutura de busca que contém todos os diferentes termos existentes no texto de forma desordenada.
II. O arquivo invertido é como uma lista ordenada de palavras-chave. Sendo que por palavra existe um apontador para cada um dos documentos onde ela ocorre e sua posição nesse documento.
III. No método de índices para a próxima palavra, para cada termo distinto do vocabulário é criado uma lista de termos que ocorrem em uma posição posterior no texto, juntamente com apontadores de posição para essas ocorrências.
IV. No método de índices para a próxima palavra, os níveis são implementados como árvores binárias, sendo que as palavras existentes no documento que possuem sucessoras, ficam no primeiro nível e no nível seguinte ao índice para a próxima palavra.
Quanto a bancos de dados textuais, julgue o próximo item.
Um banco de dados textual é uma coleção de documentos, que
também pode ser visto como um longo conjunto de registros,
em que cada registro contém apenas uma lista de palavras de
tamanho arbitrário.
Os sistemas gerenciadores de bancos de dados são largamente
utilizados em aplicações computacionais, pois oferecem um
conjunto de propriedades importantes para a segurança e
confiabilidade dos dados, conhecido pela sigla ACID.
O propósito da propriedade correspondente à letra I na referida
sigla é
No que se refere às técnicas de recuperação de informações usadas em bancos de dados textuais, julgue os itens que se seguem.
De acordo com a fórmula da técnica IDF (inverse document frequence), o termo com maior número de ocorrências em trechos de um texto gera menor índice na fórmula de prioridades, sendo esse termo o mais representativo do documento.
Quanto a bancos de dados textuais, julgue o próximo item.
Encontrar uma informação na Web depende do uso de
máquinas de busca e, consequentemente, de sua eficácia. Para
permitir a busca por palavras-chaves, frases ou consultas
booleanas no conteúdo completo de textos (full text searching),
as ferramentas de busca varrem a Web, fazendo o download
dos textos e indexando seu conteúdo.
A respeito de bancos de dados textuais, julgue o item a seguir.
Bancos de dados textuais auxiliam a tomada de decisão nos níveis gerenciais, uma vez que tratam de dados históricos. Na mineração de dados para um data >warehouse, é necessária a montagem de um banco de dados textual, tal que as pesquisas possam ser realizadas por meio de dados históricos.
Entre os métodos principais de busca em bancos de dados textuais, um utiliza indexação de textos, por meio de arquivos invertidos. Um arquivo invertido é um método de busca que tem como características: a estrutura de busca é chamada vocabulário; suporta uma lista invertida que armazena os identificadores dos registros contendo o termo; as consultas são feitas tomando-se a lista invertida correspondente ao termo procurado; as consultas booleanas são feitas obtendo-se a conjunção ou disjunção entre as listas relativas aos termos presentes na consulta.
O método de busca descrito é conhecido como arquivos invertidos com:
Com relação a banco de dados textuais, julgue o item seguinte.
Stop words integram uma lista universal de palavras utilizadas para identificar as paradas ou finais de textos, de modo a auxiliar na análise semântica.