Com referência a conceitos de banco de dados textual, julgue os itens seguintes.
O processo de compressão dos arquivos de índices não é adequado para otimização de pesquisas, uma vez que o tempo de descompressão dos dados é muito maior que o tempo de sua recuperação.
No contexto da recuperação das informações em bancos de dados textuais, um processo consiste em aplicar operações em uma palavra para encontrar sua raiz gramatical, como, por exemplo: “recuperar” é raiz de “recuperação”, “recuperações”, “recuperam” e “recuperado”. Além de ser útil para encontrar possíveis textos relevantes, esse processo também ajuda a reduzir o tamanho da estrutura de indexação, já que diminui o número de índices distintos e é denominado:
No que se refere às técnicas de recuperação de informações usadas em bancos de dados textuais, julgue os itens que se seguem.
De acordo com a fórmula da técnica IDF (inverse document frequence), o termo com maior número de ocorrências em trechos de um texto gera menor índice na fórmula de prioridades, sendo esse termo o mais representativo do documento.
Entre os métodos principais de busca em bancos de dados textuais, um utiliza indexação de textos, por meio de arquivos invertidos. Um arquivo invertido é um método de busca que tem como características: a estrutura de busca é chamada vocabulário; suporta uma lista invertida que armazena os identificadores dos registros contendo o termo; as consultas são feitas tomando-se a lista invertida correspondente ao termo procurado; as consultas booleanas são feitas obtendo-se a conjunção ou disjunção entre as listas relativas aos termos presentes na consulta.
O método de busca descrito é conhecido como arquivos invertidos com:
O processamento de texto em bancos de dados, mensagens, arquivos ou linguagens de programação, principalmente em ambientes computacionais heterogêneos, implica o uso de padrões para a codificação de caracteres. Entretanto, quando cadeias de caracteres são comparadas ou ordenadas, é preciso estabelecer regras de ordenação, pois em diferentes linguagens e culturas elas podem variar mesmo que as cadeias de caracteres usem a mesma codificação. Essas regras usualmente são referenciadas pelo termo ;
Com relação a banco de dados textuais, julgue o item seguinte.
O mecanismo denominado PageRank utiliza metadados semânticos e informações ligadas ao domínio para buscar as características de classificação de componentes de seu conteúdo.
No que se refere às técnicas de recuperação de informações usadas em bancos de dados textuais, julgue os itens que se seguem.
A técnica denominada extração de termos (term extraction) compreende a análise de especialistas no domínio do texto e a incorporação de informações linguísticas às informações estatísticas sobre os termos do documento.
Com referência a conceitos de banco de dados textual, julgue os itens seguintes.
Aplicado ao contexto de pesquisas por frases, um arquivo invertido pode ser visto como uma lista ordenada de palavras-chave que contém, para cada palavra, um apontador para cada um dos documentos em que a palavra ocorre, juntamente com a posição da palavra nesse documento. Esse tipo de índice tem a finalidade de tornar as buscas mais eficientes.