Ícone Questionei
QuestõesDisciplinasBancasDashboardSimuladosCadernoRaio-XBlog
Logo Questionei

Links Úteis

  • Início
  • Questões
  • Disciplinas
  • Simulados

Legal

  • Termos de Uso
  • Termos de Adesão
  • Política de Privacidade

Disciplinas

  • Matemática
  • Informática
  • Português
  • Raciocínio Lógico
  • Direito Administrativo

Bancas

  • FGV
  • CESPE
  • VUNESP
  • FCC
  • CESGRANRIO

© 2026 Questionei. Todos os direitos reservados.

Feito com ❤️ para educação

/
/
/
/
/
/
  1. Início/
  2. Questões/
  3. Sistemas de Informação e Gestão/
  4. Questão 457941201717085

Você é um cientista de dados incumbido de desenvolver uma aplicação de perguntas e respostas para facilitar a extração d...

1

457941201717085
Ano: 2024Banca: FIOCRUZOrganização: FIOCRUZDisciplina: Sistemas de Informação e GestãoTemas: Gestão de Conteúdo | Sistemas de Informação
Você é um cientista de dados incumbido de desenvolver uma aplicação de perguntas e respostas para facilitar a extração de informações de documentos PDF contendo artigos científicos na área da saúde. Para construir essa aplicação, as seguintes estratégias foram apresentadas.


I. Utilizar a técnica de embeddings de texto para converter documentos PDF em vetores e armazená-los em um vectorstore, como ChromaDb ou Pinecone, permitindo buscas semânticas rápidas e eficientes baseadas no conteúdo dos artigos.


II. Desenvolver um sistema de indexação baseado em metadados extraídos dos documentos PDF, como autor, data de publicação e palavras-chave, para facilitar a filtragem e a busca por documentos específicos.


III. Implementar uma abordagem de processamento de linguagem natural (PLN) que empregue a API do modelo de linguagem para gerar respostas precisas às perguntas, utilizando os vetores e metadados armazenados para recuperar informações relevantes dos documentos e inseri-las no contexto do prompt.


IV. Realizar o fine-tuning do modelo de linguagem através de um dataset que contenha o conhecimento do domínio que se quer adicionar ao modelo, utilizando frameworks como LoRA ou QLoRA para fazer o merge desse dataset adicional treinado.


V. Criar uma hierarquia de documentos baseada na classificação dos artigos científicos por tópicos e subtópicos, utilizando algoritmos de clustering para organizar automaticamente os documentos em categorias relevantes.



Das estratégias acima:
Gabarito comentado
Anotações
Marcar para revisão

Acelere sua aprovação com o Premium

  • Gabaritos comentados ilimitados
  • Caderno de erros inteligente
  • Raio-X da banca
Conhecer Premium

Questões relacionadas para praticar

Questão 457941200022640Sistemas de Informação e Gestão

Bases de dados desbalanceadas podem afetar os resultados de muitos algoritmos que tentam identificar padrões nesses dados. Essa é uma realidade para m...

#Sistemas de Informação
Questão 457941200026653Sistemas de Informação e Gestão

Ao integrar informações provenientes de fontes de dados externas, como documentos ou bancos de dados, com Large Language Models (LLMs), é possível emp...

#Sistemas de Informação
Questão 457941200462133Sistemas de Informação e Gestão

Uma das mais importantes atividades da gestão conhecimento nas organizações é a distinção entre dado, informação e conhecimento. Sobre esta distinção ...

#Conceitos de Tecnologia da Informação e Sistemas de Informação
Questão 457941201014997Sistemas de Informação e Gestão

Modelos de IA nem sempre são transparentes sobre quais fatores mais influenciam suas decisões. Para mitigar esse efeito, uma abordagem é usar soluções...

#Sistemas de Informação
Questão 457941201131791Sistemas de Informação e Gestão

Os sistemas computacionais com ou sem o uso de técnicas de aprendizado são apresentados na Coluna I. Estabeleça a correta correspondência com as defin...

#Modelo de Comportamento
Questão 457941201194710Sistemas de Informação e Gestão

Na análise de dados textuais, é muito comum o uso de medidas de similaridade para agrupamento de documentos. Sobre a similaridade por cosseno, das afi...

#Sistemas de Informação
Questão 457941201624256Sistemas de Informação e Gestão

Considerando o avanço recente dos modelos de Processamento de Linguagem Natural (PLN) e a necessidade crescente de processar e sumarizar grandes volum...

#Sistemas de Informação
Questão 457941201660749Sistemas de Informação e Gestão

O pré-processamento de dados é uma das etapas mais importantes da análise de dados e, quando bem executado, proporciona uma maior eficácia em todo o p...

#Sistemas de Informação
Questão 457941201948019Sistemas de Informação e Gestão

A implementação dos registros eletrônicos de saúde ainda é um desafio para o Sistema Único de Saúde. Entre as dificuldades existentes, podem ser lista...

#Sistemas de Informação
Questão 457941202026396Sistemas de Informação e Gestão

De acordo com o capítulo “Sistemas de Informação em Saúde”, de Claudia Medina Coeli e colaboradores, no livro “Epidemiologia – Teoria e Prática”, um s...

#Sistemas de Informação#Conceitos de Tecnologia da Informação e Sistemas de Informação

Continue estudando

Mais questões de Sistemas de Informação e GestãoQuestões sobre Gestão de ConteúdoQuestões do FIOCRUZ