///
Esta questão foi aplicada no ano de 2025 pela banca CESPE / CEBRASPE no concurso para TRF - 6ª REGIÃO. A questão aborda conhecimentos da disciplina de Engenharia de Software, especificamente sobre Inteligência Artificial.
Esta é uma questão de múltipla escolha com 2 alternativas. Teste seus conhecimentos e selecione a resposta correta.
Julgue o item subsequente, a respeito de LLM e IA generativa.
No processo de inferência, o LLaMA utiliza decodificação paralela em vez de decodificação sequencial, gerando todos os tokens simultaneamente, sem depender do contexto anterior, o que elimina a necessidade de otimizações como layer-wise quantization.