///
Um sistema de inteligência artificial foi desenvolvido para dirigir um veículo em um jogo de corrida virtual. O sistema começa sem conhecimento prévio e não recebe exemplos rotulados de como dirigir corretamente. Durante o aprendizado, ele não identifica ou utiliza padrões da pista ou do comportamento de outros veículos. Sua única fonte de informação são as pontuações: pontos positivos ao manter o veículo na pista e fazê-lo completar voltas, pontos negativos quando o veículo sai da pista ou colide, e bônus quando ultrapassa outro veículo ou completa mais rápido a corrida. O sistema ajusta seu comportamento baseando-se unicamente nessas pontuações recebidas após suas ações.
Na situação hipotética precedente, é caracterizado o aprendizado de máquina