Skip to content

gruporaia/VestAgents

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

VestAgents

Este projeto visa criar uma ferramenta de geração de questões inéditas para vestibulares brasileiros utilizando Large Language Models e sistemas Multiagentes (LLMs). O desenvolvimento conta com o apoio da empresa de educação a distância PICO e explora alternativas à ferramenta de geração de questões já existente na empresa.

⚙️ Funcionamento

O VestAgents implementa quatro estratégias complementares para geração de questões:

  • Retrieval-generator: Sistema com RAG (Geração Aumentada por Recuperação) integrado para pesquisar questões semelhantes em uma base vetorial.
  • Few-shot: Geração baseada em prompt few-shot com as 5 questões mais semelhantes (derivado do módulo de retrieval).
  • Scraping: Realiza busca na web via Serper API e extrai textos com BeautifulSoup como base para a geração.
  • Paired Crew: Combina few-shot e scraping em sequência para geração aumentada com múltiplas fontes.

Arquitetura Geral

Retrieval-generator

Utiliza embeddings e FAISS para construir e consultar um banco de dados vetorial de questões passadas. Isso permite que o modelo tenha exemplos semanticamente semelhantes como contexto para gerar novas questões.

Few-shot

Extensão do retrieval: após buscar questões semelhantes, constrói-se um prompt few-shot que serve de base para o modelo gerar uma nova questão.

Scraping

Busca conteúdos relevantes na web sobre o tema solicitado (como "Probabilidade no Enem"), extrai parágrafos de páginas especializadas e os insere como contexto para geração.

Paired Crew

Estrutura em duas crews: uma para recuperar exemplos (few-shot), outra para buscar conteúdo online (scraping). Os dois conjuntos são unidos para criar a questão final.

🛠️ Como rodar

Requisitos

  • Python 3.10 a 3.12
  • UV como gerenciador de pacotes

Instalando dependências

pip install uv
crewai install

Configurando

  1. Entre no diretório do projeto que deseja testar. Exemplo:
cd fewshot_crews
  1. Crie o arquivo .env com sua OPENAI_API_KEY.
  2. Configure os agentes em:
    src/raia_agents/config/agents.yaml
  3. Configure as tarefas em:
    src/raia_agents/config/tasks.yaml
  4. Edite src/raia_agents/crew.py e src/raia_agents/main.py para customizações.

Executando o projeto

crewai run

Esse comando inicia a crew de agentes conforme definido em main.py.

📊 Resultados

A avaliação de resultados foi realizada utilizando DeepEval e os critérios utilizados na matriz de referência do Enem. Resultados finais das métricas para 50 questões: EVAL

Enem: Questões reais dos tópicos em vestibulares antigos do Enem; Few shot: Nossa abordagem com agente few shot; Baseline: Questões geradas utilizando o modelo baseline sem agentes.

Resumo: Como podemos observar, o dataset do Enem possui o melhor desempenho geral, seguido de perto pelo nosso modelo Few Shot. As questões do baseline apresentam um desempenho inferior em comparação aos outros dois.

Este gráfico revela que o nosso modelo FewShot apresenta um desempenho muito competitivo em relação às questões do ENEM, superando-o em algumas métricas como "Alternativa correta", “Enunciado" e "Linguagem inclusiva". Ambos, ENEM e FewShot, mostram uma vantagem clara sobre as questões da Pico na maioria das métricas, especialmente em "Exigencia cognitiva", onde o baseline demonstra uma queda mais acentuada.

Próximos passos

  • Integração com interface gráfica via Streamlit.
  • Avaliação com professores parceiros da PICO.
  • Implementação de avaliação automática da qualidade da questão gerada.
  • Inclusão de suporte a diferentes idiomas e níveis educacionais.

📑 Referências

💻 Quem somos

LogoRAIA Este projeto foi desenvolvido pelos membros do RAIA (Rede de Avanço de Inteligência Artificial), uma iniciativa estudantil do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP - São Carlos. Somos estudantes que compartilham o objetivo de criar soluções inovadoras utilizando inteligência artificial para impactar positivamente a sociedade. Para saber mais, acesse nosso site ou nosso Instagram!

💻 Patrocínio

pico Este projeto foi desenvolvido com a Pico, uma plataforma de aprendizado digital com gameficação, que implementa inteligência artificial para estimular o aprendizado. Para saber mais, acesse use Pico

Desenvolvedores

About

Sistema multiagentes de IA para geração de questões de vestibular

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages