VestAgents

Este projeto visa criar uma ferramenta de geração de questões inéditas para vestibulares brasileiros utilizando Large Language Models e sistemas Multiagentes (LLMs). O desenvolvimento conta com o apoio da empresa de educação a distância PICO e explora alternativas à ferramenta de geração de questões já existente na empresa.

⚙️ Funcionamento

O VestAgents implementa quatro estratégias complementares para geração de questões:

Retrieval-generator: Sistema com RAG (Geração Aumentada por Recuperação) integrado para pesquisar questões semelhantes em uma base vetorial.
Few-shot: Geração baseada em prompt few-shot com as 5 questões mais semelhantes (derivado do módulo de retrieval).
Scraping: Realiza busca na web via Serper API e extrai textos com BeautifulSoup como base para a geração.
Paired Crew: Combina few-shot e scraping em sequência para geração aumentada com múltiplas fontes.

Arquitetura Geral

Retrieval-generator

Utiliza embeddings e FAISS para construir e consultar um banco de dados vetorial de questões passadas. Isso permite que o modelo tenha exemplos semanticamente semelhantes como contexto para gerar novas questões.

Few-shot

Extensão do retrieval: após buscar questões semelhantes, constrói-se um prompt few-shot que serve de base para o modelo gerar uma nova questão.

Scraping

Busca conteúdos relevantes na web sobre o tema solicitado (como "Probabilidade no Enem"), extrai parágrafos de páginas especializadas e os insere como contexto para geração.

Paired Crew

Estrutura em duas crews: uma para recuperar exemplos (few-shot), outra para buscar conteúdo online (scraping). Os dois conjuntos são unidos para criar a questão final.

🛠️ Como rodar

Requisitos

Python 3.10 a 3.12
UV como gerenciador de pacotes

Instalando dependências

pip install uv
crewai install

Configurando

Entre no diretório do projeto que deseja testar. Exemplo:

cd fewshot_crews

Crie o arquivo .env com sua OPENAI_API_KEY.
Configure os agentes em:
src/raia_agents/config/agents.yaml
Configure as tarefas em:
src/raia_agents/config/tasks.yaml
Edite src/raia_agents/crew.py e src/raia_agents/main.py para customizações.

Executando o projeto

crewai run

Esse comando inicia a crew de agentes conforme definido em main.py.

📊 Resultados

A avaliação de resultados foi realizada utilizando DeepEval e os critérios utilizados na matriz de referência do Enem. Resultados finais das métricas para 50 questões:

Enem: Questões reais dos tópicos em vestibulares antigos do Enem; Few shot: Nossa abordagem com agente few shot; Baseline: Questões geradas utilizando o modelo baseline sem agentes.

Resumo: Como podemos observar, o dataset do Enem possui o melhor desempenho geral, seguido de perto pelo nosso modelo Few Shot. As questões do baseline apresentam um desempenho inferior em comparação aos outros dois.

Este gráfico revela que o nosso modelo FewShot apresenta um desempenho muito competitivo em relação às questões do ENEM, superando-o em algumas métricas como "Alternativa correta", “Enunciado" e "Linguagem inclusiva". Ambos, ENEM e FewShot, mostram uma vantagem clara sobre as questões da Pico na maioria das métricas, especialmente em "Exigencia cognitiva", onde o baseline demonstra uma queda mais acentuada.

Próximos passos

Integração com interface gráfica via Streamlit.
Avaliação com professores parceiros da PICO.
Implementação de avaliação automática da qualidade da questão gerada.
Inclusão de suporte a diferentes idiomas e níveis educacionais.

📑 Referências

💻 Quem somos

Este projeto foi desenvolvido pelos membros do RAIA (Rede de Avanço de Inteligência Artificial), uma iniciativa estudantil do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP - São Carlos. Somos estudantes que compartilham o objetivo de criar soluções inovadoras utilizando inteligência artificial para impactar positivamente a sociedade. Para saber mais, acesse nosso site ou nosso Instagram!

💻 Patrocínio

	Este projeto foi desenvolvido com a Pico, uma plataforma de aprendizado digital com gameficação, que implementa inteligência artificial para estimular o aprendizado. Para saber mais, acesse use Pico

Desenvolvedores

Álvaro Lopes. Linkedin e Github
Artur de Vlieger Linkedin e Github
Fabrício Salomon Linkedin e Github
Leticia Bossatto Marchezi Linkedin e Github
Luis Felipe Jorge Linkedin e Github
Otávio Coletti Linkedin e Github

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
evaluation		evaluation
fewshot_crews		fewshot_crews
paired_crew		paired_crew
retrieval_generate_crew		retrieval_generate_crew
scrapper_crew		scrapper_crew
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VestAgents

⚙️ Funcionamento

Arquitetura Geral

Retrieval-generator

Few-shot

Scraping

Paired Crew

🛠️ Como rodar

Requisitos

Instalando dependências

Configurando

Executando o projeto

📊 Resultados

Próximos passos

📑 Referências

💻 Quem somos

💻 Patrocínio

Desenvolvedores

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

VestAgents

⚙️ Funcionamento

Arquitetura Geral

Retrieval-generator

Few-shot

Scraping

Paired Crew

🛠️ Como rodar

Requisitos

Instalando dependências

Configurando

Executando o projeto

📊 Resultados

Próximos passos

📑 Referências

💻 Quem somos

💻 Patrocínio

Desenvolvedores

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages