|
2 | 2 |
|
3 | 3 | Objetivo: construir um compilador que lê um subconjunto de C e transpila para Lua, usando Flex (léxico) e Bison (sintático) em C. |
4 | 4 |
|
5 | | -Resumo do MVP de linguagem suportada: |
6 | | -- Tipos: int, float, bool (true/false), char (como número), string opcional. |
7 | | -- Estruturas: declaração de variáveis, atribuição, expressões aritméticas/lógicas, if/else, while, for (apenas uma declaração), função (definição/chamada) e return. |
8 | | -- I/O: mapeamento simples printf/puts -> print; scanf opcional. |
| 5 | +Resumo das funcionalidades suportadas: |
| 6 | +- Tipos: int, float, bool (true/false), char (como número), string literal (printf e puts), array unidimensional dos tipos primitivos anteriores. |
| 7 | +- Estruturas: declaração de variáveis, atribuição, expressões aritméticas/lógicas, if/else, while, for (apenas uma declaração de variável), função (definição/chamada) e return. |
| 8 | +- I/O: mapeamento simples printf/puts -> print com formatação; |
9 | 9 | - Saída Lua: usar local para variáveis, funções Lua equivalentes, operadores com mesma semântica; arrays opcionais como tabelas. |
| 10 | +- Extra: otimizações simples (constantes, dead code, reutilização de subexpressão comum, condição falsa/verdadeira em tempo de compilação). |
10 | 11 |
|
11 | 12 | O que não será suportado: |
12 | | -- Ponteiros, structs, alocação dinâmica, manipulação de memória. |
| 13 | +- Ponteiros (incluindo string), structs, alocação dinâmica, manipulação de memória. |
13 | 14 | - Recursos avançados: pré-processador, macros, diretivas de compilação. |
| 15 | +- Recursos complexos: manipulação de bits, operações em baixo nível, inline assembly. |
| 16 | + |
| 17 | +## Arquitetura |
| 18 | + |
| 19 | +O compilador é dividido em várias fases principais: |
| 20 | +1. **Análise Léxica**: Utiliza Flex para tokenizar o código-fonte em C. |
| 21 | +2. **Análise Sintática**: Utiliza Bison para enviar à fase seguinte uma árvore sintática. |
| 22 | +3. **Intermediária**: Representação da AST (Árvore de Sintaxe Abstrata) para facilitar a análise semântica e otimizações. |
| 23 | +4. **Análise Semântica**: Verifica tipos, escopos e outras regras semânticas. |
| 24 | +5. **Otimizações**: Aplica otimizações simples na AST. |
| 25 | +6. **Geração de Código**: Transpila a AST otimizada para código Lua. |
| 26 | + |
| 27 | +## Estrutura do Projeto |
14 | 28 |
|
15 | 29 | ``` |
16 | 30 | . |
17 | | -├── lexer/ # regras léxicas (lexer.l) |
18 | | -├── parser/ # gramática e ações (parser.y) |
19 | | -├── src/ # main.c, AST, tabela de símbolos, gerador Lua |
| 31 | +├── src/ # Implementação do compilador propriamente dita |
| 32 | +│ ├── lexer.* # Regras Flex e helpers de tokenização |
| 33 | +│ ├── parser.y # Gramática Bison que constrói a AST |
| 34 | +│ ├── ast.* # Tipos da AST e utilitários de construção/cleanup |
| 35 | +│ ├── symbol_table.* # Estruturas de escopo usadas na análise semântica |
| 36 | +│ ├── semantic.* # Verificações de tipo/uso que anotam a AST |
| 37 | +│ ├── optimizer.* # Passes locais (CSE, DCE, eliminação de código morto) |
| 38 | +│ ├── codegen_lua.* # Emissão de Lua a partir da AST anotada |
| 39 | +│ └── main.c # Entrada do programa: orquestra todas as fases |
20 | 40 | ├── tests/ |
21 | | -│ ├── pass/ # casos que devem passar |
22 | | -│ └── fail/ # casos que precisam falhar |
23 | | -└── Makefile |
| 41 | +│ ├── pass/ # Pares C/Lua que devem equivaler |
| 42 | +│ └── fail/ # Exemplos que precisam produzir erro com .err esperado |
| 43 | +└── Makefile # Alvo único que compila/roda suite de testes |
24 | 44 | ``` |
25 | 45 |
|
26 | 46 | ## Ambiente de Desenvolvimento |
|
51 | 71 |
|
52 | 72 | # Testes |
53 | 73 |
|
54 | | -A pasta `tests/` está organizada em: |
55 | | -- `tests/semantic/pass`: casos que devem gerar Lua válido e executar com sucesso; |
56 | | -- `tests/semantic/fail`: casos que precisam falhar na análise semântica (arquivos `.err` com a mensagem esperada); |
| 74 | +A pasta `/tests/` está organizada em: |
| 75 | +- `/tests/pass/`: códigos em C e seus respectivos códigos Lua esperados; |
| 76 | +- `/tests/fail/`: códigos em C que devem gerar erros, com seus respectivos arquivos `.err` contendo mensagens esperadas; |
57 | 77 |
|
58 | | -Execute as suítes pelo Makefile: |
| 78 | +Para rodar os testes, utilize o comando: |
59 | 79 |
|
60 | 80 | ```bash |
61 | | -make test # verifica os smoke tests (tradução direta C -> Lua) |
| 81 | +make test |
62 | 82 | ``` |
63 | 83 |
|
64 | | -Os golden files utilizam o mesmo nome-base do arquivo `.c`, com extensão `.lua` (para PASS) ou `.golden`/`.err` (para FAIL). |
| 84 | +## Cobertura |
| 85 | + |
| 86 | +Válido (deve passar): |
| 87 | +- `arrays.c`: criação, atribuição e leitura em arrays unidimensionais. |
| 88 | +- `arith.c`: operações aritméticas básicas e precedência. |
| 89 | +- `effect.c`: garante que efeitos colaterais em chamadas/expressões sejam preservados. |
| 90 | +- `dead_variable.c`: declarações inutilizadas são removidas sem afetar o resto. |
| 91 | +- `char.c`: manipulação de caracteres tratados como inteiros. |
| 92 | +- `logic.c`: operadores lógicos e conversões implícitas para booleano. |
| 93 | +- `printf.c`: mapeamento de `printf`/`puts` para `print` com formatação. |
| 94 | +- `cse.c`: reutilização de subexpressões constantes via temporários. |
| 95 | +- `if.c`: condicionais simples. |
| 96 | +- `while.c`: laços `while` com updates no corpo. |
| 97 | +- `variable.c`: declarações/atribuições básicas com tipos primitivos. |
| 98 | +- `deadcode.c`: remoção de código após `return`. |
| 99 | +- `for.c`: laço `for` com init/condição/post traduzido para `while` Lua. |
| 100 | +- `expressions.c`: combinações de chamadas de função e expressões compostas. |
| 101 | + |
| 102 | +Inválido (deve falhar): |
| 103 | +- `bad_if.c`: `if` com condição inválida sinaliza erro sintático/semântico. |
| 104 | +- `wrong_assign.c`: incompatibilidade de tipos em atribuições. |
| 105 | +- `array_index_string.c`: índice de array usando string gera erro de tipo. |
| 106 | +- `int_plus_string.c`: soma entre inteiro e string não é permitida. |
| 107 | +- `scope_error.c`: detecção de variáveis fora de escopo. |
| 108 | +- `testes.c`: string sendo atribuida em variável int gera erro. |
| 109 | +- `missing_return.c`: função sem `return` obrigatório reporta erro. |
65 | 110 |
|
66 | 111 | # Membros |
67 | 112 |
|
|
0 commit comments