Projeto de Tradução Automática de Sentenças (English to Portuguese)

Este projeto implementa um modelo de tradução automática de sentenças do inglês para o português utilizando redes neurais LSTM com Keras. O projeto envolve a preparação de dados, tokenização, construção e treinamento do modelo, além de uma interface para testar a tradução de novas sentenças.

Arquivos do Projeto

1. `main.py`

Este script realiza as seguintes tarefas:

Baixa e carrega os datasets:
- sentences.csv contendo sentenças em várias línguas.
- links.csv contendo links entre sentenças que são traduções uma da outra.
Filtra as sentenças:
- Seleciona sentenças em inglês e português.
- Junta os datasets para obter pares de sentenças traduzidas.
Pré-processamento:
- Adiciona tokens especiais <start> e <end> às sentenças em português.
- Realiza a tokenização das sentenças.
- Converte as sentenças em sequências de tokens e realiza padding para um comprimento fixo.
Construção do modelo:
- Define um modelo seq2seq com LSTM para a tradução.
- Compila e treina o modelo.
Salva os artefatos:
- Salva os tokenizadores e o modelo treinado.

2. `test_model.py`

Este script realiza as seguintes tarefas:

Carrega os tokenizadores e o modelo salvo.
Reconstrói os modelos de encoder e decoder a partir do modelo salvo.
Define funções auxiliares:
- decode_sequence: Para decodificar uma sequência de entrada e obter a tradução.
- prepare_input: Para preparar o texto de entrada.
Testa o modelo com algumas frases de exemplo, imprimindo a tradução de cada uma.

Link para os Artefatos

Todos os artefatos necessários para a execução do projeto (modelos, datasets, tokenizadores) estão disponíveis no Google Drive:

Link para Google Drive

Como Executar

Passo 1: Preparar o Ambiente

Instalar as dependências necessárias:
```
pip install -r requirements.txt
```
Baixar e preparar os datasets executando main.py:
```
python main.py
```

Passo2: Testar o Modelo

Executar test_model.py para testar o modelo com novas sentenças:
```
python test_model.py
```

Estrutura dos Arquivos

main.py: Script para preparação dos dados, construção e treinamento do modelo. test_model.py: Script para testar o modelo treinado com novas sentenças.

Conclusão

Este projeto demonstra a construção de um sistema de tradução automática utilizando LSTM. Ele abrange desde a preparação dos dados até a implementação e teste do modelo, fornecendo uma base sólida para aplicações mais avançadas de tradução automática.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt
test_model.py		test_model.py
tokenizer_eng.pkl		tokenizer_eng.pkl
tokenizer_por.pkl		tokenizer_por.pkl

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projeto de Tradução Automática de Sentenças (English to Portuguese)

Arquivos do Projeto

1. `main.py`

2. `test_model.py`

Link para os Artefatos

Como Executar

Passo 1: Preparar o Ambiente

Passo2: Testar o Modelo

Estrutura dos Arquivos

Conclusão

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

josehlp1/PT-to-EN-Translator-Model

Folders and files

Latest commit

History

Repository files navigation

Projeto de Tradução Automática de Sentenças (English to Portuguese)

Arquivos do Projeto

1. main.py

2. test_model.py

Link para os Artefatos

Como Executar

Passo 1: Preparar o Ambiente

Passo2: Testar o Modelo

Estrutura dos Arquivos

Conclusão

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

1. `main.py`

2. `test_model.py`

Packages