Analizador Léxico para TypeScript

Objetivo

Desarrollar un analizador léxico para TypeScript que reconozca y clasifique los tokens del lenguaje, siguiendo las especificaciones de la práctica.

Tokens a Reconocer

Identificadores: Nombres de variables, funciones, clases, interfaces, etc.
Números: Naturales y reales.
Cadenas: Texto entre comillas dobles o simples.
Palabras Reservadas: interface, type, enum, namespace, extends, implements, public, private, protected, async, await, Promise, etc.
Operadores: Aritméticos, comparación, lógicos, asignación, etc.
Delimitadores: Paréntesis, llaves, corchetes, punto y coma, etc.
Comentarios: De línea (//) y de bloque (/* */).
Tipos: Predefinidos (number, string, boolean, etc.) y genéricos (<T>).
Decoradores: Símbolo @ seguido de un identificador.
Modificadores de Acceso: public, private, protected.
Operadores de Tipo: Unión (|), intersección (&), opcional (?), non-null (!).

Autómatas Finitos Deterministas (AFD)

Se implementarán autómatas para cada categoría de token, siguiendo las expresiones regulares y diagramas de estado proporcionados en la práctica.

Implementación

Lenguaje: Python 3.
Estructura: Módulos separados para cada autómata, orquestados por un analizador léxico principal.
Entrada: Código fuente en TypeScript.
Salida: Lista de tokens clasificados y errores léxicos.

Interfaz Gráfica (GUI)

Tecnología: Tkinter.
Funcionalidades:
- Carga de archivos TypeScript.
- Visualización de tokens y errores.
- Resaltado de sintaxis.
- Exportación de resultados.

Ejecución

python3 lexer.py

Pruebas

python3 tests/test_typescript.py

Autores

[Tu Nombre]
[Otro Autor]

Fecha

[Fecha de Entrega]

Características Principales

Análisis Léxico Detallado: Identifica y clasifica tokens como palabras reservadas, identificadores, números (naturales y reales), cadenas (con comillas simples, dobles y acentos graves), comentarios (de línea y bloque), operadores y símbolos.
Interfaz Gráfica Interactiva:
- Editor de texto para ingresar código JavaScript.
- Visualización en tiempo real de tokens identificados en una tabla (lexema, categoría, fila, columna).
- Coloreado de tokens en la tabla según su categoría para mejor legibilidad.
- Panel dedicado para mostrar errores léxicos encontrados.
- Botones para analizar el código y limpiar los campos.
Manejo de Errores: Reporta caracteres no reconocidos indicando su posición.
Principio de Máxima Coincidencia: El lexer prioriza el token más largo posible.
Reglas Específicas:
- Los identificadores se truncan a un máximo de 10 caracteres.

Estructura del Proyecto

TLF_proyecto/
├── main.py                     # Punto de entrada para la aplicación (lanza la GUI)
├── gui/
│   └── interfaz.py             # Implementación de la interfaz gráfica con Tkinter
├── analizadores/
│   ├── identificador.py        # AFD para Identificadores (con truncamiento a 10 chars)
│   ├── numero_natural.py       # AFD para Números Naturales
│   ├── numero_real.py          # AFD para Números Reales (incluye notación científica básica)
│   ├── palabra_reservada.py    # AFD para Palabras Reservadas de JavaScript
│   ├── cadena.py               # AFD para Cadenas de texto ( "", \'\', `` ) con secuencias de escape
│   ├── comentario_linea.py     # AFD para Comentarios de Línea (//...)
│   ├── comentario_bloque.py    # AFD para Comentarios de Bloque (/*...*/)
│   └── simbolo.py              # AFD para Operadores y Símbolos (paréntesis, llaves, etc.)
├── lexer.py                    # Orquestador de los AFDs, realiza el análisis léxico completo
├── tokens.py                   # Definición de categorías de tokens (enum Categoria) y clase Token
├── tests/                      # Directorio para pruebas unitarias
│   ├── test_identificador.py
│   ├── test_numero_natural.py
│   ├── test_numero_real.py
│   ├── test_palabra_reservada.py
│   ├── test_cadena.py
│   ├── test_comentario_linea.py
│   ├── test_comentario_bloque.py
│   ├── test_simbolo.py
│   └── test_lexer.py           # Pruebas de integración para AnalizadorLexico
├── docs/                       # Documentación formal de los autómatas
│   └── automatas/              # Documentación de cada autómata con su expresión regular y diagrama
├── README.md                   # Este archivo
└── requirements.txt            # (Opcional, si se añaden dependencias externas)

Documentación

Este proyecto incluye documentación detallada:

Documentación General: Guía de uso, screenshots y descripción funcional
Documentación de Autómatas: Expresiones regulares y diagramas de estados
Requisitos Cumplidos: Detalle de cómo se cumple cada requisito

Requisitos

Python 3.6 o superior
Tkinter (generalmente incluido en las instalaciones estándar de Python)

Si Tkinter no está disponible en tu sistema (común en algunas instalaciones mínimas de Linux), puedes instalarlo. Por ejemplo, en sistemas basados en Debian/Ubuntu:

sudo apt-get update
sudo apt-get install python3-tk

Ejecución

Para ejecutar la aplicación y abrir la interfaz gráfica:

python3 main.py

O si estás en la raíz del proyecto y main.py es ejecutable:

./main.py

Analizadores Implementados

Todos los analizadores listados en la estructura del proyecto han sido implementados y probados:

IdentificadorAFD: Reconoce identificadores (letras, números, _, $), truncados a 10 caracteres.
NumeroNaturalAFD: Reconoce secuencias de dígitos.
NumeroRealAFD: Reconoce números con parte decimal y opcionalmente notación científica (ej: 123, 123.45, 1.2e3, 0.5E-2).
PalabraReservadaAFD: Reconoce palabras clave de JavaScript de una lista predefinida, asegurando que no sean prefijos de identificadores más largos.
CadenaAFD: Reconoce cadenas delimitadas por comillas dobles ("), simples (\'\'\'), o acentos graves (`), incluyendo el manejo de secuencias de escape como \\\", \\\', \\\``, \\, \n, \t`.
ComentarioLineaAFD: Reconoce comentarios de una sola línea que comienzan con //.
ComentarioBloqueAFD: Reconoce comentarios de bloque encerrados entre /* y */. (Nota: Actualmente no soporta bloques anidados de forma explícita, pero consumirá hasta el primer */.)
SimboloAFD: Reconoce una amplia gama de operadores (aritméticos, lógicos, de comparación, asignación, acceso, etc.) y delimitadores (paréntesis, llaves, corchetes, punto y coma, coma, dos puntos, operadores con ?).

Pruebas Unitarias

El proyecto incluye un conjunto de pruebas unitarias en el directorio tests/ para validar el comportamiento de cada AFD individual y la integración del AnalizadorLexico. Estas pruebas cubren diversos casos de éxito y error.

Contribuciones

Las contribuciones son bienvenidas. Si deseas añadir nuevas funcionalidades o mejorar las existentes:

Crea una nueva rama para tus cambios.
Realiza tus modificaciones.
Asegúrate de añadir o actualizar las pruebas unitarias correspondientes.
Verifica que todas las pruebas pasen.
Envía un Pull Request.

Licencia

Este proyecto está bajo la licencia MIT.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Analizador Léxico para TypeScript

Objetivo

Tokens a Reconocer

Autómatas Finitos Deterministas (AFD)

Implementación

Interfaz Gráfica (GUI)

Ejecución

Pruebas

Autores

Fecha

Características Principales

Estructura del Proyecto

Documentación

Requisitos

Ejecución

Analizadores Implementados

Pruebas Unitarias

Contribuciones

Licencia

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
.idea		.idea
__pycache__		__pycache__
analizadores		analizadores
docs		docs
gui		gui
tests		tests
README.md		README.md
__init__.py		__init__.py
lexer.py		lexer.py
main.py		main.py
requirements.txt		requirements.txt
tokens.py		tokens.py
utils.py		utils.py

Folders and files

Latest commit

History

Repository files navigation

Analizador Léxico para TypeScript

Objetivo

Tokens a Reconocer

Autómatas Finitos Deterministas (AFD)

Implementación

Interfaz Gráfica (GUI)

Ejecución

Pruebas

Autores

Fecha

Características Principales

Estructura del Proyecto

Documentación

Requisitos

Ejecución

Analizadores Implementados

Pruebas Unitarias

Contribuciones

Licencia

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages