Implementación del algoritmo kNN en pyspark, para predicir múltiples sálidas a la vez,
- Clonar el repositorio
- Crear un entorno virtual en el repositorio:
python3 -m venv <nombre-del-entorno>
- Activar el entorno virtual.
- Instalar las dependencias
pip install -r requirements.txt
- Generar los datos:
python data.py
- Ejecutar fichero de prueba:
main.py
mediante la ejecución del archivo data.py se generarán datos aleatorios con el propósito de evaluar el rendimiento del algoritmo, para evaluar la eficacia se deben usar datos reales.