dpuenteramirez
diff --git a/‎README.md‎
Lines changed: 32 additions & 35 deletions b/‎README.md‎
Lines changed: 32 additions & 35 deletions
diff --git a/‎docs/README.md‎
Lines changed: 0 additions & 28 deletions b/‎docs/README.md‎
Lines changed: 0 additions & 28 deletions
diff --git a/‎docs/anexos.pdf‎
135 Bytes b/‎docs/anexos.pdf‎
135 Bytes
diff --git a/‎docs/bibliografia.bib‎
Lines changed: 3 additions & 1 deletion b/‎docs/bibliografia.bib‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎docs/img/memoria/aspectos-relevantes/General.png‎
506 KB b/‎docs/img/memoria/aspectos-relevantes/General.png‎
506 KB
diff --git a/‎docs/img/readme.txt‎
Lines changed: 0 additions & 1 deletion b/‎docs/img/readme.txt‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎docs/memoria.pdf‎
377 KB b/‎docs/memoria.pdf‎
377 KB
diff --git a/‎docs/memoria.tex‎
Lines changed: 20 additions & 2 deletions b/‎docs/memoria.tex‎
Lines changed: 20 additions & 2 deletions
diff --git a/‎docs/tex/2_Objetivos_del_proyecto.tex‎
Lines changed: 24 additions & 1 deletion b/‎docs/tex/2_Objetivos_del_proyecto.tex‎
Lines changed: 24 additions & 1 deletion
diff --git a/‎docs/tex/3_Conceptos_teoricos.tex‎
Lines changed: 4 additions & 4 deletions b/‎docs/tex/3_Conceptos_teoricos.tex‎
Lines changed: 4 additions & 4 deletions
@@ -9,6 +9,7 @@ alt="ISMSSL by DNX"></a>
   <br>
 </h1>
 
+---
 <h4 align="center">Instance selection methods for semi-supervised learning.</h4>
 <div align="center">
   <img alt="Codacy coverage" src="https://img.shields.io/codacy/coverage/c336db4b8f9b4196bc802a544a18b83b?logo=codacy">
@@ -27,61 +28,57 @@ alt="ISMSSL by DNX"></a>
   <img alt="GitHub repo size" src="https://img.shields.io/github/repo-size/dpr1005/Semisupervised-learning-and-instance-selection-methods?color=purple&logo=github">
 </div>
 
-
-<br>
-
-<br>
+---
 <p align="center">
-  <a href="#key-features">Key Features</a> •
-  <a href="#setup">Setup</a> •
-  <a href="#usage-guide">Usage guide</a> •
-  <a href="#download">Download</a> •
-  <a href="#credits">Credits</a> •
-  <a href="#related">Related</a> •
-  <a href="#license">License</a>
+  <a href="#description">Project Description</a> •
+  <a href="#download-and-installation">Download and Installation</a> •
+  <a href="#dependencies">Dependencies</a> •
+  <a href="#support">Support</a>
 </p>
 
 
+---
+## Description
+This project has an implementation of common algorithms in the literature, both instance selection algorithms and semi-supervised learning algorithms.
 
-## Key Features
-
-* TBD
-
-## Setup
-
-TBD
+Among the objectives of the project is that the implemented algorithms are correct and complete with their respective original papers in which they were presented.
 
-## Usage guide
+Likewise, there are multiple experiment configuration files for the aforementioned verification, and for the realization of a research process on the behavior of semi-supervised learning algorithms when noise filtering is performed.
 
-TBD
+---
+## Download and installation
+IS-SSL is distributed under two libraries, both are available in their last 
+versions in PIP. 
+- Instance Selection Algorithms. [PIP](https://pypi.org/project/InstanceSelectionDNX/).
+  
+````bash
+pip install InstanceSelectionDNX
+````
 
+- Semi-Supervised Algorithms. [PIP](https://pypi.org/project/SemiSupervisedLearningDNX/).
+````bash
+pip install SemiSupervisedLearningDNX
+````
 
-## Download
+Being the nature a Python project, it is easily importable from within the 
+repo and its [releases](https://github.com/dpr1005/Semisupervised-learning-and-instance-selection-methods/releases).
 
-TBD
 
-## Credits
+---
+## Dependencies
 
 This software uses the following open source packages:
 
-- [scikit-learn](https://sklearn.org)
 - [NumPy](https://numpy.org)
+- [Pandas](https://pandas.pydata.org/)
+- [Scikit-Learn](https://sklearn.org)
+- [Scipy](https://scipy.org)
 
-
-## Related
-
-TBD
-
+---
 ## Support
-
 <a href="https://buymeacoffee.com/danielpuente" target="_blank"><img src="https://www.buymeacoffee.com/assets/img/custom_images/purple_img.png" alt="Buy Me A Coffee" style="height: 41px !important;width: 174px !important;box-shadow: 0px 3px 2px 0px rgba(190, 190, 190, 0.5) !important;-webkit-box-shadow: 0px 3px 2px 0px rgba(190, 190, 190, 0.5) !important;" ></a>
 
 
-
-## License
-
-MIT
-
 ---
 
 > GitHub [@dpr1005](https://github.com/dpr1005) &nbsp;&middot;&nbsp;
 
@@ -517,4 +517,6 @@ @article{wu2018self
   publisher={Elsevier}
 }
 
-@misc{SCRUMWIKI, title={Scrum (desarrollo de software)}, url={https://es.wikipedia.org/wiki/Scrum-(desarrollo-de-software)}, note={https://es.wikipedia.org/wiki/Scrum-(desarrollo-de-software)}, year={2022}}
+@misc{SCRUMWIKI, title={Scrum (desarrollo de software)}, url={https://es.wikipedia.org/wiki/Scrum-(desarrollo-de-software)}, note={https://es.wikipedia.org/wiki/Scrum-(desarrollo-de-software)}, year={2022}}
+
+@misc{SKLEARNGUIDELINES, title={Scikit-Learn Coding guidelines}, url={https://scikit-learn.org/stable/developers/develop.html#coding-guidelines}, year={2022}, author={scikit-learn developers}}
@@ -65,12 +65,30 @@
 	\FloatBarrier
 }
 
-\newcommand{\imagenflotante}[2]{
+\newcommand{\imagenRuta}[3]{
+	\begin{figure}[!h]
+		\centering
+		\includegraphics[width=0.9\textwidth]{#1}
+		\caption{#2}\label{fig:#3}
+	\end{figure}
+	\FloatBarrier
+}
+
+\newcommand{\imagenFlotante}[3]{
 	\begin{figure}%[!h]
 		\centering
 		\includegraphics[width=0.9\textwidth]{#1}
-		\caption{#2}\label{fig:#1}
+		\caption{#2}\label{fig:#3}
+	\end{figure}
+}
+
+\newcommand{\imagenAncho}[4]{
+	\begin{figure}[H]
+		\centering
+		\includegraphics[width=#4\textwidth]{#1}
+		\caption{#2}\label{fig:#3}
 	\end{figure}
+	\FloatBarrier
 }
 
 
 
@@ -1,3 +1,26 @@
 \capitulo{2}{Objetivos del proyecto}
+Los principales objetivos del proyecto son cuatro:
 
-Este apartado explica de forma precisa y concisa cuales son los objetivos que se persiguen con la realización del proyecto. Se puede distinguir entre los objetivos marcados por los requisitos del software a construir y los objetivos de carácter técnico que plantea a la hora de llevar a la práctica el proyecto.
+\begin{enumerate}
+\item Diseño e implementación de una biblioteca con los algoritmos de selección de instancias más comunes en la literatura.
+\item Diseño e implementación de una biblioteca con una serie de algoritmos de aprendizaje semi-supervisado.
+\item Integración de las bibliotecas con la plataforma de \texttt{MLaaS} de la Universidad de Burgos (\texttt{UBUMLaaS}).
+\item Diseño y puesta en producción de la parte de administración de \texttt{UBUMLaaS}.
+\end{enumerate}
+
+
+El enfoque que se le debe dar a las bibliotecas, en adelante \texttt{IS-SSL}\footnote{\textit{Instance Selection - Semi-Supervised Learning.}}, tanto de selección de instancias como de aprendizaje semi-supervisado, deberá permitir de manera sencilla la inclusión o añadido de nuevos algoritmos en un futuro, no siendo necesaria realizar grandes refactorizaciones para ello. Mediante ello se obtendrá un producto escalable y con un mantenimiento relativamente sencillo.
+
+\texttt{UBULMLaaS} fue un proyecto desarrollado por ADMIRABLE y se paralizó en 2019, por lo que necesitará una actualización de librerías, interfaz gráfica, seguridad y actualización de la base de datos; entre otras cosas. Independientemente de los cambios, debe primar la sencillez de uso que la aplicación, de forma que la curva de aprendizaje sea mínima.
+
+\subsection{Objetivos técnicos}
+Además de lo anteriormente mencionado, el proyecto cuenta con una serie de objetivos técnicos que se pueden resumir en:
+\begin{itemize}
+\item Los algoritmos imeplementados en \texttt{IS-SSL} deberán seguir la guía de estilo de \textit{Scikit-Learn}~\cite{SKLEARNGUIDELINES}, permitiendo a la comunidad científica acostumbrada al uso de la mencionada biblioteca en \texttt{Python}, hacer uso de \texttt{IS-SSL} de igual manera.
+\item Los algoritmos deberán de ser validados de alguna manera, ya sea con la literatura o mediante pares, para asegurar un correcto funcionamiento. 
+\item \texttt{UBUMLaaS} procederá a tener distintos tipos o categorías de usuarios, debiendo dejar <<la puerta abierta>> a nuevos tipos de usuarios en el futuro.
+\item \texttt{UBUMLaaS} podrá ser portado y desplegado sobre  \textit{bare metal} o mediante contenedores de Docker en cualquier sistema compatible.
+\item \texttt{UBUMLaaS} debe mantener todas sus funcionalidades previas a este proyecto.
+\item \texttt{UBUMLaaS} mostrará estadísticas generadas en tiempo real, se deberá de sortear la problemática de la concurrencia de acceso a registros de la base de datos, así como ficheros temporales.
+\item \texttt{UBUMLaaS} posee su propia API REST escrita en Python y emplea el \textit{framework web} Flask. No se deberá sobrecargar su uso, la carga de trabajo deberá estar balanceada entre cliente y servidor.
+\end{itemize}
@@ -3,8 +3,8 @@
 El proyecto tiene una relación directa con la minería de datos y los conceptos que lo rodean. 
 
 \section{Aprendizaje automático (\textit{machine learning})}\label{sec:machine-learning}
-En~\cite{sanchez_2020} se define el aprendizaje automático (\textit{machine learning}) como una rama dentro del campo de la Inteligencia Artificial que proporciona a los sistemas la capacidad de aprender y mejorar de manera automática, a partir de la experiencia. Estos sistemas transforman los datos en información, y con esta información pueden tomar decisiones. Este tipo de modelos se crean a base del uso masivo de datos. Cuando se dispone de los datos suficientes para entrenar un modelo comienza el proceso de aprendizaje. El objetivo de este aprendizaje es descubrir patrones ocultos en los datos. En muchas ocasiones el resultado del aprendizaje, el modelo, es una función que dadas unos datos de entrada clasifica o predice correctamente una salida. Como se puede ver en la Figura~\ref{fig:../img/memoria/Machine-learning-overview.pdf} el aprendizaje automático, \textit{machine learning}, posee diferentes aproximaciones, siendo la interfaz diferenciadora entre ellas la forma de uso de las instancias.
-\imagenflotante{../img/memoria/Machine-learning-overview.pdf}{\textit{Machine learning overview}~\cite{technovert_2020}}
+En~\cite{sanchez_2020} se define el aprendizaje automático (\textit{machine learning}) como una rama dentro del campo de la Inteligencia Artificial que proporciona a los sistemas la capacidad de aprender y mejorar de manera automática, a partir de la experiencia. Estos sistemas transforman los datos en información, y con esta información pueden tomar decisiones. Este tipo de modelos se crean a base del uso masivo de datos. Cuando se dispone de los datos suficientes para entrenar un modelo comienza el proceso de aprendizaje. El objetivo de este aprendizaje es descubrir patrones ocultos en los datos. En muchas ocasiones el resultado del aprendizaje, el modelo, es una función que dadas unos datos de entrada clasifica o predice correctamente una salida. Como se puede ver en la Figura~\ref{fig:Machine-learning-overview} el aprendizaje automático, \textit{machine learning}, posee diferentes aproximaciones, siendo la interfaz diferenciadora entre ellas la forma de uso de las instancias.
+\imagenFlotante{../img/memoria/Machine-learning-overview.pdf}{\textit{Machine learning overview}~\cite{technovert_2020}.}{Machine-learning-overview}
 
 \subsection{Aprendizaje supervisado}\label{subsec:Aprendizaje-Supervisado}
 El aprendizaje automático puede ser resumido como <<aprender de ejemplos>>. Al programa se le proporcionan dos conjuntos de datos, uno de entrenamiento y otro de validación~\cite{learned2014introduction}. El objetivo es simple, debe de <<aprender>> en función del conjunto de datos etiquetado proporcionado como entrenamiento para posteriormente identificar las correspondientes etiqueta/s de cada instancia del conjunto de validación con la mayor precisión posible. 
@@ -406,8 +406,8 @@ \section{Técnicas de selección de instancias}\label{sec:tecnicas-seleccion-ins
 	\toprule
 	Edición de Wilson (ENN)        & $O(n^2)$      &~\cite{wilson1972asymptotic}\\ 
 	\rowcolor[HTML]{EFEFEF} 
-	Condensado de Hart (CNN)     & $O(n^2)$         &~\cite{hart1968condensed}\\ 
-	Condensado Reducido (RNN)     & $O(n^2)$         &~\cite{gates1972reduced}  \\ 
+	Condensado de Hart (CNN)     & $O(n^3)$         &~\cite{hart1968condensed}\\ 
+	Condensado Reducido (RNN)     & $O(n^3)$         &~\cite{gates1972reduced}  \\ 
 	\rowcolor[HTML]{EFEFEF} 
 	\textit{Iterative Case Filtering} (ICF)     & $O(n^2)$              &~\cite{brighton2002advances}\\ 
 	Subconjunto Selectivo Modificado (MSS)    & $O(n^2)$             &~\cite{barandela2005decision}\\
Original file line number	Diff line number	Diff line change
`@@ -517,4 +517,6 @@ @article{wu2018self`
`517`	`517`	`publisher={Elsevier}`
`518`	`518`	`}`
`519`	`519`
`520`		`-@misc{SCRUMWIKI, title={Scrum (desarrollo de software)}, url={https://es.wikipedia.org/wiki/Scrum-(desarrollo-de-software)}, note={https://es.wikipedia.org/wiki/Scrum-(desarrollo-de-software)}, year={2022}}`
	`520`	`+@misc{SCRUMWIKI, title={Scrum (desarrollo de software)}, url={https://es.wikipedia.org/wiki/Scrum-(desarrollo-de-software)}, note={https://es.wikipedia.org/wiki/Scrum-(desarrollo-de-software)}, year={2022}}`
	`521`	`+`
	`522`	`+@misc{SKLEARNGUIDELINES, title={Scikit-Learn Coding guidelines}, url={https://scikit-learn.org/stable/developers/develop.html#coding-guidelines}, year={2022}, author={scikit-learn developers}}`