aboutsummaryrefslogtreecommitdiffstats
path: root/chapter
diff options
context:
space:
mode:
authorMitsuo Tokumori <[email protected]>2023-06-07 12:07:21 -0500
committerMitsuo Tokumori <[email protected]>2023-06-07 12:07:21 -0500
commitf734026991f16f90a5a436e3d1c159d91f80afc1 (patch)
treebbbb7b1a9f0da7f2183324a9547337617c4b58a4 /chapter
parentdf6a32e5a87692381c6e9ec08b316f45e6892ea4 (diff)
downloadthesis-f734026991f16f90a5a436e3d1c159d91f80afc1.tar.gz
thesis-f734026991f16f90a5a436e3d1c159d91f80afc1.tar.bz2
thesis-f734026991f16f90a5a436e3d1c159d91f80afc1.zip
Complete E3 sections for Plan de Tesis Appendix
Diffstat (limited to 'chapter')
-rw-r--r--chapter/01-cover.tex2
-rw-r--r--chapter/10-generalidades.tex6
-rw-r--r--chapter/90-anexos.tex167
3 files changed, 170 insertions, 5 deletions
diff --git a/chapter/01-cover.tex b/chapter/01-cover.tex
index b7cbb82..86710bb 100644
--- a/chapter/01-cover.tex
+++ b/chapter/01-cover.tex
@@ -22,7 +22,7 @@
\vspace{1cm}
-{\bf Tesis para obtener el título profesional de Ingeniería Informática}\\[1.0cm]
+{\bf Tesis para obtener el título profesional en Ingeniería Informática}\\[1.0cm]
% {\bf Entregable Parcial 1.1}\\[1.0cm]
{\bf AUTOR}\\[0.5cm]
{Roberto Mitsuo Tokumori Terry}\\
diff --git a/chapter/10-generalidades.tex b/chapter/10-generalidades.tex
index 35e52a9..40af41b 100644
--- a/chapter/10-generalidades.tex
+++ b/chapter/10-generalidades.tex
@@ -278,7 +278,7 @@ de los estudiantes, y el seguimiento costoso y complejo de los estudiantes en
riesgo. Todo esto contribuye a que los estudiantes abandonen sus estudios antes
de que se puedan implementar medidas de apoyo eficaces.
-\section{Objetivos}
+\section{Objetivos} \label{sec:objetivos}
En esta sección se define el objetivo general, para luego ser desglosado en
objetivos específicos. También se definen los resultados esperados asociados
@@ -299,12 +299,12 @@ mejorando así la retención de estudiantes.
\item \textbf{O1} Identificar los factores que influyen en la deserción estudiantil
universitaria usando técnicas estadísticas
- \item \textbf{O2} Implementar modelos de Aprendizaje Automático que realicen
+ \item \textbf{O2} Implementar modelos de aprendizaje automático que realicen
predicciones sobre la deserción estudiantil
\item \textbf{O3} Implementar un sistema que permita a las universidades, realizar un
proceso de detección temprana de deserción estudiantil. Utilizando los
- modelos de Aprendizaje Automático, mencionados anteriormente.
+ modelos de aprendizaje automático, mencionados anteriormente.
\end{itemize}
\subsection{Resultados esperados}
diff --git a/chapter/90-anexos.tex b/chapter/90-anexos.tex
index 8b4dfde..9a5c8bf 100644
--- a/chapter/90-anexos.tex
+++ b/chapter/90-anexos.tex
@@ -77,12 +77,82 @@ razones.
\subsection{Viabilidad temporal}
+El proyecto tendrá una duración de 7 meses, desde julio del 2023, hasta fines de
+diciembre del 2023. Los plazos de los resultados esperados, resultado de la
+planificación se pueden evidenciar en el cronograma de actividades del proyecto
+(Ver tabla).
+
\subsection{Viabilidad técnica}
+Se consideran 2 principales barreras técnicas para estimar la complejidad del
+proyecto, y por tanto los plazos de tiempo para cada resultado esperado. Por un
+lado se encuentra la implementación de modelos de aprendizaje automático (ML), y
+por el otro se encuentra la implementación del sistema de información que
+utilice estos modelos.
+
+La implementación de modelos de ML es viable porque se poseen los conocimientos
+base respecto a las técnicas (estadística, manejo de bases de datos,
+análisis de datos, programación), y herramientas de software a utilizar.
+Sin embargo, se requerirá aprender a mayor profundidad las técnicas de
+aprendizaje automático para lo cual se cuenta con el apoyo de especialistas
+que puedan dar guía en el aprendizaje, y también realizar las revisiones
+pertinentes para los resultados esperados.
+
+Por otro lado, para la implementación del sistema de información también es
+viable porque también se cuentan los conocimientos base para planear, definir,
+e implementar un sistema de información. Y se cuenta con el apoyo
+de especialistas para la revisión de los resultados esperados.
+
\subsection{Viabilidad económica}
+El proyecto no demanda una inversión económica significativa. Las
+herramientas de software necesarias no requieren una licencia especial que
+implique gastos adicionales. Y el conjunto de datos requerido para el análisis
+puede ser solicitado a universidades locales.
+
\section{Alcance del proyecto}
+El alcance de este proyecto es delimitado por los objetivos y resultados
+esperados definidos en la \autoref{sec:objetivos}. Para recapitular, el
+objetivo general es: desarrollar un sistema, basado en técnicas de aprendizaje
+automático, que permita predecir la deserción estudiantil en el ámbito
+universitario, mejorando así la retención de estudiantes. Con la intención de
+delimitar mejor el alcance, se describen en esta sección las actividades a alto
+del proyecto.
+
+Primero, se realizará el análisis descriptivo, limpieza, y
+preprocesamiento del conjunto de datos. Se utilizará el lenguaje de
+programación Python, y librerías especializadas para la realización de estas
+tareas, como Pandas, NumPy, y Matplotlib. El entorno de desarrollo será Visual
+Studio Code y Jupyter Notebooks. Todo ejecutando en una laptop personal bajo el
+sistema operativo Linux. En cuanto a la metodología de trabajo para esta
+parte del análisis de datos se utilizará KDD (Knowledge Discovery in Databases).
+
+Luego, se generarán modelos de aprendizaje automático, utilizando algoritmos
+ya implementados y de libre disponibilidad. Una librería en Python muy
+utilizada que facilita el uso de dichos algorítmos es scikit-learn. El output
+de los algorítmos de aprendizaje automático son los modelos de predicción
+entrenados, los cuales luego son utilizados para realizar predicciones en base a
+nuevos datos (\textit{datapoints}). La dificultad se encuentra en optimizar la
+generación de estos modelos según las características del conjunto de datos.
+Los pasos previos de limpieza y preprocesamiento son cruciales, así como también
+la selección de algoritmos y la optimización de sus respectivos hiperparámetros
+\autocite{Kemper2020}.
+
+Finalmente, se implementará un sistema de información que utilice el mejor
+modelo de predicción de la deserción estudiantil universitaria. El cual pueda
+facilitar la utilización del modelo por parte del usuario. Se utilizará el
+marco Ágil para la captación de requisitos del sistema mediante User Story
+Mapping. Para el protitado de la solución se utilizará la herramienta Figma
+(web). Y para la implementación del sistema de información se utilizará
+tecnología web, para que posteriormente pueda ser desplegado en un servidor de
+algún proveedor de servicios en la nube, como por ejemplo AWS (Amazon).
+
+El presente proyecto no contempla la implementación de nuevos algoritmos de
+aprendizaje automático. Ni tampoco la implantación del sistema en alguna
+universidad del país.
+
+
\section{Restricciones}
El proyecto depende de la disposición de conjuntos de datos de las universidades.
@@ -91,8 +161,103 @@ ya sea por la complejidad en extraer la información de sus sistemas
informáticos, o porque simplemente no está dentro de sus procedimientos
compartir estos datos.
-Además, el proyecto depende de la disponibilidad de especialistas en
+Además, el proyecto depende de la disponibilidad de los especialistas en
aprendizaje automático, sistemas de información, y usabilidad. Quienes se
encargarán de validar los resultados esperados del proyecto.
\section{Identificación de riesgos}
+
+En la \autoref{tab:riesgos-proyecto} se listan los riesgos identificados del
+proyecto. Se cuantifica la P (Probabilidad), I (Impacto), y S (Severidad),
+de cada riesgo, de acuerdo a las siguientes fórmulas:
+
+\begin{itemize}
+ \item P: Probabilidad del riesgo. Número real del 0 al 1. Intenta
+ representar la probabilidad de que suceda el evento durante la
+ realización del proyecto.
+ \item I: Impacto del riesgo. Número real del 0 al 1. Donde \(I = 0\)
+ representa un riesgo con consecuencias muy bajas o inperceptibles, mientras
+ \(I = 1\) representa que el riesgo tiene consecuencias críticas para el
+ éxito del proyecto.
+ \item S: Severidad del riesgo. Calculado como \(S = P*I\).
+ \begin{itemize}
+ \item Severidad baja si \(I < 0.05\)
+ \item Severidad media si \(0.05 <= I < 0.20\)
+ \item Severidad alta si \(0.20 < I\)
+ \end{itemize}
+\end{itemize}
+
+\begin{table} [H] % htbp
+ \centering
+ \small
+ \caption{Riesgos del proyecto}
+ \label{tab:riesgos-proyecto}
+ \begin{tabular} {*{2}{|p{0.20\linewidth}} *{3}{|p{0.025\linewidth}} *{3}{|p{0.15\linewidth}}|}
+ \hline
+
+ \textbf{Riesgo} &
+ \textbf{Materialización del riesgo} &
+ \textbf{P} &
+ \textbf{I} &
+ \textbf{S} &
+ \textbf{Mitigación} &
+ \textbf{Contingencia} \\
+ \hline
+ \hline
+
+ Los expertos no se encuentran disponibles para revisar de los
+ entregables a tiempo para cumplir con el cronograma &
+ Demoras en el tiempo de respuesta de los expertos. Dificultad para
+ contactar algún experto. &
+ .8 & .5 & .4 &
+ Coordinar con la mayor anticipación posible con los expertos.
+ Contar con al menos 2 expertos de cada área en caso uno no se encuentre
+ disponible. &
+ Buscar a más expertos del área requerida para que pueda revisar
+ el entregable a tiempo \\
+ \hline
+
+ No contar con el conjunto de datos requerido para el análisis &
+ Demoras en el tiempo de respuesta de las universidades contactadas
+ para adquirir el conjunto de datos. Dificultad por parte de las
+ universidades para extraer la información requerida. Las universidades
+ contactadas no pueden compartir el conjunto de datos requeridos. &
+ .5 & 1 & .5 &
+ Coordinar con la mayor anticipación posible con las universidades.
+ Contactar con al menos 3 universidades para requerir los conjuntos de
+ datos. &
+ Buscar en Internet si existe algún conjunto de datos de libre disponibilidad.
+ Buscar a más universidades para adquirir el conjunto de datos. \\
+ \hline
+
+ Pérdida de información debido a pérdida equipos informáticos &
+ Robo de la laptop. Corrupción del disco duro. &
+ .2 & .8 & .16 &
+ Mantener 2 copias de seguridad (\textit{backups}) de la información.
+ Mantener una de esas copias en la nube. Actualizar diariamente
+ las copias de seguridad. &
+ Restaurar la información utilizando la última copia de seguridad.
+ Comprar nuevo equipo informático de reemplazo. \\
+ \hline
+
+ Planeamiento inadecuado de las actividades del proyecto &
+ Se identifica una actividad significativa requerida para el desarrollo
+ del proyecto. Estimación del tiempo requerido para la actividad
+ insuficiente &
+ .4 & .4 & .16 &
+ Realizar el planeamiento de actividades junto con el asesor.
+ Contar con feedback de expertos para la estimación de tiempo
+ de actividades fuera del expertise del tesista. &
+ Reestructurar las actividades o el cronograma siguiendo el procedimiento
+ especificado en el documento de Procesos de Tesis \\
+ \hline
+ \end{tabular}
+\end{table}
+
+% \section{Estructura de descomposición del trabajo (EDT)}
+
+% \section{Lista de tareas}
+
+% \section{Cronograma de actividades del proyecto}
+
+% \section{Lista de recursos}