diff options
Diffstat (limited to 'chapter')
| -rw-r--r-- | chapter/01-cover.tex | 2 | ||||
| -rw-r--r-- | chapter/10-generalidades.tex | 6 | ||||
| -rw-r--r-- | chapter/90-anexos.tex | 167 |
3 files changed, 170 insertions, 5 deletions
diff --git a/chapter/01-cover.tex b/chapter/01-cover.tex index b7cbb82..86710bb 100644 --- a/chapter/01-cover.tex +++ b/chapter/01-cover.tex @@ -22,7 +22,7 @@ \vspace{1cm} -{\bf Tesis para obtener el título profesional de Ingeniería Informática}\\[1.0cm] +{\bf Tesis para obtener el título profesional en Ingeniería Informática}\\[1.0cm] % {\bf Entregable Parcial 1.1}\\[1.0cm] {\bf AUTOR}\\[0.5cm] {Roberto Mitsuo Tokumori Terry}\\ diff --git a/chapter/10-generalidades.tex b/chapter/10-generalidades.tex index 35e52a9..40af41b 100644 --- a/chapter/10-generalidades.tex +++ b/chapter/10-generalidades.tex @@ -278,7 +278,7 @@ de los estudiantes, y el seguimiento costoso y complejo de los estudiantes en riesgo. Todo esto contribuye a que los estudiantes abandonen sus estudios antes de que se puedan implementar medidas de apoyo eficaces. -\section{Objetivos} +\section{Objetivos} \label{sec:objetivos} En esta sección se define el objetivo general, para luego ser desglosado en objetivos específicos. También se definen los resultados esperados asociados @@ -299,12 +299,12 @@ mejorando así la retención de estudiantes. \item \textbf{O1} Identificar los factores que influyen en la deserción estudiantil universitaria usando técnicas estadísticas - \item \textbf{O2} Implementar modelos de Aprendizaje Automático que realicen + \item \textbf{O2} Implementar modelos de aprendizaje automático que realicen predicciones sobre la deserción estudiantil \item \textbf{O3} Implementar un sistema que permita a las universidades, realizar un proceso de detección temprana de deserción estudiantil. Utilizando los - modelos de Aprendizaje Automático, mencionados anteriormente. + modelos de aprendizaje automático, mencionados anteriormente. \end{itemize} \subsection{Resultados esperados} diff --git a/chapter/90-anexos.tex b/chapter/90-anexos.tex index 8b4dfde..9a5c8bf 100644 --- a/chapter/90-anexos.tex +++ b/chapter/90-anexos.tex @@ -77,12 +77,82 @@ razones. \subsection{Viabilidad temporal} +El proyecto tendrá una duración de 7 meses, desde julio del 2023, hasta fines de +diciembre del 2023. Los plazos de los resultados esperados, resultado de la +planificación se pueden evidenciar en el cronograma de actividades del proyecto +(Ver tabla). + \subsection{Viabilidad técnica} +Se consideran 2 principales barreras técnicas para estimar la complejidad del +proyecto, y por tanto los plazos de tiempo para cada resultado esperado. Por un +lado se encuentra la implementación de modelos de aprendizaje automático (ML), y +por el otro se encuentra la implementación del sistema de información que +utilice estos modelos. + +La implementación de modelos de ML es viable porque se poseen los conocimientos +base respecto a las técnicas (estadística, manejo de bases de datos, +análisis de datos, programación), y herramientas de software a utilizar. +Sin embargo, se requerirá aprender a mayor profundidad las técnicas de +aprendizaje automático para lo cual se cuenta con el apoyo de especialistas +que puedan dar guía en el aprendizaje, y también realizar las revisiones +pertinentes para los resultados esperados. + +Por otro lado, para la implementación del sistema de información también es +viable porque también se cuentan los conocimientos base para planear, definir, +e implementar un sistema de información. Y se cuenta con el apoyo +de especialistas para la revisión de los resultados esperados. + \subsection{Viabilidad económica} +El proyecto no demanda una inversión económica significativa. Las +herramientas de software necesarias no requieren una licencia especial que +implique gastos adicionales. Y el conjunto de datos requerido para el análisis +puede ser solicitado a universidades locales. + \section{Alcance del proyecto} +El alcance de este proyecto es delimitado por los objetivos y resultados +esperados definidos en la \autoref{sec:objetivos}. Para recapitular, el +objetivo general es: desarrollar un sistema, basado en técnicas de aprendizaje +automático, que permita predecir la deserción estudiantil en el ámbito +universitario, mejorando así la retención de estudiantes. Con la intención de +delimitar mejor el alcance, se describen en esta sección las actividades a alto +del proyecto. + +Primero, se realizará el análisis descriptivo, limpieza, y +preprocesamiento del conjunto de datos. Se utilizará el lenguaje de +programación Python, y librerías especializadas para la realización de estas +tareas, como Pandas, NumPy, y Matplotlib. El entorno de desarrollo será Visual +Studio Code y Jupyter Notebooks. Todo ejecutando en una laptop personal bajo el +sistema operativo Linux. En cuanto a la metodología de trabajo para esta +parte del análisis de datos se utilizará KDD (Knowledge Discovery in Databases). + +Luego, se generarán modelos de aprendizaje automático, utilizando algoritmos +ya implementados y de libre disponibilidad. Una librería en Python muy +utilizada que facilita el uso de dichos algorítmos es scikit-learn. El output +de los algorítmos de aprendizaje automático son los modelos de predicción +entrenados, los cuales luego son utilizados para realizar predicciones en base a +nuevos datos (\textit{datapoints}). La dificultad se encuentra en optimizar la +generación de estos modelos según las características del conjunto de datos. +Los pasos previos de limpieza y preprocesamiento son cruciales, así como también +la selección de algoritmos y la optimización de sus respectivos hiperparámetros +\autocite{Kemper2020}. + +Finalmente, se implementará un sistema de información que utilice el mejor +modelo de predicción de la deserción estudiantil universitaria. El cual pueda +facilitar la utilización del modelo por parte del usuario. Se utilizará el +marco Ágil para la captación de requisitos del sistema mediante User Story +Mapping. Para el protitado de la solución se utilizará la herramienta Figma +(web). Y para la implementación del sistema de información se utilizará +tecnología web, para que posteriormente pueda ser desplegado en un servidor de +algún proveedor de servicios en la nube, como por ejemplo AWS (Amazon). + +El presente proyecto no contempla la implementación de nuevos algoritmos de +aprendizaje automático. Ni tampoco la implantación del sistema en alguna +universidad del país. + + \section{Restricciones} El proyecto depende de la disposición de conjuntos de datos de las universidades. @@ -91,8 +161,103 @@ ya sea por la complejidad en extraer la información de sus sistemas informáticos, o porque simplemente no está dentro de sus procedimientos compartir estos datos. -Además, el proyecto depende de la disponibilidad de especialistas en +Además, el proyecto depende de la disponibilidad de los especialistas en aprendizaje automático, sistemas de información, y usabilidad. Quienes se encargarán de validar los resultados esperados del proyecto. \section{Identificación de riesgos} + +En la \autoref{tab:riesgos-proyecto} se listan los riesgos identificados del +proyecto. Se cuantifica la P (Probabilidad), I (Impacto), y S (Severidad), +de cada riesgo, de acuerdo a las siguientes fórmulas: + +\begin{itemize} + \item P: Probabilidad del riesgo. Número real del 0 al 1. Intenta + representar la probabilidad de que suceda el evento durante la + realización del proyecto. + \item I: Impacto del riesgo. Número real del 0 al 1. Donde \(I = 0\) + representa un riesgo con consecuencias muy bajas o inperceptibles, mientras + \(I = 1\) representa que el riesgo tiene consecuencias críticas para el + éxito del proyecto. + \item S: Severidad del riesgo. Calculado como \(S = P*I\). + \begin{itemize} + \item Severidad baja si \(I < 0.05\) + \item Severidad media si \(0.05 <= I < 0.20\) + \item Severidad alta si \(0.20 < I\) + \end{itemize} +\end{itemize} + +\begin{table} [H] % htbp + \centering + \small + \caption{Riesgos del proyecto} + \label{tab:riesgos-proyecto} + \begin{tabular} {*{2}{|p{0.20\linewidth}} *{3}{|p{0.025\linewidth}} *{3}{|p{0.15\linewidth}}|} + \hline + + \textbf{Riesgo} & + \textbf{Materialización del riesgo} & + \textbf{P} & + \textbf{I} & + \textbf{S} & + \textbf{Mitigación} & + \textbf{Contingencia} \\ + \hline + \hline + + Los expertos no se encuentran disponibles para revisar de los + entregables a tiempo para cumplir con el cronograma & + Demoras en el tiempo de respuesta de los expertos. Dificultad para + contactar algún experto. & + .8 & .5 & .4 & + Coordinar con la mayor anticipación posible con los expertos. + Contar con al menos 2 expertos de cada área en caso uno no se encuentre + disponible. & + Buscar a más expertos del área requerida para que pueda revisar + el entregable a tiempo \\ + \hline + + No contar con el conjunto de datos requerido para el análisis & + Demoras en el tiempo de respuesta de las universidades contactadas + para adquirir el conjunto de datos. Dificultad por parte de las + universidades para extraer la información requerida. Las universidades + contactadas no pueden compartir el conjunto de datos requeridos. & + .5 & 1 & .5 & + Coordinar con la mayor anticipación posible con las universidades. + Contactar con al menos 3 universidades para requerir los conjuntos de + datos. & + Buscar en Internet si existe algún conjunto de datos de libre disponibilidad. + Buscar a más universidades para adquirir el conjunto de datos. \\ + \hline + + Pérdida de información debido a pérdida equipos informáticos & + Robo de la laptop. Corrupción del disco duro. & + .2 & .8 & .16 & + Mantener 2 copias de seguridad (\textit{backups}) de la información. + Mantener una de esas copias en la nube. Actualizar diariamente + las copias de seguridad. & + Restaurar la información utilizando la última copia de seguridad. + Comprar nuevo equipo informático de reemplazo. \\ + \hline + + Planeamiento inadecuado de las actividades del proyecto & + Se identifica una actividad significativa requerida para el desarrollo + del proyecto. Estimación del tiempo requerido para la actividad + insuficiente & + .4 & .4 & .16 & + Realizar el planeamiento de actividades junto con el asesor. + Contar con feedback de expertos para la estimación de tiempo + de actividades fuera del expertise del tesista. & + Reestructurar las actividades o el cronograma siguiendo el procedimiento + especificado en el documento de Procesos de Tesis \\ + \hline + \end{tabular} +\end{table} + +% \section{Estructura de descomposición del trabajo (EDT)} + +% \section{Lista de tareas} + +% \section{Cronograma de actividades del proyecto} + +% \section{Lista de recursos} |
