\chapter{Formulario de Extracción} Se encuentra en la hoja de cálculo nombrada: % \verb 20170895_RobertoTokumori_PatriciaNatividad_E2_Anexo1.xlsx \verb. \begin{verbatim}20170895_RobertoTokumori_PatriciaNatividad_E2_Anexo1.xlsx\end{verbatim}. \chapter{Plan de Proyecto} \section{Justificación} % TODO: Revisar coherencia en citas % I've commented out some of the paragraphs. Maybe add them in the future % it depends if it's OK to add points related to the "methods". I've only % left the ones related to the "problem". El desarrollo de un sistema de información que utilice técnicas de aprendizaje automático para predecir la deserción de estudiantes universitarios y mejorar las tasas de retención es un proyecto que puede ser justificado por las siguientes razones. \begin{itemize} \item Uno de los principales objetivos de las universidades es asegurar el éxito académico de sus estudiantes \autocite{Shilbayeh2021562}. Al predecir con precisión las posibles deserciones, las universidades pueden intervenir temprano e implementar sistemas de apoyo específicos para abordar las causas raíz de la deserción de los estudiantes. Este enfoque proactivo puede permitiría las universidades apoyar mejor a los estudiantes con dificultades y mejorar sus posibilidades de completar sus títulos con éxito. \item La deserción de los estudiantes no solo es perjudicial para los estudiantes individuales sino también para las propias universidades. Cuando los estudiantes abandonan la universidad, esto representa una pérdida de recursos invertidos en su educación, incluido el tiempo, la financiación y los esfuerzos del personal docente de la universidad \autocite{Alwarthan2022107649}. Al identificar con precisión a los estudiantes en riesgo, las universidades pueden asignar sus recursos de manera más efectiva, ofreciendo intervenciones personalizadas a quienes más las necesitan. Esta asignación optimizada de recursos puede generar ahorros de costos y una mayor eficiencia para las instituciones educativas. % Datos que cuentan las universidades son "underutilized". (Maybe in this one % include the points below) % Las técnicas de aprendizaje automático pueden % analizar múltiples factores que contribuyen a las tasas de deserción de % los estudiantes, incluido el rendimiento académico, el entorno socioeconómico, % y los niveles de compromiso. Al aprovechar esta gran cantidad de datos, el % sistema de información puede identificar patrones y factores de riesgo asociados % con el comportamiento de deserción estudiantil universitaria. % Los métodos tradicionales para identificar posibles % abandonos a menudo se basan en medidas reactivas, como observar un rendimiento % académico deficiente o signos de desconexión \autocite{Alwarthan2022107649}. Sin embargo, mediante el uso de % algoritmos de aprendizaje automático, el sistema de información puede analizar % grandes cantidades de datos históricos y crear modelos predictivos para % pronosticar las probabilidades de abandono escolar de los estudiantes en una % etapa temprana. Este enfoque proactivo permite a las instituciones intervenir % con prontitud, brindando recursos y orientación específicos para ayudar a los % estudiantes a superar los desafíos y aumentar sus probabilidades de permanecer % matriculados. \end{itemize} % Por lo tanto, se justifica el desarrollo de un sistema de información que % pueda ayudar a predecir la deserción de los estudiantes universitarios y mejore % las tasas de retención, ya que mejora el éxito de los estudiantes, optimiza la % asignación de recursos y permite intervenciones proactivas basadas en análisis % predictivos. Este proyecto tiene el potencial de mejorar significativamente las % tasas de retención y contribuir al éxito general de las instituciones % educativas. \section{Viabilidad} \subsection{Viabilidad temporal} El proyecto tendrá una duración de 7 meses, desde julio del 2023, hasta fines de diciembre del 2023. Los plazos de los resultados esperados, resultado de la planificación se pueden evidenciar en el cronograma de actividades del proyecto (Ver tabla). \subsection{Viabilidad técnica} Se consideran 2 principales barreras técnicas para estimar la complejidad del proyecto, y por tanto los plazos de tiempo para cada resultado esperado. Por un lado se encuentra la implementación de modelos de aprendizaje automático, y por el otro se encuentra la implementación del sistema de información que utilice estos modelos. La implementación de modelos de aprendizaje automático es viable porque se poseen los conocimientos base respecto a las técnicas (estadística, manejo de bases de datos, análisis de datos, programación), y herramientas de software a utilizar. Sin embargo, se requerirá aprender a mayor profundidad las técnicas de aprendizaje automático para lo cual se cuenta con el apoyo de especialistas que puedan dar guía en el aprendizaje, y también realizar las revisiones pertinentes para los resultados esperados. Por otro lado, para la implementación del sistema de información también es viable porque también se cuentan los conocimientos base para planear, definir, e implementar un sistema de información. Y se cuenta con el apoyo de especialistas para la revisión de los resultados esperados. \subsection{Viabilidad económica} El proyecto no demanda una inversión económica significativa. Las herramientas de software necesarias no requieren una licencia especial que implique gastos adicionales. Y el conjunto de datos requerido para el análisis puede ser solicitado a universidades locales. \section{Alcance del proyecto} El alcance de este proyecto está delimitado por los objetivos y resultados esperados definidos en la \autoref{sec:objetivos}. Para recapitular, el objetivo general es: desarrollar un sistema, basado en técnicas de aprendizaje automático, que permita predecir la deserción estudiantil en el ámbito universitario, mejorando así la retención de estudiantes. Con la intención de delimitar mejor el alcance, se describen a continuación las actividades del proyecto en alto nivel. Primero, se realizará el análisis descriptivo, limpieza, y preprocesamiento del conjunto de datos. Se utilizará el lenguaje de programación Python, y librerías especializadas para la realización de estas tareas, como Pandas, NumPy, y Matplotlib. El entorno de desarrollo será Visual Studio Code y Jupyter Notebooks. Todo se ejecuta en una laptop personal bajo el sistema operativo Linux. En cuanto a la metodología de trabajo para esta parte del análisis de datos se utilizará KDD (Knowledge Discovery in Databases). Luego, se generarán modelos de aprendizaje automático, utilizando algoritmos ya implementados y de libre disponibilidad. Una librería en Python muy utilizada que facilita el uso de dichos algoritmos es scikit-learn. El output de los algoritmos de aprendizaje automático son los modelos de predicción entrenados, los cuales luego son utilizados para realizar predicciones en base a nuevos datos (\textit{datapoints}). La dificultad se encuentra en optimizar la generación de estos modelos según las características del conjunto de datos. Los pasos previos de limpieza y preprocesamiento son cruciales, así como también la selección de algoritmos y la optimización de sus respectivos hiper-parámetros \autocite{Kemper2020}. Finalmente, se implementará un sistema de información que utilice el mejor modelo de predicción de la deserción estudiantil universitaria. El cual pueda facilitar la utilización del modelo por parte del usuario. Se utilizará el marco Ágil para la captación de requisitos del sistema mediante User Story Mapping. Para el prototipado de la solución se utilizará la herramienta Figma (web). Y para la implementación del sistema de información se utilizará tecnología web, para que posteriormente pueda ser desplegado en un servidor de algún proveedor de servicios en la nube, como por ejemplo AWS (Amazon). El presente proyecto no contempla la implementación de nuevos algoritmos de aprendizaje automático. Ni tampoco la implantación del sistema en alguna universidad del país. \section{Restricciones} El proyecto depende de la disposición de conjuntos de datos de las universidades. Es posible que las universidades a quienes se les solicite estos datos no los compartan, ya sea por la complejidad en extraer la información de sus sistemas informáticos, o porque simplemente no está dentro de sus procedimientos compartir estos datos. Además, el proyecto depende de la disponibilidad de los especialistas en aprendizaje automático, sistemas de información, y usabilidad. Quienes se encargan de validar los resultados esperados del proyecto. \section{Identificación de riesgos} En la \autoref{tab:riesgos-proyecto} se listan los riesgos identificados del proyecto. Se cuantifica la P (Probabilidad), I (Impacto), y S (Severidad), de cada riesgo, de acuerdo a las siguientes fórmulas: \begin{itemize} \item P: Probabilidad del riesgo. Número real del 0 al 1. Intenta representar la probabilidad de que suceda el evento durante la realización del proyecto. \item I: Impacto del riesgo. Número real del 0 al 1. Donde \(I = 0\) representa un riesgo con consecuencias muy bajas o imperceptibles, mientras \(I = 1\) representa que el riesgo tiene consecuencias críticas para el éxito del proyecto. \item S: Severidad del riesgo. Calculado como \(S = P*I\). \begin{itemize} \item Severidad baja si \(I < 0.05\) \item Severidad media si \(0.05 <= I < 0.20\) \item Severidad alta si \(0.20 < I\) \end{itemize} \end{itemize} \begin{table} [H] % htbp \centering \small \caption{Riesgos del proyecto} \label{tab:riesgos-proyecto} \begin{tabular} {*{2}{|p{0.20\linewidth}} *{3}{|p{0.025\linewidth}} *{3}{|p{0.15\linewidth}}|} \hline \textbf{Riesgo} & \textbf{Materialización del riesgo} & \textbf{P} & \textbf{I} & \textbf{S} & \textbf{Mitigación} & \textbf{Contingencia} \\ \hline \hline Los expertos no se encuentran disponibles para revisar de los entregables a tiempo para cumplir con el cronograma & Demoras en el tiempo de respuesta de los expertos. Dificultad para contactar algún experto. & .8 & .5 & .4 & Coordinar con la mayor anticipación posible con los expertos. Contar con al menos 2 expertos de cada área en caso uno no se encuentre disponible. & Buscar a más expertos del área requerida para que pueda revisar el entregable a tiempo \\ \hline No contar con el conjunto de datos requerido para el análisis & Demoras en el tiempo de respuesta de las universidades contactadas para adquirir el conjunto de datos. Dificultad por parte de las universidades para extraer la información requerida. Las universidades contactadas no pueden compartir el conjunto de datos requeridos. & .5 & 1 & .5 & Coordinar con la mayor anticipación posible con las universidades. Contactar con al menos 3 universidades para requerir los conjuntos de datos. & Buscar en Internet si existe algún conjunto de datos de libre disponibilidad. Buscar a más universidades para adquirir el conjunto de datos. \\ \hline Pérdida de información debido a pérdida equipos informáticos & Robo de la laptop. Corrupción del disco duro. & .2 & .8 & .16 & Mantener 2 copias de seguridad (\textit{backups}) de la información. Mantener una de esas copias en la nube. Actualizar diariamente las copias de seguridad. & Restaurar la información utilizando la última copia de seguridad. Comprar nuevo equipo informático de reemplazo. \\ \hline Planeamiento inadecuado de las actividades del proyecto & Se identifica una actividad significativa requerida para el desarrollo del proyecto. Estimación del tiempo requerido para la actividad insuficiente & .4 & .4 & .16 & Realizar el planeamiento de actividades junto con el asesor. Contar con feedback de expertos para la estimación de tiempo de actividades fuera del expertise del tesista. & Reestructurar las actividades o el cronograma siguiendo el procedimiento especificado en el documento de Procesos de Tesis \\ \hline \end{tabular} \end{table} \section{Estructura de descomposición del trabajo (EDT)} Con el objetivo de descomponer las actividades del proyecto y organizarlas en módulos, se dividen las tareas del proyecto en 2 grandes partes. Una parte relacionada a la gestión del proyecto en sí como parte del curso de tesis en la PUCP. La cual incluye la generación de documentos (entregables) y revisiones por parte de especialistas para verificar la calidad de los mismos. Y la otra parte relacionada al desarrollo de los resultados esperados. En la \autoref{fig:edt} se puede apreciar esta división. \begin{figure}[H] \caption{Estructura de descomposición del trabajo (EDT)} \label{fig:edt} \centering \includegraphics[width=2.5in]{img/w13-edt.drawio.png} \end{figure} \section{Lista de recursos} En esta sección, se listan los recursos necesarios para desarrollar el proyecto. \subsection{Personas involucradas y necesidades de capacitación} En la \autoref{tab:personas-involucradas-necesidades-capacitacion} se muestran las personas involucradas en el desarrollo del proyecto, su rol, y si requiere de alguna capacitación previa. \begin{table} [H] % htbp \centering \small \caption{Personas involucradas y necesidades de capacitación} \label{tab:personas-involucradas-necesidades-capacitacion} \begin{tabular} {*{3}{|p{0.30\linewidth}}|} \hline \textbf{Persona \newline involucrada} & \textbf{\newline Rol} & \textbf{Necesidades \newline de capacitación} \\ \hline \hline R. Mitsuo Tokumori & Tesista & Investigación relacionada a factores de deserción estudiantil universitaria. Implementación de modelos de análisis de datos e integración con un sistema de información. \\ \hline Mg. Patricia Natividad & Aseesora & No \\ \hline - & Especialista en Ciencia de Datos & No \\ \hline - & Especialista en Sistemas de Información & No \\ \hline - & Especialista en Arquitectura de Software & No \\ \hline \end{tabular} \end{table} \subsection{Materiales requeridos para el proyecto} Para el desarrollo del proyecto se necesitará una computadora (PC) y acceso a internet para la descarga y actualización de las herramientas (locales), uso de herramientas web, y despliegue de los prototipos de la solución en un proveedor de servicios de computación en la nube. Una lista más exhaustiva de las herramientas a utilizarse se listan en la \autoref{sec:metodos-procedimientos}. \section{Lista de tareas} En la \autoref{tab:lista-tareas} se muestra el listado de tareas para cada entregable y resultado esperado del proyecto de tesis. La duración y esfuerzo se estima en días y horas hombre (HH), respectivamente. Mientras que el costo estimado se calcula en Nuevos Soles (PEN) en función a los siguientes costos por hora: \begin{itemize} \item Tesista: \(20\) PEN/h \item Asesora: \(100\) PEN/h \item Especialista: \(100\) PEN/h \end{itemize} \begin{longtable}[c]{|p{0.60\linewidth} *{3}{|p{0.10\linewidth}}|} \caption{Lista de tareas.\label{tab:lista-tareas}}\\ % \hline % \multicolumn{2}{| c |}{Begin of Table}\\ % \hline % \centering \newline Tarea % & Duración estimada (días) & Esfuerzo Asociado (HH) & Costo estimado (PEN) \\ % \hline % \endfirsthead % \hline % \multicolumn{4}{|p|}{Continuación de la tabla \ref{tab:lista-tareas}}\\ \hline \centering \newline Tarea & Duración estimada (días) & Esfuerzo Asociado (HH) & Costo estimado (PEN) \\ \hline \endhead \hline \endfoot % \hline % \multicolumn{2}{| c |}{End of Table}\\ % \hline\hline % \endlastfoot \multicolumn{4}{| c |}{Entregable 1.1} \\ \hline Elaborar ficha de registro de asesora y tema de tesis & 2 & 4 & 80 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{Entregable 1.2} \\ \hline Elaborar avance del Estado del Arte & 4 & 12 & 350 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{Entregable 1.3} \\ \hline Elaborar avance del Estado del Arte, respuestas a las preguntas de revisión & 4 & 12 & 240 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{Entregable 1.4} \\ \hline Elaborar avance del Estado del Arte, finalizar respuestas a las preguntas de revisión & 4 & 12 & 240 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{Entregable 1.5} \\ \hline Elaborar avance del Marco Conceptual, conceptos y ejemplos & 4 & 12 & 240 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{Entregable 1} \\ \hline Elaborar avance de la Problemática, definición del árbol de problemas & 4 & 12 & 240 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{Entregable 2.1} \\ \hline Elaborar avance de los Objetivos, definición de objetivo general y específicos & 4 & 12 & 240 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{Entregable 2} \\ \hline Elaborar avance de los Métodos y Procedimientos & 4 & 12 & 240 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{Entregable 3} \\ \hline Elaborar avance del Plan de Proyecto, avance parcial & 4 & 12 & 240 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{Entregable 4} \\ \hline Elaborar avance del Plan de Proyecto, finalizado & 4 & 12 & 240 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline \multicolumn{4}{| c |}{\textbf{R1.1} Recolección de datos.} \\ \hline Solicitar conjunto de datos a universidades del país & 5 & 5 & 100 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del dataset por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R1.2} Análisis descriptivo y limpieza de datos.} \\ \hline Aplicar estadística descriptiva y generar gráficas & 2 & 4 & 80 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R1.3} Transformación de datos.} \\ \hline Transformar los datos a una forma útil, estándar, y facil de utilizar en los posteriores pasos de la metodología KDD & 2 & 4 & 80 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R1.4} Análisis de relación.} \\ \hline Realizar el análisis de relación entre las variables dependientes contra la variable independiente & 1 & 4 & 80 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en ciencia de datos & 1 & 1 & 20 \\ \hline \multicolumn{4}{| c |}{\textbf{R1.5} Análisis de correlación.} \\ \hline Realizar el análisis de corelación entre las todas las variables & 1 & 1 & 20 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R2.1} Identificación de los algoritmos aprendizaje automático de predicción con ayuda de la literatura} \\ \hline Listar los principales algoritmos de aprendizaje automático. Incluyendo las ventajas y desventajas de cada uno teniendo en cuenta la problemática & 4 & 8 & 160 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R2.2} Implementación de los algoritmos de aprendizaje automático seleccionados} \\ \hline Entrenar modelos de aprendizaje supervisado utilizando los distintos algoritmos. Realizar optimización de hiperparámetros. & 4 & 8 & 160 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R2.3} Comparación de los algoritmos de aprendizaje automático implementados y selección del mejor} \\ \hline Comparar desempeño de los distintos modelos entrenados en su capacidad de realizar predicciones certeras & 4 & 8 & 160 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R3.1} Catálogo de requisitos.} \\ \hline Listar requisitos del sistema y su prioridad & 2 & 4 & 80 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R3.2} Prototipo del sistema.} \\ \hline Desarrollar prototipio del sistema de información & 4 & 8 & 160 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R3.3} Especificación de requisitos.} \\ \hline Especificar requisitos mediante User Stories y criterios de aceptación & 3 & 6 & 120 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R3.4} Modelo de base de datos.} \\ \hline Definir modelo de base de datos para el sistema & 2 & 4 & 80 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en arquitectura de software & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R3.5} Arquitectura de la solución.} \\ \hline Definir la arquitectura del sistema & 2 & 4 & 80 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en arquitectura de software & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R3.6} Implementación del sistema.} \\ \hline Desarrollo del sistema por el método iterativo & 15 & 30 & 600 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R3.7} Integración del sistema con los modelos de aprendizaje automático. } \\ \hline Integrar sistema de información desarrollado con modelo campeón & 5 & 10 & 200 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en sistemas de información& 1 & 2 & 120 \\ \hline \multicolumn{4}{| c |}{\textbf{R3.8} Instalación y configuración del software.} \\ \hline Desarrollar guía de instalación y configuración del software & 2 & 4 & 80 \\ \hline Reunión con asesora & 1 & 2 & 120 \\ \hline Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline \hline Total & - & 74 & 9490 \\ \hline \end{longtable} \section{Cronograma de actividades del proyecto} Para el cronograma de actividades en la \autoref{tab:cronograma-actividades}, para las fechas de inicio y fin de los resultados esperados se utiliza como unidad las semanas del semestre académico. Correspondiendo a la semana 01, a la primera semana de clases del ciclo. \begin{longtable}[c]{|p{0.60\linewidth} *{2}{|p{0.15\linewidth}}|} \caption{Cronograma de actividades.\label{tab:cronograma-actividades}}\\ % \hline % \multicolumn{2}{| c |}{Begin of Table}\\ % \hline % \centering \newline Tarea % & Duración estimada (días) & Esfuerzo Asociado (HH) & Costo estimado (PEN) \\ % \hline % \endfirsthead % \hline % \multicolumn{4}{|p|}{Continuación de la tabla \ref{tab:lista-tareas}}\\ \hline \centering \newline Tarea & Inicio & Fin \\ \hline \endhead \hline \endfoot % \hline % \multicolumn{2}{| c |}{End of Table}\\ % \hline\hline % \endlastfoot Entregable 1.1 & 2023/03/20 & 2023/03/27 \\ \hline Entregable 1.2 & 2023/03/27 & 2023/04/03 \\ \hline Entregable 1.3 & 2023/04/03 & 2023/04/10 \\ \hline Entregable 1.4 & 2023/04/10 & 2023/04/17 \\ \hline Entregable 1.5 & 2023/04/17 & 2023/04/24 \\ \hline Entregable 1 & 2023/04/24 & 2023/04/28 \\ \hline Entregable 2.1 & 2023/04/28 & 2023/05/08 \\ \hline Entregable 2 & 2023/05/08 & 2023/05/26 \\ \hline Entregable 3 & 2023/05/26 & 2023/06/07 \\ \hline Entregable 4 & 2023/06/07 & 2023/06/16 \\ \hline \textbf{R1.1} Recolección de datos. & semana 01 & semana 05 \\ \hline \textbf{R1.2} Análisis descriptivo y limpieza de datos. & semana 01 & semana 05 \\ \hline \textbf{R1.3} Transformación de datos. & semana 01 & semana 05 \\ \hline \textbf{R1.4} Análisis de relación. & semana 01 & semana 05 \\ \hline \textbf{R1.5} Análisis de correlación. & semana 01 & semana 05 \\ \hline \textbf{R2.1} Identificación de los algoritmos aprendizaje automático de predicción con ayuda de la literatura & semana 01 & semana 06 \\ \hline \textbf{R2.2} Implementación de los algoritmos de aprendizaje automático seleccionados & semana 01 & semana 06 \\ \hline \textbf{R2.3} Comparación de los algoritmos de aprendizaje automático implementados y selección del mejor & semana 01 & semana 06 \\ \hline \textbf{R3.1} Catálogo de requisitos. & semana 01 & semana 02 \\ \hline \textbf{R3.2} Prototipo del sistema. & semana 01 & semana 03 \\ \hline \textbf{R3.3} Especificación de requisitos. & semana 02 & semana 04 \\ \hline \textbf{R3.4} Modelo de base de datos. & semana 02 & semana 04 \\ \hline \textbf{R3.5} Arquitectura de la solución. & semana 02 & semana 04 \\ \hline \textbf{R3.6} Implementación del sistema. & semana 04 & semana 10 \\ \hline \textbf{R3.7} Integración del sistema con los modelos de aprendizaje automático. & semana 06 & semana 11 \\ \hline \textbf{R3.8} Instalación y configuración del software. & semana 10 & semana 11 \\ \hline \end{longtable} \chapter{Cronograma de trabajo} Se encuentra en la hoja de cálculo nombrada \href{https://docs.google.com/spreadsheets/d/1rXDFnIxe3QOsMLCvoHV_FOeiYLYWkfFMxXgi976wJ7c/edit#gid=0}{"cronograma"}.