\section{Título del tema de tesis} El tema de tesis a trabajar es: "Sistema de análisis de factores que influyen en la deserción estudiantil universitaria usando técnicas de Aprendizaje Automático". \section{Asesora} La asesora para la tesis a realizar es Patricia Andrea Natividad Gómez. El plan de trabajo para cumplir con los objetivos del curso, y al igual que los entregables, es semanal. Se tendrán reuniones los miércoles de 17:00 a 18:00 a través de Zoom. La última reunión antes de la presentación, planificada para la semana 13, será de forma presencial en un aula de la universidad. En la tabla \ref{table:reuniones-asesoria} se listan las reuniones semanales con la asesora y su modalidad (virtual o presencial). \begin{table}[htbp] \centering \begin{tabular}{||c c c c||} \hline Semana & Fecha & Entregable & Modalidad \\ [0.5ex] \hline\hline 1 & 22/03/2023 & EP1.1 & Virtual \\ 2 & 29/03/2023 & EP1.2 & Virtual \\ 3 & 05/04/2023 & EP1.3 & Virtual \\ 4 & 12/04/2023 & EP1.4 & Virtual \\ 5 & 19/04/2023 & EP1.5 & Virtual \\ 6 & 26/04/2023 & E1 & Virtual \\ 7 & 03/05/2023 & EP2.1 & Virtual \\ 8 & 10/05/2023 & & Virtual \\ 9 & 17/05/2023 & (exámenes parciales) & (sin reunión) \\ 10 & 24/05/2023 & E2 & Virtual \\ 11 & 31/05/2023 & & Virtual \\ 12 & 07/06/2023 & E3 & Virtual \\ 13 & 14/06/2023 & E4 & Presencial \\ 14 & 21/06/2023 & (exposiciónes finales) & (sin reunión) \\ 15 & 28/06/2023 & (exposiciónes finales) & (sin reunión) \\ \hline \end{tabular} \caption{Cronograma de reuniones} \label{table:reuniones-asesoria} \end{table} \begin{center} \begin{tabular}{||c c c c||} % \label{fig:reuniones-asesoria} \end{tabular} \end{center} % \begin{figure}[htbp] % \centering % \includegraphics[width=.8\columnwidth]{img/ss_20230324_103038.png} % \caption{Reuniones semanales de asesoría} % \label{fig:reuniones-asesoria} % \end{figure} \section{Área} La tesis a realizar corresponde al área de Sistemas de Información, de acuerdo a la clasificación de la currícula ACM-IEEE \autocite{ACM2020-Curricula}. \section{Descripción} \subsection{Problemática} % \textbf{Problemática:} La deserción estudiantil universitaria es un fenómeno complejo que afecta a los estudiantes desertores y a su universidad. La deserción estudiantil universitaria afecta significativamente en la economía del estudiante y en su bienestar psicológico, así como también en la reputación de la univerdad y de sus recursos que contará en el futuro \autocite{Fernandez2019}. Para el año 2013, en Estados Unidos, el ratio de deserción fue de 40\% por año para estudiantes que persíguen un pregrado, de los cuales el 30\% deserta en el primer año de estudios \autocite{Doll2013}. Actualmente, las universidades cuentan con diversos programas de apoyo al estudiante; por ejemplo la PUCP, cuenta con la Oficina de Orientación y Apoyo al Estudiante (OOIA) y la Dirección de Asuntos Estudiantiles (DAES) las cuales proporcionan programas de tutorías, refuerzo académico en los cursos más demandantes de 1er y 2do año, mentoría, atención psicológica, y eventos informativos \autocite{PUCP2019SaludMental}. % Algunos de estos programas elaboran el perfil del estudiante mediante encuestas, entrevistas, registro de resultados académicos, y opiniones individaules de los docentes \autocite{DescubrePUCP}. La identificación temprana de los estudiantes más propensos a abandonar sus estudios, aquellos que presentan los principales indicadores de deserción, podría disminuir la deserción estudiantil universitaria. Pues ayudaría a los estudiantes a recibir apoyo de forma más oportuna \autocite{Fernandez2019}. \section{Resultados esperados} \begin{itemize} \item Identificar los factores relevantes que influyen en la deserción universitaria para el entrenamiento y validación de los modelos de aprendizaje automático. \item Implementar un conjunto de modelos de aprendizaje automático que realice una predicción de la deserción universitaria. \item Implementar un sistema que permita a las universidades realizar y configurar el proceso de detección de deserción universitaria de sus estudiantes, según su conjunto de datos, utilizando modelos de aprendizaje automático mencionados anteriormente. \item Implementar un \textit{dashboard} con resultados relevantes del análisis de deserción universitaria de sus estudiantes. % \item Obtención de fuente de datos para el análisis. Conjunto de datos de estudiantes universitarios con información académica y socio-económica. % \item Análisis exploratorio de datos (EDA). % \item Limpieza del conjunto de datos. % \item Modelo de clusterización de estudiantes con mayor probabilidad de desertar sus estudios universitarios. % \item Dashboard gráfico con resultados del análisis. Estadísticas y predicciones generadas por el Aprendizaje Automático. % \item Generación de reporte individual de cada estudiante. Indicando la probabilidad de deserción y factores de riesgo presentes. Con el fin de poder contactarlos y apoyarlos con algún plan preventivo proporcionado por la universidad. \end{itemize} \section{Métodos y procedimientos} Se utilizará la metodología \textit{Knowledge Discovery in Database} (KDD) y la data histórica de una universidad del Perú para la selección y entrenamiento de un modelos de aprendizaje automático (\textit{machine learning}) para la predicción de estudiantes con mayor probabilidad de desertar de sus estudios superiores.