1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
|
\chapter{Generalidades}
\section{Problemática}
%[Texto introductorio acerca de esta sección correspondiente a la descripción del
%problema o problemática que aborda el trabajo.]
En esta sección se describe la problemática utilizando como herramienta de
análisis el diagrama de árbol de problemas y posteriormente se describe a mayor
detalle el problema a abordar en el presente estudio.
En el apartado \ref{problematica-arbol-problemas}, se presenta la problemática a
alto nivel. Luego, en el apartado \ref{problematica-descripcion}, se
desarrollan más el problema central, sus causas, efectos, y contexto.
Finalmente en el apartado \ref{problematica-problema-seleccionado} se sumarizan
las ideas trabajadas.
\subsection{Árbol de problemas} \label{problematica-arbol-problemas}
% Fuentes para la tecnica del arbol de problemas
%[Texto que introduce la técnica del árbol de problemas. De acuerdo con el
%esquema del árbol de problemas de la Figura 1, se explican las causas y origen
%de los problemas, el problema central y los efectos y consecuencias del problema
%central.
%
%Los pasos para elaborar el árbol de problemas son:
%
%\begin{enumerate}
% \item Identificar el problema central (tronco del árbol).
% \item Identificar los efectos del problema central (la copa del árbol).
% \item Identificar las relaciones entre los efectos.
% \item Identificar las causas (la raíz del árbol).
% \item Identificar las relaciones entre las causas.
% \item Diagramar el árbol.
%\end{enumerate}
%
%Luego de diagramar el árbol con sus respectivos nodos, revise la validez e
%integridad del árbol dibujado, todas las veces que sea necesario. Esto es,
%asegurarse que las causas representen causas y los efectos representen efectos,
%que el problema central este correctamente definido y que las relaciones
%(causales) estén correctamente expresadas.]
% En la \autoref{fig:arb.prob.} se presenta el diagrama del árbol de problemas, en
% el cual se sumarizan el problema principal, los efectos, y los problemas causa y
% las relaciónes entre ellos.
% \begin{figure} [htbp] \centering
% \includegraphics[width=.9\columnwidth]{img/arbol_problemas_excel.png}
% \caption{Esquema del árbol de problemas.}
% \label{fig:arb.prob.}
% \end{figure}
Para plantear la problemática, se hace uso del esquema del árbol de problemas
(Ver la Tabla \ref{tab:arbol-problemas}). Se compone de 3 partes: el problema
central, los problemas causas, y los problemas efectos. Cada problema causa
está relacionado a uno o más problemas efecto. El problema central es el que
engloba y es producto de los problemas causa (análogo a las raíces del árbol), y
se manifiesta como los problemas efecto (análogo a las ramas de un árbol).
\begin{table} [H]
\centering
\caption{Árbol de problemas}
\label{tab:arbol-problemas}
\begin{tabular}
{|p{0.09\linewidth}|p{0.26\linewidth}|p{0.26\linewidth}|p{0.26\linewidth}|}
\hline
& 1 & 2 & 3 \\
\hline
Problemas efectos &
Sigue incrementando la deserción estudiantil. Aún cuando se cuenta con
más datos y capacidad de cómputo o análisis. &
No se contemplan factores relevantes que van a influir en la deserción
universitaria. &
El alcance de los programas de prevención de la deserción de las
universidades es limitado. Se tiene escasa capacidad para tomar
decisiones sobre el estado de sus estudiantes. \\
\hline
Problema central &
\multicolumn{3}{p{0.78\linewidth}|}{
La deserción estudiantil universitaria es detectada tardíamente,
desaprovechamiento de los datos disponibles de los
estudiantes para detectarla
} \\
\hline
Problemas causas &
Los programas de detección y ayuda para estudiantes propensos a desertar
tienen un enfoque más reactivo en lugar de proactivo. &
Existe diversidad de factores que podrían detectar la deserción
estudiantil universitaria de forma oportuna, y estos no son
aprovechados. &
Realizar el seguimiento a todos los estudiantes con peligro de deserción
es una tarea compleja, costosa y larga. \\
\hline
\end{tabular}
\end{table}
\subsection{Descripción} \label{problematica-descripcion}
% Explicacion del arbol de problemas con fuentes.
%[En esta sección se contextualiza claramente el problema, respaldando y
%justificando fuertemente la ejecución de su proyecto de tesis, el cual tiene
%como objetivo desarrollar una propuesta de solución a la problemática que ha
%sido identificada. Considere referencias actualizadas para contextualizar el
%problema. El problema a solucionar debe ser relevante y de la magnitud de un
%proyecto de fin de carrera. Describa la problemática apoyándose en el árbol de
%problemas, describa de manera detallada cada una de las causas del problema
%central, así como los efectos de la misma.
%
%De acuerdo con Pólya (1945), un problema es un conjunto (estado) de condiciones
%que afectan un escenario (hecho, situación, persona, empresa), las cuales se
%quieren transformar para pasar a otro escenario (supuestamente más beneficioso
%que el anterior). No se aprecia “algo malo” directamente, sino condiciones dadas
%que se quieren modificar por otras “mejores”. Sí puede darse el caso que las
%condiciones afecten negativamente al escenario y que deban ser cambiadas. Por
%otro lado, Silva y Menezes (2005) consideran que un problema es una cuestión que
%muestra una situación que requiere de una discusión, investigación, decisión o
%solución. El problema es la cuestión que la investigación intentará
%resolver. Todo el proceso de la investigación girará en torno a su solución.
%
%El planteamiento del problema dentro de una proyecto de fin de carrera debe de
%responder a la pregunta: ¿Qué se va a investigar?. En el que el proyecto busca
%pasar de un estado de desconocimiento sobre estas condiciones iniciales, a un
%estado en que los resultados que obtengamos nos permitan dar respuesta a las
%preguntas planteadas inicialmente (Castillo Sánchez, 2004). En la formulación
%del proyecto es necesario indicar claramente:
%
%\begin{itemize}
% \item Situación actual o estado actual de condiciones
% \item Situación deseada o estado ideal de condiciones
%\end{itemize}
%
%La descripción de la situación actual debe considerar las tres “C”:
%contextualización, caracterización, conceptualización y describir qué es lo que
%está ocurriendo en la actualidad.
%
%La descripción de la situación deseada debe buscar responder: ¿A dónde se quiere
%llegar? y ¿qué se pretende realizar en el proyecto para llegar a esta situación
%deseada?
%
%El planteamiento del problema puede hacerse a manera de preguntas:
%
%\begin{itemize}
% \item Deben formularse de manera precisa y concreta
% \item Es necesario que las preguntas estén contextualizadas, para ello, se
% debe describir primero la situación del contexto, luego se formulan
% las preguntas, y estas preguntas deberán estar de acorde con los
% objetivos.]
%\end{itemize}
%
%[Todos los párrafos deben estar con sus respectivas citas en formato APA
%(American Psychological Association, 2022) en su versión más actual. Toda fuente
%que se cita en el documento debe aparecer al final en la bibliografía o
%referencias. Las fuentes pueden ser tomadas de revistas académicas, artículos de
%eventos académicos, libros, anuarios, informes, tesis, páginas web, etc. Pueden
%ser citaciones textuales o parafraseadas, pero siempre dándole el crédito al
%autor. Todo lo que referencie a lo expresado por los autores debe estar en
%tiempo pasado. Por ejemplo: “Codd (1970) indicó” o “Codd (1970) dijo”.
%
%Todas sus afirmaciones deben sustentarse mediante las referencias para lo cual
%debe manejar un gestor de referencias como: Zotero, Mendeley, EndNote u otros.
%
%El uso de encabezamientos ayuda a darle estructura al documento. El estilo
%recomendado consiste de cinco (5) posibles niveles de encabezamientos:
%
% % Intro
% La deserción estudiantil universitaria es un fenómeno complejo que ha sido
% ampliamente estudiado para identificar sus causas debido a su impacto tanto en
% la vida del estudiante que deserta como de la institución educativa de la cual
% desertó (Fernández-Martín et al., 2019). Si bien los ratios de deserción han
% decrecido en los últimos 100 años (Doll et al., 2013), este sigue siendo un
% problema en la actualidad. En 2013, (Doll et al., 2013) calculó que en Estados
% Unidos, el ratio de deserción es de 40\% por año para estudiantes que persíguen
% un pregrado, de los cuales el 30\% deserta en el primer año de estudios.
% % Estudios previos
% Diversos estudios obtienen estadísticas de desersión estudiantil analizando
% varios factores académicos (E.g., universidad del estudiante, historia de notas
% de la escuela del estudiante, notas a la fecha del estudiante universitario,
% orden de mérito, asistencia a clases), socio-económicos (grupo étnico del
% estudiante, género, nivel de educación de los padres, ingresos propios, ingresos
% familiares (REF). Otros estudios menos cuantitativos se enfócan en analizar la
% deserción por el aspecto personal y psicológico del estudiante, analizando
% aspectos como la motivación, disciplina, esfuerzo y auto-control de los
% estudiantes por medio de encuestas (Lee et al., 2013).
% % Programas de prevesión de deserción estudiantil
% Por otro lado, existen diversos programas que intentan disminuir la deserción
% estudiantil.
El primer problema causa se trata de la naturaleza reactiva de los programas de
detección y ayuda para estudiantes propensos a desertar en lugar de adoptar un
enfoque más proactivo \autocite{chitti_need_2020}. La deserción estudiantil
universitaria es un fenómeno complejo que afecta a muchos estudiantes en todo el
mundo, y puede tener consecuencias a largo plazo tanto para los individuos como
para la sociedad. Por lo tanto, es importante abordar este problema de manera
efectiva. La situación actual de los programas de prevención de deserción
reactivos es que identifican y brindan apoyo a los estudiantes en riesgo después
de que se han manifestado signos de lucha o desinterés en el ámbito académico.
Estos programas suelen involucrar procesos de detección, seguimiento y medidas
correctivas para ayudar a los estudiantes a superar los desafíos que enfrentan y
mantenerlos en la carrera \autocite{chitti_need_2020}. Los estudiantes en
riesgo suelen ser identificados después de que ya han experimentado varias
dificultades académicas \autocite{Segura2022, Latif20221051} La situación
deseada por otro lado sería adoptar un enfoque proactivo, que implicaría
identificar y abordar los factores de riesgo antes de que se conviertan en
problemas. La identificación temprana juega un papel crucial, los estudiantes
en riesgo se identifican antes de que enfrenten dificultades académicas o
problemas de comportamiento, permitiendo intervenciones más efectivas y
oportunas \autocite{Shilbayeh2021562, chitti_need_2020, Segura2022}.
El segundo problema causa está relacionado a que existen diversas herramientas y
estrategias que podrían utilizarse para detectar la deserción estudiantil
universitaria de forma oportuna, pero estas no son aprovechadas por las
instituciones educativas. Por ejemplo, muchas universidades tienen acceso a
datos sobre el rendimiento académico de los estudiantes, el ratio de su
asistencia a clases, su participación en actividades extracurriculares,
situación socioeconómica al momento de ingresar a la universidad, y otros
indicadores importantes que podrían señalar un posible riesgo de deserción
\autocite{Khan2021, Yağcı2022}. Sin embargo, en muchos casos, estas
herramientas no se utilizan de manera efectiva. Los datos pueden estar
disponibles pero no se analizan de manera regular o sistemática
\autocite{Khan2021}. Además, los docentes y administradores a menudo no tienen
la formación o el tiempo necesario para interpretar y utilizar adecuadamente los
datos que tienen a su disposición \autocite{chitti_need_2020}. Por lo tanto, el
segundo problema efecto es que se está desaprovechando recursos y datos que
podrían ayudar a la detección temprana de estudiantes con riesgo a desertar
\autocite{Khan2021, Shilbayeh2021562, chitti_need_2020}.
% Otra posible razón relacionada, de porqué no se aprovechan las oportunidades
% para detectar la deserción estudiantil de forma oportuna es la falta de
% coordinación entre los diferentes departamentos de la universidad. Por
% ejemplo, el departamento de administración y finanzas puede tener información
% importante sobre los estudiantes que están teniendo dificultades financieras,
% pero es posible que esta información no se comparta con otros departamentos
% que podrían ofrecer apoyo académico o de salud mental.
El tercer problema causa está relacionado con la tarea de realizar el
seguimiento a todos los estudiantes con peligro de deserción. Este proceso
puede ser complejo, costoso y largo \autocite{Latif20221051}. Los factores que
pueden indicar el riesgo de deserción pueden ser diversos, lo que dificulta la
tarea de identificar a los estudiantes que necesitan intervención. Además,
muchos estudiantes pueden no mostrar signos claros de problemas hasta que sea
demasiado tarde. \textit{Por lo que mantener actualizado el factor de riesgo de
cada estudiante a lo largo del tiempo puede ser dificultoso}
\autocite{Latif20221051, Balaji2021}.
% Además, el alcance de los programas de prevención de la deserción de las
% universidades puede ser limitado. Las universidades pueden tener recursos
% limitados y, por lo tanto, no pueden implementar programas y estrategias de
% prevención de la deserción a gran escala. La falta de personal capacitado y la
% falta de tecnología pueden limitar la capacidad de la universidad para
% identificar y apoyar a los estudiantes en riesgo. Además, la falta de
% coordinación entre los diferentes departamentos de la universidad puede
% dificultar la capacidad de la universidad para tomar decisiones sobre el
% estado de sus estudiantes y ofrecer apoyo.
% En resumen, el seguimiento de los estudiantes con peligro de deserción es una
% tarea compleja, costosa y larga, y los programas de prevención de la deserción
% pueden tener un alcance limitado. Es importante que las universidades trabajen
% para abordar estos desafíos y desarrollar estrategias efectivas para
% identificar y apoyar a los estudiantes en riesgo de abandonar sus estudios.
% Esto puede requerir la asignación de recursos adecuados, la implementación de
% tecnología y la promoción de una cultura de colaboración en todo el campus.
\subsection{Problema seleccionado} \label{problematica-problema-seleccionado}
El problema central es que la deserción estudiantil universitaria es detectada
tardíamente debido a la falta de un enfoque más proactivo en la detección,
desaprovechando toda la data disponible en las instituciones educativas, la
escasez de capacidad para tomar decisiones oportunas y efectivas sobre el estado
de los estudiantes, y el seguimiento costoso y complejo de los estudiantes en
riesgo. Todo esto contribuye a que los estudiantes abandonen sus estudios antes
de que se puedan implementar medidas de apoyo eficaces.
\section{Objetivos}
En esta sección se define el objetivo general, para luego ser desglosado en
objetivos específicos. También se definen los resultados esperados asociados
a cada objetivo específico.
\subsection{Objetivo general}
Desarrollar un sistema, basado en técnicas de aprendizaje automático, que
permita predecir y prevenir la deserción estudiantil en el ámbito universitario,
mejorando así la retención de estudiantes y el rendimiento académico general.
% Basados en tecnicas de aprendizaje automatico.
\subsection{Objetivos específicos}
\begin{itemize}
\item \textbf{O1} Identificar los factores que influyen en la deserción estudiantil
universitaria usando técnicas estadísticas
\item \textbf{O2} Implementar modelos de Aprendizaje Automático que realicen
predicciones sobre la deserción estudiantil
\item \textbf{O3} Implementar un sistema que permita a las universidades, realizar un
proceso de detección temprana de deserción estudiantil. Utilizando los
modelos de Aprendizaje Automático, mencionados anteriormente.
\end{itemize}
\subsection{Resultados esperados}
\begin{itemize}
\item \textbf{O1} Identificar los factores que influyen en la deserción
estudiantil universitaria usando técnicas estadísticas
\begin{itemize}
\item \textbf{R1.1} Recolección de datos. Recoger y organizar datos
relevantes sobre el rendimiento académico de los estudiantes, su
participación en clases, asistencia, interacciones en línea, salud
mental, factores socioeconómicos, entre otros.
\item \textbf{R1.2} Análisis descriptivo y limpieza de datos.
\item \textbf{R1.3} Transformación de datos. Los datos recopilados se
transforman a un formato que puede ser fácilmente analizado y utilizado
en modelos estadísticos y de Aprendizaje Automático.
\item \textbf{R1.4} Análisis de relación. Se examina la relación entre
cada variable y la variable objetivo (deserción estudiantil) para
identificar patrones y tendencias
\item \textbf{R1.5} Análisis de correlación. Se realiza un análisis de
correlación para analizar la interdependencia entre las variables.
\end{itemize}
\item \textbf{O2} Implementar modelos de Aprendizaje Automático que realicen
predicciones sobre la deserción estudiantil
\begin{itemize}
\item \textbf{R2.1} Identificación de los algoritmos aprendizaje
automático de predicción con ayuda de la literatura.
\item \textbf{R2.2} Implementación de los algoritmos de ML seleccionados que
mejor se ajusten a la problemática.
\item \textbf{R2.3} Comparación de los algoritmos de ML implementados y
selección del mejor modelo según su precisión en la predicción.
\end{itemize}
\item \textbf{O3} Implementar un sistema que permita a las universidades,
realizar un proceso de detección temprana de deserción estudiantil. Utilizando
los modelos de Aprendizaje Automático, mencionados anteriormente.
\begin{itemize}
\item \textbf{R3.1} Catálogo de requisitos. Se definirán los requisitos
del sistema en una tabla, lo que permitirá una comprensión clara de las
funcionalidades esperadas del sistema.
\item \textbf{R3.2} Prototipo del sistema. El cual es realizado en un
software de prototipado, como por ejemplo Figma. Ilustra los
principales flujos del sistema.
\item \textbf{R3.3} Especificación de requisitos. Una descripción
detallada de los requisitos del sistema
\item \textbf{R3.4} Modelo de base de datos. Diseño del modelo de
base de datos que respalde la solución, buscando la integridad y la
eficiencia en la gestión de los datos.
\item \textbf{R3.5} Arquitectura de la solución. La arquitectura del
sistema define la estructura general, los componentes del sistema, y
cómo estos componentes interactúan entre sí.
\item \textbf{R3.6} Implementación del sistema. Incluye la programación
del sistema siguiendo las especificaciones definidas anteriormente.
\item \textbf{R3.7} Integración del sistema con los modelos de ML.
Integración de los modelos de aprendizaje automático desarrollados en el
Objetivo 2 con el sistema implementado. Permitiendo al sistema realizar
predicciones de deserción estudiantil basadas en los datos disponibles.
\item \textbf{R3.8} Instalación y configuración del software.
Incluye el empaquetamiento del software y pruebas de instalación
en un entorno nuevo.
\end{itemize}
\end{itemize}
% \begin{itemize}
% \item Recolección de Datos:
% \item Preprocesamiento de Datos: Limpiar y preparar los datos para el
% análisis, lo que puede incluir la gestión de datos faltantes, la
% normalización de datos y la transformación de variables categóricas en
% numéricas.
% \item Selección de Características (\textit{features}): Identificar y
% seleccionar las características más relevantes que puedan influir en la
% deserción estudiantil.
% \item Desarrollo del Modelo de Aprendizaje Automático: Construir y entrenar
% un modelo de aprendizaje automático capaz de predecir la probabilidad de
% deserción de un estudiante basado en las características seleccionadas.
% \item Validación del Modelo: Probar el modelo en un conjunto de datos de
% prueba independiente para validar su precisión y fiabilidad.
% \item Implementación y Monitoreo: Implementar el modelo en el entorno
% universitario y establecer un sistema de monitoreo que permita ajustes y
% mejoras continuas.
% \item Diseño de Intervenciones: Diseñar e implementar estrategias de
% intervención basadas en las predicciones del modelo para ayudar a los
% estudiantes en riesgo de deserción.
% \end{itemize}
\subsection{Mapeo de objetivos, resultados, y verificación}
En la \autoref{tab:obetivos-resultados-verificacion} se muestra en forma tabular
la relación entre los objetivos, sus resultados asociados, y medios de
verificación de cada resultado.
% TODO: Learn to use longtable
\begin{table} [H] % htbp
\centering
\small
\caption{Mapeo de objetivos, resultados, y verificación}
\label{tab:obetivos-resultados-verificacion}
\begin{tabular} {|p{0.27\linewidth}|p{0.35\linewidth}|p{0.38\linewidth}|}
\hline
\multicolumn{3}{|p{0.90\linewidth}|}{
\textbf{Objetivo 1 (O1):} Identificar los factores que influyen en
la deserción estudiantil universitaria usando técnicas estadísticas.
} \\
\hline
\textbf{Resultado} &
\textbf{Medio de verificación} &
\textbf{Indicador Objetivamente Verificable (IOV)} \\
\hline
\textbf{R1.1} Recolección de datos. &
- Obtención de un conjunto de datos proveniente de alguna universidad. &
- Aprobación del \textit{dataset} al 100\% por un especialista en Ciencia de Datos. \\
\hline
\textbf{R1.2} Análisis descriptivo y limpieza de datos. &
- Documento con el análisis exploratorio de los datos, utilizando técnicas de estadística descriptiva, incluyendo gráficos. &
- Aprobación del documento al 100\% por un especialista en Ciencia de Datos. \\
\hline
\textbf{R1.3} Transformación de datos. &
- Documento que muestre la transformación de los datos, a un formato adecuado para el posterior procesamiento. &
- Aprobación del documento al 100\% por un especialista en Ciencia de Datos. \\
\hline
\textbf{R1.4} Análisis de relación. &
- Documento con el análisis de relación entre las variables dependientes contra la variable independiente. &
- Aprobación del documento al 100\% por un especialista en Ciencia de Datos. \\
\hline
\textbf{R1.5} Análisis de correlación. &
- Documento con el análisis de correlación entre todas las variables usando un mapa de calor representado de forma tabular. &
- Aprobación del documento al 100\% por un especialista en Ciencia de Datos. \\
\hline
\multicolumn{3}{|p{0.90\linewidth}|}{
\textbf{Objetivo 2 (O2):} Implementar modelos de Aprendizaje Automático que
realicen predicciones sobre la deserción.
} \\
\hline
\textbf{Resultado} &
\textbf{Medio de verificación} &
\textbf{Indicador Objetivamente Verificable (IOV)} \\
\hline
\textbf{R2.1} Identificación de los algoritmos aprendizaje automático de predicción con ayuda de la literatura &
- Documento conteniendo un listado de los principales algoritmos de aprendizaje automático. Incluyendo las ventajas y desventajas de cada uno. &
- Aprobación del documento al 100\% por un especialista en Ciencia de Datos. \\
\hline
\textbf{R2.2} Implementación de los algoritmos de ML seleccionados que mejor se ajusten a la problemática. &
- Repositorio con el código fuente de la implementación de los modelos de ML. &
- Aprobación del documento al 100\% por un especialista en Ciencia de Datos. \\
\hline
\textbf{R2.3} Comparación de los algoritmos de ML implementados y selección del mejor modelo según su precisión en la predicción &
- Documento con el análisis comparativo entre los modelos de ML, basado en su precisión. &
- Aprobación del documento al 100\% por un especialista en Ciencia de Datos. \\
\hline
\multicolumn{3}{|p{0.90\linewidth}|}{
\textbf{Objetivo 3 (O3):} Implementar un sistema que permita a las
universidades, realizar un proceso de detección temprana de
deserción estudiantil. Utilizando los modelos de Aprendizaje
Automático.
} \\
\hline
\textbf{Resultado} &
\textbf{Medio de verificación} &
\textbf{Indicador Objetivamente Verificable (IOV)} \\
\hline
\textbf{R3.1} Catálogo de requisitos. &
- Documento con el catálogo de requisitos clasificados según su prioridad. &
- Aprobación del documento al 100\% por un especialista en Sistemas de Información. \\
\hline
\textbf{R3.2} Prototipo del sistema. &
- Documento con el prototipo del sistema. Muestra las principales pantallas y flujos. &
- Aprobación del documento al 100\% por un especialista en Sistemas de Información. \\
\hline
\textbf{R3.3} Especificación de requisitos. &
- Documento con la especificación de requisitos, describiendo cada uno a detalle. &
- Aprobación del documento al 100\% por un especialista en Sistemas de Información. \\
\hline
\textbf{R3.4} Modelo de base de datos. &
- Documento con el diagrama entidad relación o el diseño de la base de datos. &
- Aprobación del documento al 100\% por un especialista en Arquitectura de Software. \\
\hline
\textbf{R3.5} Arquitectura de la solución. &
- Documento con el diagrama de componentes del sistema. &
- Aprobación del documento al 100\% por un especialista en Arquitectura de Software. \\
\hline
\textbf{R3.6} Implementación del sistema. &
- Repositorio con el código fuente de la implementación del sistema. &
- Aprobación del documento al 100\% por un especialista en Sistemas de Información. \\
\hline
\textbf{R3.7} Integración del sistema con los modelos de ML. &
- Repositorio con el código fuente de la implementación del sistema. &
- Aprobación del documento al 100\% por un especialista en Sistemas de Información. \\
\hline
\textbf{R3.8} Instalación y configuración del software. &
- Documento de instalación y configuración del software. &
- Aprobación del documento al 100\% por un especialista en Sistemas de Información. \\
\hline
\end{tabular}
\end{table}
\section{Métodos y Procedimientos}
% [Son todas aquellas herramientas, metodologías, métodos o procedimientos que van
% a ser usados para construir, dentro de un proyecto (de tesis, de fin de
% carrera), cada uno de los resultados esperados. Se pueden aplicar / requerir
% varias herramientas para la realización de cada uno de los resultados. Se deben
% identificar claramente las herramientas, metodologías, métodos o procedimientos
% que se necesitan para cada resultado.
% Para cada resultado debe existir al menos una herramienta o método para
% obtenerlo. Puede usar tablas para mostrar: resultado, herramienta o método y
% forma de validación.
% Debe describir a modo resumido las herramientas o métodos y cómo los aplicará en
% su tesis, esta información debe venir acompañada de referencias donde se
% encuentran mayores detalles.
% Las herramientas cubren las necesidades propias de cada uno de los productos
% entregables que materialicen los resultados y que evidencien a los objetivos
% específicos.
% Dentro del contexto de un proyecto de fin de carrera se entiende como
% herramienta a cualquier soporte básico, técnico o de carácter operativo que se
% requiera para construir el resultado esperado. No debe listar las herramientas
% más simples. Algunos ejemplos son los lenguajes de programación, editores de
% código, compiladores e intérpretes, modeladores de base de datos, modeladores de
% procesos, generadores de datos aleatorios, modeladores de planos y piezas,
% etc. Se recomienda omitir las herramientas de ofimática.
% En el caso de utilizar alguna metodología, ésta puede ser definida como un
% conjunto de métodos, procedimientos, reglas, postulados y prácticas empleados en
% una disciplina. Puede ser considerada un sistema de capas, en donde cada capa es
% vista como un bloque de construcción que soporta la capa que se encuentra
% encima.
% En el caso de utilizar algún método, éste se define como un conjunto de
% procedimientos intelectuales y técnicos necesarios en la investigación
% científica. Como el conocimiento científico se fundamenta en la razón, precisa
% ser sistemático, de manera tal que puede ser comprobado por otros miembros de la
% comunidad científica. Dentro de los métodos consolidados en la investigación
% científica se encuentran el método deductivo y el método inductivo.
% El método deductivo se caracteriza por llegar a una conclusión a partir de una
% situación general y genérica, es decir, se parte de una teoría que define las
% relaciones entre conceptos dentro de un conjunto de suposiciones y restricciones
% fijadas, para formular hipótesis con el objetivo de confirmar la teoría. Por
% otro lado, el método inductivo se caracteriza por el proceso por el cual el
% investigador, por medio de observaciones, llega a determinadas conclusiones
% generales, es decir, parte de lo específico para lo general.
% En el caso de utilizar algún modelo, éste se define como una abstracción de la
% realidad que trata de describirla. Además, es la caracterización y
% especificación de un fenómeno o entidad observable, el cual es explicado por
% leyes y teorías de un cuerpo de conocimiento. Un modelo posee características
% contextuales, componentes, procedimientos, indicadores y métricas, así como
% guías de implementación, guías de medición y/o guías de implantación.]
En esta sección se listan las herramientas, métodos, y procedimientos relevantes
para cumplir los resultados esperados planteados en la sección anterior.
Algunas herramientas son específicas para ciertos resultados esperados, mientras
que otras son transversales a varios resultados esperados. Se busca
ser coherente en la selección de herramientas y métodos
utilizados para la problemática, en este caso la deserción estudiantil
universitaria detectada de forma tardía desaprovechando los datos disponibles
de los estudiantes.
\subsection{Aprendizaje Automático}
El Aprendizaje Automático o \textit{Machine Learning} (también conocido como
\enquote{aprendizaje de máquina}) se refiere al campo de estudio que analiza y
desarrolla métodos que \textit{aprenden}. Donde aprender se refiere a encontrar
patrones, tendencias, y entender \enquote{qué es lo que dice la data}
\autocite{hastie2009elements, mitchell1997machine}.
En la actualidad, se utilizan \textbf{técnicas de Aprendizaje Automático} en
aplicaciones de diversas disciplinas, entre ellas se encuentran: la detección de
correo electrónico basura, el reconocimiento óptico de carácteres (OCR), visión
computacional, y bioinformática \autocite{hastie2009elements}.
Los algoritmos de Aprendizaje Automático se pueden dividir en dos grandes
categorías, Aprendizaje Supervisado y Aprendizaje No Supervisado. En el
Aprendizaje Supervisado se cuenta con información previamente etiquetada, y el
objetivo es extraer patrones entre la data y su etiqueta asociada
\autocite{hastie2009elements}. Por ejemplo, en el ámbito de la deserción
estudiantil, la etiqueta es si el alumno desertó o no, y en qué ciclo lo hizo;
mientras que la data son todas las demás variables, como el promedio de notas en
cada ciclo. Por otro lado, los algoritmos de Aprendizaje No Supervisado deben
trabajar con datos que no han sido previamente etiquetados. Es decir, no se le
proporciona instrucciones específicas para lo que debe encontrar en la data.
Algunas aplicaciones de Aprendizaje No Supervisado incluyen procesamiento de
lenguaje natural y análisis de audio e imágenes
\autocite{russell_artificial_2010}.
Una de las técnicas más utilizadas son los algoritmos de clasificación, los
cuales buscan dividir a los individuos de una muestra en varias clases según el
valor de sus factores (\textit{features}). Por ejemplo, en la
\autoref{fig:classification-flowers} se puede ver el resultado de clasificar una
muestra de diversas flores, según el largo y ancho de sus pétalos, con el fin de
identificar si se trata de flores de la misma especie o no.
\begin{figure}[htbp]
\centering
\includegraphics[width=.4\columnwidth]{img/classification-flowers.png}
\caption{Clasificación de flores \autocite{mitchell1997machine}}
\label{fig:classification-flowers}
\end{figure}
\subsubsection{Ejemplos}
% Los modelos predictivos de Aprendizaje Automático son utilizados en la actualidad para
% analizar data historica compleja, con muchas variables, y realizar predicciones de
% futuros eventos. En relación a la deserción estudiantil universitaria, las universidades
% cuentan con grandes cantidades de datos historica de los estudiantes, que incluyen muchas
% variables académicas, socio-económicas, y personales de cada estudiantes. Dado el
% objetivo de predecir la deserción estudiantil universitaria, las técnicas modernas
% de Aprendizaje Automático pueden
En la actualidad, los modelos predictivos basados en Aprendizaje Automático (AA)
son ampliamente utilizados para analizar grandes conjuntos de datos históricos
complejos, caracterizados por un gran número de variables, con el fin de
predecir eventos futuros. En particular, en el ámbito universitario, las
instituciones cuentan con grandes cantidades de datos históricos de los
estudiantes, que incluyen diversas variables académicas, socioeconómicas y
personales \autocite{Balaji2021}. El objetivo de analizar estos datos es
predecir la deserción estudiantil universitaria, lo cual se ha convertido en una
preocupación creciente para las universidades en todo el mundo
\autocite{Shilbayeh2021562}.
Para predecir la deserción estudiantil, se han utilizado diversas técnicas de
AA, tales como árboles de decisión, redes neuronales y modelos de regresión
\autocite{Balaji2021}. Estos modelos se entrenan utilizando datos históricos de
estudiantes que han abandonado sus estudios universitarios en el pasado, con el
fin de identificar patrones y relaciones entre las diversas variables que puedan
indicar una mayor probabilidad de deserción en el futuro. Una vez que se ha
entrenado el modelo, este puede ser utilizado para predecir la deserción
estudiantil de los estudiantes actuales en función de las variables relevantes
\autocite{Shilbayeh2021562}.
Es importante destacar que, aunque los modelos predictivos de AA pueden ser
extremadamente precisos, no son infalibles y siempre existe un margen de error
\autocite{Latif20221051}. Por lo tanto, la interpretación cuidadosa de los
resultados del modelo es fundamental para tomar decisiones informadas y diseñar
estrategias efectivas para prevenir la deserción estudiantil
\autocite{Alwarthan2022107649, Latif20221051}.
|