1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
|
\chapter{Formulario de Extracción}
Se encuentra en la hoja de cálculo nombrada:
% \verb 20170895_RobertoTokumori_PatriciaNatividad_E2_Anexo1.xlsx \verb.
\begin{verbatim}20170895_RobertoTokumori_PatriciaNatividad_E2_Anexo1.xlsx\end{verbatim}.
\chapter{Plan de Proyecto}
\section{Justificación}
% TODO: Revisar coherencia en citas
% I've commented out some of the paragraphs. Maybe add them in the future
% it depends if it's OK to add points related to the "methods". I've only
% left the ones related to the "problem".
El desarrollo de un sistema de información que utilice técnicas de aprendizaje
automático para predecir la deserción de estudiantes universitarios y mejorar
las tasas de retención es un proyecto que puede ser justificado por las siguientes
razones.
\begin{itemize}
\item
Uno de los principales objetivos de las universidades es asegurar el
éxito académico de sus estudiantes \autocite{Shilbayeh2021562}.
Al predecir con precisión las posibles deserciones, las
universidades pueden intervenir temprano e implementar sistemas de
apoyo específicos para abordar las causas raíz de la deserción de los
estudiantes. Este enfoque proactivo puede permitiría las universidades
apoyar mejor a los estudiantes con dificultades y mejorar sus posibilidades
de completar sus títulos con éxito.
\item
La deserción de los estudiantes no solo es perjudicial
para los estudiantes individuales sino también para las propias universidades.
Cuando los estudiantes abandonan la universidad, esto representa una pérdida de recursos
invertidos en su educación, incluido el tiempo, la financiación y los esfuerzos
del personal docente de la universidad \autocite{Alwarthan2022107649}.
Al identificar con precisión a los estudiantes en riesgo,
las universidades pueden asignar sus recursos de manera más efectiva, ofreciendo
intervenciones personalizadas a quienes más las necesitan. Esta asignación
optimizada de recursos puede generar ahorros de costos y una mayor eficiencia
para las instituciones educativas.
% Datos que cuentan las universidades son "underutilized". (Maybe in this one
% include the points below)
% Las técnicas de aprendizaje automático pueden
% analizar múltiples factores que contribuyen a las tasas de deserción de
% los estudiantes, incluido el rendimiento académico, el entorno socioeconómico,
% y los niveles de compromiso. Al aprovechar esta gran cantidad de datos, el
% sistema de información puede identificar patrones y factores de riesgo asociados
% con el comportamiento de deserción estudiantil universitaria.
% Los métodos tradicionales para identificar posibles
% abandonos a menudo se basan en medidas reactivas, como observar un rendimiento
% académico deficiente o signos de desconexión \autocite{Alwarthan2022107649}. Sin embargo, mediante el uso de
% algoritmos de aprendizaje automático, el sistema de información puede analizar
% grandes cantidades de datos históricos y crear modelos predictivos para
% pronosticar las probabilidades de abandono escolar de los estudiantes en una
% etapa temprana. Este enfoque proactivo permite a las instituciones intervenir
% con prontitud, brindando recursos y orientación específicos para ayudar a los
% estudiantes a superar los desafíos y aumentar sus probabilidades de permanecer
% matriculados.
\end{itemize}
% Por lo tanto, se justifica el desarrollo de un sistema de información que
% pueda ayudar a predecir la deserción de los estudiantes universitarios y mejore
% las tasas de retención, ya que mejora el éxito de los estudiantes, optimiza la
% asignación de recursos y permite intervenciones proactivas basadas en análisis
% predictivos. Este proyecto tiene el potencial de mejorar significativamente las
% tasas de retención y contribuir al éxito general de las instituciones
% educativas.
\section{Viabilidad}
\subsection{Viabilidad temporal}
El proyecto tendrá una duración de 7 meses, desde julio del 2023, hasta fines de
diciembre del 2023. Los plazos de los resultados esperados, resultado de la
planificación se pueden evidenciar en el cronograma de actividades del proyecto
(Ver tabla).
\subsection{Viabilidad técnica}
Se consideran 2 principales barreras técnicas para estimar la complejidad del
proyecto, y por tanto los plazos de tiempo para cada resultado esperado. Por un
lado se encuentra la implementación de modelos de aprendizaje automático, y
por el otro se encuentra la implementación del sistema de información que
utilice estos modelos.
La implementación de modelos de aprendizaje automático es viable porque se
poseen los conocimientos base respecto a las técnicas (estadística, manejo de
bases de datos, análisis de datos, programación), y herramientas de software a
utilizar. Sin embargo, se requerirá aprender a mayor profundidad las técnicas
de aprendizaje automático para lo cual se cuenta con el apoyo de especialistas
que puedan dar guía en el aprendizaje, y también realizar las revisiones
pertinentes para los resultados esperados.
Por otro lado, para la implementación del sistema de información también es
viable porque también se cuentan los conocimientos base para planear, definir,
e implementar un sistema de información. Y se cuenta con el apoyo
de especialistas para la revisión de los resultados esperados.
\subsection{Viabilidad económica}
El proyecto no demanda una inversión económica significativa. Las
herramientas de software necesarias no requieren una licencia especial que
implique gastos adicionales. Y el conjunto de datos requerido para el análisis
puede ser solicitado a universidades locales.
\section{Alcance del proyecto}
El alcance de este proyecto está delimitado por los objetivos y resultados
esperados definidos en la \autoref{sec:objetivos}. Para recapitular, el
objetivo general es: desarrollar un sistema, basado en técnicas de aprendizaje
automático, que permita predecir la deserción estudiantil en el ámbito
universitario, mejorando así la retención de estudiantes. Con la intención de
delimitar mejor el alcance, se describen a continuación las actividades del
proyecto en alto nivel.
Primero, se realizará el análisis descriptivo, limpieza, y
preprocesamiento del conjunto de datos. Se utilizará el lenguaje de
programación Python, y librerías especializadas para la realización de estas
tareas, como Pandas, NumPy, y Matplotlib. El entorno de desarrollo será Visual
Studio Code y Jupyter Notebooks. Todo se ejecuta en una laptop personal bajo el
sistema operativo Linux. En cuanto a la metodología de trabajo para esta
parte del análisis de datos se utilizará KDD (Knowledge Discovery in Databases).
Luego, se generarán modelos de aprendizaje automático, utilizando algoritmos
ya implementados y de libre disponibilidad. Una librería en Python muy
utilizada que facilita el uso de dichos algoritmos es scikit-learn. El output
de los algoritmos de aprendizaje automático son los modelos de predicción
entrenados, los cuales luego son utilizados para realizar predicciones en base a
nuevos datos (\textit{datapoints}). La dificultad se encuentra en optimizar la
generación de estos modelos según las características del conjunto de datos.
Los pasos previos de limpieza y preprocesamiento son cruciales, así como también
la selección de algoritmos y la optimización de sus respectivos hiper-parámetros
\autocite{Kemper2020}.
Finalmente, se implementará un sistema de información que utilice el mejor
modelo de predicción de la deserción estudiantil universitaria. El cual pueda
facilitar la utilización del modelo por parte del usuario. Se utilizará el
marco Ágil para la captación de requisitos del sistema mediante User Story
Mapping. Para el prototipado de la solución se utilizará la herramienta Figma
(web). Y para la implementación del sistema de información se utilizará
tecnología web, para que posteriormente pueda ser desplegado en un servidor de
algún proveedor de servicios en la nube, como por ejemplo AWS (Amazon).
El presente proyecto no contempla la implementación de nuevos algoritmos de
aprendizaje automático. Ni tampoco la implantación del sistema en alguna
universidad del país.
\section{Restricciones}
El proyecto depende de la disposición de conjuntos de datos de las universidades.
Es posible que las universidades a quienes se les solicite estos datos no los compartan,
ya sea por la complejidad en extraer la información de sus sistemas
informáticos, o porque simplemente no está dentro de sus procedimientos
compartir estos datos.
Además, el proyecto depende de la disponibilidad de los especialistas en
aprendizaje automático, sistemas de información, y usabilidad. Quienes se
encargan de validar los resultados esperados del proyecto.
\section{Identificación de riesgos}
En la \autoref{tab:riesgos-proyecto} se listan los riesgos identificados del
proyecto. Se cuantifica la P (Probabilidad), I (Impacto), y S (Severidad),
de cada riesgo, de acuerdo a las siguientes fórmulas:
\begin{itemize}
\item P: Probabilidad del riesgo. Número real del 0 al 1. Intenta
representar la probabilidad de que suceda el evento durante la
realización del proyecto.
\item I: Impacto del riesgo. Número real del 0 al 1. Donde \(I = 0\)
representa un riesgo con consecuencias muy bajas o imperceptibles, mientras
\(I = 1\) representa que el riesgo tiene consecuencias críticas para el
éxito del proyecto.
\item S: Severidad del riesgo. Calculado como \(S = P*I\).
\begin{itemize}
\item Severidad baja si \(I < 0.05\)
\item Severidad media si \(0.05 <= I < 0.20\)
\item Severidad alta si \(0.20 < I\)
\end{itemize}
\end{itemize}
\begin{table} [H] % htbp
\centering
\small
\caption{Riesgos del proyecto}
\label{tab:riesgos-proyecto}
\begin{tabular} {*{2}{|p{0.20\linewidth}} *{3}{|p{0.025\linewidth}} *{3}{|p{0.15\linewidth}}|}
\hline
\textbf{Riesgo} &
\textbf{Materialización del riesgo} &
\textbf{P} &
\textbf{I} &
\textbf{S} &
\textbf{Mitigación} &
\textbf{Contingencia} \\
\hline
\hline
Los expertos no se encuentran disponibles para revisar de los
entregables a tiempo para cumplir con el cronograma &
Demoras en el tiempo de respuesta de los expertos. Dificultad para
contactar algún experto. &
.8 & .5 & .4 &
Coordinar con la mayor anticipación posible con los expertos.
Contar con al menos 2 expertos de cada área en caso uno no se encuentre
disponible. &
Buscar a más expertos del área requerida para que pueda revisar
el entregable a tiempo \\
\hline
No contar con el conjunto de datos requerido para el análisis &
Demoras en el tiempo de respuesta de las universidades contactadas
para adquirir el conjunto de datos. Dificultad por parte de las
universidades para extraer la información requerida. Las universidades
contactadas no pueden compartir el conjunto de datos requeridos. &
.5 & 1 & .5 &
Coordinar con la mayor anticipación posible con las universidades.
Contactar con al menos 3 universidades para requerir los conjuntos de
datos. &
Buscar en Internet si existe algún conjunto de datos de libre disponibilidad.
Buscar a más universidades para adquirir el conjunto de datos. \\
\hline
Pérdida de información debido a pérdida equipos informáticos &
Robo de la laptop. Corrupción del disco duro. &
.2 & .8 & .16 &
Mantener 2 copias de seguridad (\textit{backups}) de la información.
Mantener una de esas copias en la nube. Actualizar diariamente
las copias de seguridad. &
Restaurar la información utilizando la última copia de seguridad.
Comprar nuevo equipo informático de reemplazo. \\
\hline
Planeamiento inadecuado de las actividades del proyecto &
Se identifica una actividad significativa requerida para el desarrollo
del proyecto. Estimación del tiempo requerido para la actividad
insuficiente &
.4 & .4 & .16 &
Realizar el planeamiento de actividades junto con el asesor.
Contar con feedback de expertos para la estimación de tiempo
de actividades fuera del expertise del tesista. &
Reestructurar las actividades o el cronograma siguiendo el procedimiento
especificado en el documento de Procesos de Tesis \\
\hline
\end{tabular}
\end{table}
\section{Estructura de descomposición del trabajo (EDT)}
Con el objetivo de descomponer las actividades del proyecto y organizarlas en
módulos, se dividen las tareas del proyecto en 2 grandes partes. Una parte
relacionada a la gestión del proyecto en sí como parte del curso de tesis en la
PUCP. La cual incluye la generación de documentos (entregables) y revisiones
por parte de especialistas para verificar la calidad de los mismos. Y la otra
parte relacionada al desarrollo de los resultados esperados. En la
\autoref{fig:edt} se puede apreciar esta división.
\begin{figure}[H]
\caption{Estructura de descomposición del trabajo (EDT)}
\label{fig:edt}
\centering
\includegraphics[width=2.5in]{img/w13-edt.drawio.png}
\end{figure}
\section{Lista de recursos}
En esta sección, se listan los recursos necesarios para desarrollar el proyecto.
\subsection{Personas involucradas y necesidades de capacitación}
En la \autoref{tab:personas-involucradas-necesidades-capacitacion} se muestran
las personas involucradas en el desarrollo del proyecto, su rol, y si
requiere de alguna capacitación previa.
\begin{table} [H] % htbp
\centering
\small
\caption{Personas involucradas y necesidades de capacitación}
\label{tab:personas-involucradas-necesidades-capacitacion}
\begin{tabular} {*{3}{|p{0.30\linewidth}}|}
\hline
\textbf{Persona \newline involucrada} &
\textbf{\newline Rol} &
\textbf{Necesidades \newline de capacitación} \\
\hline
\hline
R. Mitsuo Tokumori & Tesista &
Investigación relacionada a factores de deserción estudiantil universitaria.
Implementación de modelos de análisis de datos e integración con un sistema de información. \\ \hline
Mg. Patricia Natividad & Aseesora & No \\ \hline
- & Especialista en Ciencia de Datos & No \\ \hline
- & Especialista en Sistemas de Información & No \\ \hline
- & Especialista en Arquitectura de Software & No \\ \hline
\end{tabular}
\end{table}
\subsection{Materiales requeridos para el proyecto}
Para el desarrollo del proyecto se necesitará una computadora (PC) y acceso a
internet para la descarga y actualización de las herramientas (locales), uso de
herramientas web, y despliegue de los prototipos de la solución en un proveedor
de servicios de computación en la nube. Una lista más exhaustiva de las
herramientas a utilizarse se listan en la \autoref{sec:metodos-procedimientos}.
\section{Lista de tareas}
En la \autoref{tab:lista-tareas} se muestra el listado de tareas para cada
entregable y resultado esperado del proyecto de tesis. La duración y
esfuerzo se estima en días y horas hombre (HH), respectivamente. Mientras
que el costo estimado se calcula en Nuevos Soles (PEN) en función a
los siguientes costos por hora:
\begin{itemize}
\item Tesista: \(20\) PEN/h
\item Asesora: \(100\) PEN/h
\item Especialista: \(100\) PEN/h
\end{itemize}
\begin{longtable}[c]{|p{0.60\linewidth} *{3}{|p{0.10\linewidth}}|}
\caption{Lista de tareas.\label{tab:lista-tareas}}\\
% \hline
% \multicolumn{2}{| c |}{Begin of Table}\\
% \hline
% \centering \newline Tarea
% & Duración estimada (días) & Esfuerzo Asociado (HH) & Costo estimado (PEN) \\
% \hline
% \endfirsthead
% \hline
% \multicolumn{4}{|p|}{Continuación de la tabla \ref{tab:lista-tareas}}\\
\hline
\centering \newline Tarea
& Duración estimada (días) & Esfuerzo Asociado (HH) & Costo estimado (PEN) \\
\hline
\endhead
\hline
\endfoot
% \hline
% \multicolumn{2}{| c |}{End of Table}\\
% \hline\hline
% \endlastfoot
\multicolumn{4}{| c |}{Entregable 1.1} \\ \hline
Elaborar ficha de registro de asesora y tema de tesis & 2 & 4 & 80 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{Entregable 1.2} \\ \hline
Elaborar avance del Estado del Arte & 4 & 12 & 350 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{Entregable 1.3} \\ \hline
Elaborar avance del Estado del Arte, respuestas a las preguntas de revisión & 4 & 12 & 240 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{Entregable 1.4} \\ \hline
Elaborar avance del Estado del Arte, finalizar respuestas a las preguntas de revisión & 4 & 12 & 240 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{Entregable 1.5} \\ \hline
Elaborar avance del Marco Conceptual, conceptos y ejemplos & 4 & 12 & 240 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{Entregable 1} \\ \hline
Elaborar avance de la Problemática, definición del árbol de problemas & 4 & 12 & 240 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{Entregable 2.1} \\ \hline
Elaborar avance de los Objetivos, definición de objetivo general y específicos & 4 & 12 & 240 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{Entregable 2} \\ \hline
Elaborar avance de los Métodos y Procedimientos & 4 & 12 & 240 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{Entregable 3} \\ \hline
Elaborar avance del Plan de Proyecto, avance parcial & 4 & 12 & 240 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{Entregable 4} \\ \hline
Elaborar avance del Plan de Proyecto, finalizado & 4 & 12 & 240 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Realizar correcciones del entregable anterior & 1 & 2 & 40 \\ \hline
\multicolumn{4}{| c |}{\textbf{R1.1} Recolección de datos.} \\ \hline
Solicitar conjunto de datos a universidades del país & 5 & 5 & 100 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del dataset por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R1.2} Análisis descriptivo y limpieza de datos.} \\ \hline
Aplicar estadística descriptiva y generar gráficas & 2 & 4 & 80 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R1.3} Transformación de datos.} \\ \hline
Transformar los datos a una forma útil, estándar, y facil de utilizar
en los posteriores pasos de la metodología KDD & 2 & 4 & 80 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R1.4} Análisis de relación.} \\ \hline
Realizar el análisis de relación entre las variables dependientes contra la variable independiente & 1 & 4 & 80 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en ciencia de datos & 1 & 1 & 20 \\ \hline
\multicolumn{4}{| c |}{\textbf{R1.5} Análisis de correlación.} \\ \hline
Realizar el análisis de corelación entre las todas las variables & 1 & 1 & 20 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R2.1} Identificación de los algoritmos aprendizaje automático de predicción con ayuda de la literatura} \\ \hline
Listar los principales algoritmos de aprendizaje automático. Incluyendo las ventajas y desventajas de cada uno teniendo en cuenta la problemática & 4 & 8 & 160 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R2.2} Implementación de los algoritmos de aprendizaje automático seleccionados} \\ \hline
Entrenar modelos de aprendizaje supervisado utilizando los distintos algoritmos. Realizar optimización de hiperparámetros. & 4 & 8 & 160 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R2.3} Comparación de los algoritmos de aprendizaje automático implementados y selección del mejor} \\ \hline
Comparar desempeño de los distintos modelos entrenados en su capacidad de realizar predicciones certeras & 4 & 8 & 160 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en ciencia de datos & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R3.1} Catálogo de requisitos.} \\ \hline
Listar requisitos del sistema y su prioridad & 2 & 4 & 80 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R3.2} Prototipo del sistema.} \\ \hline
Desarrollar prototipio del sistema de información & 4 & 8 & 160 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R3.3} Especificación de requisitos.} \\ \hline
Especificar requisitos mediante User Stories y criterios de aceptación & 3 & 6 & 120 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R3.4} Modelo de base de datos.} \\ \hline
Definir modelo de base de datos para el sistema & 2 & 4 & 80 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en arquitectura de software & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R3.5} Arquitectura de la solución.} \\ \hline
Definir la arquitectura del sistema & 2 & 4 & 80 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en arquitectura de software & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R3.6} Implementación del sistema.} \\ \hline
Desarrollo del sistema por el método iterativo & 15 & 30 & 600 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R3.7} Integración del sistema con los modelos de aprendizaje automático. } \\ \hline
Integrar sistema de información desarrollado con modelo campeón & 5 & 10 & 200 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en sistemas de información& 1 & 2 & 120 \\ \hline
\multicolumn{4}{| c |}{\textbf{R3.8} Instalación y configuración del software.} \\ \hline
Desarrollar guía de instalación y configuración del software & 2 & 4 & 80 \\ \hline
Reunión con asesora & 1 & 2 & 120 \\ \hline
Aprobación del documento por un especialista en sistemas de información & 1 & 2 & 120 \\ \hline \hline
Total & - & 74 & 9490 \\ \hline
\end{longtable}
\section{Cronograma de actividades del proyecto}
Para el cronograma de actividades en la \autoref{tab:cronograma-actividades},
para las fechas de inicio y fin de los resultados esperados se utiliza
como unidad las semanas del semestre académico. Correspondiendo a la semana 01,
a la primera semana de clases del ciclo.
\begin{longtable}[c]{|p{0.60\linewidth} *{2}{|p{0.15\linewidth}}|}
\caption{Cronograma de actividades.\label{tab:cronograma-actividades}}\\
% \hline
% \multicolumn{2}{| c |}{Begin of Table}\\
% \hline
% \centering \newline Tarea
% & Duración estimada (días) & Esfuerzo Asociado (HH) & Costo estimado (PEN) \\
% \hline
% \endfirsthead
% \hline
% \multicolumn{4}{|p|}{Continuación de la tabla \ref{tab:lista-tareas}}\\
\hline
\centering \newline Tarea
& Inicio & Fin \\
\hline
\endhead
\hline
\endfoot
% \hline
% \multicolumn{2}{| c |}{End of Table}\\
% \hline\hline
% \endlastfoot
Entregable 1.1 & 2023/03/20 & 2023/03/27 \\ \hline
Entregable 1.2 & 2023/03/27 & 2023/04/03 \\ \hline
Entregable 1.3 & 2023/04/03 & 2023/04/10 \\ \hline
Entregable 1.4 & 2023/04/10 & 2023/04/17 \\ \hline
Entregable 1.5 & 2023/04/17 & 2023/04/24 \\ \hline
Entregable 1 & 2023/04/24 & 2023/04/28 \\ \hline
Entregable 2.1 & 2023/04/28 & 2023/05/08 \\ \hline
Entregable 2 & 2023/05/08 & 2023/05/26 \\ \hline
Entregable 3 & 2023/05/26 & 2023/06/07 \\ \hline
Entregable 4 & 2023/06/07 & 2023/06/16 \\ \hline
\textbf{R1.1} Recolección de datos. & semana 01 & semana 05 \\ \hline
\textbf{R1.2} Análisis descriptivo y limpieza de datos. & semana 01 & semana 05 \\ \hline
\textbf{R1.3} Transformación de datos. & semana 01 & semana 05 \\ \hline
\textbf{R1.4} Análisis de relación. & semana 01 & semana 05 \\ \hline
\textbf{R1.5} Análisis de correlación. & semana 01 & semana 05 \\ \hline
\textbf{R2.1} Identificación de los algoritmos aprendizaje automático de predicción con ayuda de la literatura & semana 01 & semana 06 \\ \hline
\textbf{R2.2} Implementación de los algoritmos de aprendizaje automático seleccionados & semana 01 & semana 06 \\ \hline
\textbf{R2.3} Comparación de los algoritmos de aprendizaje automático implementados y selección del mejor & semana 01 & semana 06 \\ \hline
\textbf{R3.1} Catálogo de requisitos. & semana 01 & semana 02 \\ \hline
\textbf{R3.2} Prototipo del sistema. & semana 01 & semana 03 \\ \hline
\textbf{R3.3} Especificación de requisitos. & semana 02 & semana 04 \\ \hline
\textbf{R3.4} Modelo de base de datos. & semana 02 & semana 04 \\ \hline
\textbf{R3.5} Arquitectura de la solución. & semana 02 & semana 04 \\ \hline
\textbf{R3.6} Implementación del sistema. & semana 04 & semana 10 \\ \hline
\textbf{R3.7} Integración del sistema con los modelos de aprendizaje automático. & semana 06 & semana 11 \\ \hline
\textbf{R3.8} Instalación y configuración del software. & semana 10 & semana 11 \\ \hline
\end{longtable}
|