diff options
Diffstat (limited to 'chapter/90-anexos.tex')
| -rw-r--r-- | chapter/90-anexos.tex | 28 |
1 files changed, 14 insertions, 14 deletions
diff --git a/chapter/90-anexos.tex b/chapter/90-anexos.tex index 9a5c8bf..ab3b413 100644 --- a/chapter/90-anexos.tex +++ b/chapter/90-anexos.tex @@ -86,15 +86,15 @@ planificación se pueden evidenciar en el cronograma de actividades del proyecto Se consideran 2 principales barreras técnicas para estimar la complejidad del proyecto, y por tanto los plazos de tiempo para cada resultado esperado. Por un -lado se encuentra la implementación de modelos de aprendizaje automático (ML), y +lado se encuentra la implementación de modelos de aprendizaje automático, y por el otro se encuentra la implementación del sistema de información que utilice estos modelos. -La implementación de modelos de ML es viable porque se poseen los conocimientos -base respecto a las técnicas (estadística, manejo de bases de datos, -análisis de datos, programación), y herramientas de software a utilizar. -Sin embargo, se requerirá aprender a mayor profundidad las técnicas de -aprendizaje automático para lo cual se cuenta con el apoyo de especialistas +La implementación de modelos de aprendizaje automático es viable porque se +poseen los conocimientos base respecto a las técnicas (estadística, manejo de +bases de datos, análisis de datos, programación), y herramientas de software a +utilizar. Sin embargo, se requerirá aprender a mayor profundidad las técnicas +de aprendizaje automático para lo cual se cuenta con el apoyo de especialistas que puedan dar guía en el aprendizaje, y también realizar las revisiones pertinentes para los resultados esperados. @@ -112,7 +112,7 @@ puede ser solicitado a universidades locales. \section{Alcance del proyecto} -El alcance de este proyecto es delimitado por los objetivos y resultados +El alcance de este proyecto está delimitado por los objetivos y resultados esperados definidos en la \autoref{sec:objetivos}. Para recapitular, el objetivo general es: desarrollar un sistema, basado en técnicas de aprendizaje automático, que permita predecir la deserción estudiantil en el ámbito @@ -124,19 +124,19 @@ Primero, se realizará el análisis descriptivo, limpieza, y preprocesamiento del conjunto de datos. Se utilizará el lenguaje de programación Python, y librerías especializadas para la realización de estas tareas, como Pandas, NumPy, y Matplotlib. El entorno de desarrollo será Visual -Studio Code y Jupyter Notebooks. Todo ejecutando en una laptop personal bajo el +Studio Code y Jupyter Notebooks. Todo se ejecuta en una laptop personal bajo el sistema operativo Linux. En cuanto a la metodología de trabajo para esta parte del análisis de datos se utilizará KDD (Knowledge Discovery in Databases). Luego, se generarán modelos de aprendizaje automático, utilizando algoritmos ya implementados y de libre disponibilidad. Una librería en Python muy -utilizada que facilita el uso de dichos algorítmos es scikit-learn. El output -de los algorítmos de aprendizaje automático son los modelos de predicción +utilizada que facilita el uso de dichos algoritmos es scikit-learn. El output +de los algoritmos de aprendizaje automático son los modelos de predicción entrenados, los cuales luego son utilizados para realizar predicciones en base a nuevos datos (\textit{datapoints}). La dificultad se encuentra en optimizar la generación de estos modelos según las características del conjunto de datos. Los pasos previos de limpieza y preprocesamiento son cruciales, así como también -la selección de algoritmos y la optimización de sus respectivos hiperparámetros +la selección de algoritmos y la optimización de sus respectivos hiper-parámetros \autocite{Kemper2020}. Finalmente, se implementará un sistema de información que utilice el mejor @@ -156,14 +156,14 @@ universidad del país. \section{Restricciones} El proyecto depende de la disposición de conjuntos de datos de las universidades. -Es posible que las univesidades a quienes se les solicite estos datos no los compartan, +Es posible que las universidades a quienes se les solicite estos datos no los compartan, ya sea por la complejidad en extraer la información de sus sistemas informáticos, o porque simplemente no está dentro de sus procedimientos compartir estos datos. Además, el proyecto depende de la disponibilidad de los especialistas en aprendizaje automático, sistemas de información, y usabilidad. Quienes se -encargarán de validar los resultados esperados del proyecto. +encargan de validar los resultados esperados del proyecto. \section{Identificación de riesgos} @@ -176,7 +176,7 @@ de cada riesgo, de acuerdo a las siguientes fórmulas: representar la probabilidad de que suceda el evento durante la realización del proyecto. \item I: Impacto del riesgo. Número real del 0 al 1. Donde \(I = 0\) - representa un riesgo con consecuencias muy bajas o inperceptibles, mientras + representa un riesgo con consecuencias muy bajas o imperceptibles, mientras \(I = 1\) representa que el riesgo tiene consecuencias críticas para el éxito del proyecto. \item S: Severidad del riesgo. Calculado como \(S = P*I\). |
