aboutsummaryrefslogtreecommitdiffstats
path: root/chapter/90-anexos.tex
diff options
context:
space:
mode:
authorMitsuo Tokumori <[email protected]>2023-06-08 05:40:36 -0500
committerMitsuo Tokumori <[email protected]>2023-06-08 05:40:36 -0500
commit9c6ccb9f4cef6cc362743822dc98494a76b561b3 (patch)
tree0c3572523be4e77c755bec22b73ac50b669e91f1 /chapter/90-anexos.tex
parent796609fde3238e632d3bc08fcb186134b661fe49 (diff)
downloadthesis-9c6ccb9f4cef6cc362743822dc98494a76b561b3.tar.gz
thesis-9c6ccb9f4cef6cc362743822dc98494a76b561b3.tar.bz2
thesis-9c6ccb9f4cef6cc362743822dc98494a76b561b3.zip
E3 advisor feedback corrections
All observations resolved: - problema central lo habiamos cambiado, modificarlo a la nueva version - colocar Aprendizaje automatico y no solo ML - Tabla 1.3 nombre de herramientas deben ir en mayusculas - Falta definición de Metodos y Procedimientos como KDD
Diffstat (limited to 'chapter/90-anexos.tex')
-rw-r--r--chapter/90-anexos.tex28
1 files changed, 14 insertions, 14 deletions
diff --git a/chapter/90-anexos.tex b/chapter/90-anexos.tex
index 9a5c8bf..ab3b413 100644
--- a/chapter/90-anexos.tex
+++ b/chapter/90-anexos.tex
@@ -86,15 +86,15 @@ planificación se pueden evidenciar en el cronograma de actividades del proyecto
Se consideran 2 principales barreras técnicas para estimar la complejidad del
proyecto, y por tanto los plazos de tiempo para cada resultado esperado. Por un
-lado se encuentra la implementación de modelos de aprendizaje automático (ML), y
+lado se encuentra la implementación de modelos de aprendizaje automático, y
por el otro se encuentra la implementación del sistema de información que
utilice estos modelos.
-La implementación de modelos de ML es viable porque se poseen los conocimientos
-base respecto a las técnicas (estadística, manejo de bases de datos,
-análisis de datos, programación), y herramientas de software a utilizar.
-Sin embargo, se requerirá aprender a mayor profundidad las técnicas de
-aprendizaje automático para lo cual se cuenta con el apoyo de especialistas
+La implementación de modelos de aprendizaje automático es viable porque se
+poseen los conocimientos base respecto a las técnicas (estadística, manejo de
+bases de datos, análisis de datos, programación), y herramientas de software a
+utilizar. Sin embargo, se requerirá aprender a mayor profundidad las técnicas
+de aprendizaje automático para lo cual se cuenta con el apoyo de especialistas
que puedan dar guía en el aprendizaje, y también realizar las revisiones
pertinentes para los resultados esperados.
@@ -112,7 +112,7 @@ puede ser solicitado a universidades locales.
\section{Alcance del proyecto}
-El alcance de este proyecto es delimitado por los objetivos y resultados
+El alcance de este proyecto está delimitado por los objetivos y resultados
esperados definidos en la \autoref{sec:objetivos}. Para recapitular, el
objetivo general es: desarrollar un sistema, basado en técnicas de aprendizaje
automático, que permita predecir la deserción estudiantil en el ámbito
@@ -124,19 +124,19 @@ Primero, se realizará el análisis descriptivo, limpieza, y
preprocesamiento del conjunto de datos. Se utilizará el lenguaje de
programación Python, y librerías especializadas para la realización de estas
tareas, como Pandas, NumPy, y Matplotlib. El entorno de desarrollo será Visual
-Studio Code y Jupyter Notebooks. Todo ejecutando en una laptop personal bajo el
+Studio Code y Jupyter Notebooks. Todo se ejecuta en una laptop personal bajo el
sistema operativo Linux. En cuanto a la metodología de trabajo para esta
parte del análisis de datos se utilizará KDD (Knowledge Discovery in Databases).
Luego, se generarán modelos de aprendizaje automático, utilizando algoritmos
ya implementados y de libre disponibilidad. Una librería en Python muy
-utilizada que facilita el uso de dichos algorítmos es scikit-learn. El output
-de los algorítmos de aprendizaje automático son los modelos de predicción
+utilizada que facilita el uso de dichos algoritmos es scikit-learn. El output
+de los algoritmos de aprendizaje automático son los modelos de predicción
entrenados, los cuales luego son utilizados para realizar predicciones en base a
nuevos datos (\textit{datapoints}). La dificultad se encuentra en optimizar la
generación de estos modelos según las características del conjunto de datos.
Los pasos previos de limpieza y preprocesamiento son cruciales, así como también
-la selección de algoritmos y la optimización de sus respectivos hiperparámetros
+la selección de algoritmos y la optimización de sus respectivos hiper-parámetros
\autocite{Kemper2020}.
Finalmente, se implementará un sistema de información que utilice el mejor
@@ -156,14 +156,14 @@ universidad del país.
\section{Restricciones}
El proyecto depende de la disposición de conjuntos de datos de las universidades.
-Es posible que las univesidades a quienes se les solicite estos datos no los compartan,
+Es posible que las universidades a quienes se les solicite estos datos no los compartan,
ya sea por la complejidad en extraer la información de sus sistemas
informáticos, o porque simplemente no está dentro de sus procedimientos
compartir estos datos.
Además, el proyecto depende de la disponibilidad de los especialistas en
aprendizaje automático, sistemas de información, y usabilidad. Quienes se
-encargarán de validar los resultados esperados del proyecto.
+encargan de validar los resultados esperados del proyecto.
\section{Identificación de riesgos}
@@ -176,7 +176,7 @@ de cada riesgo, de acuerdo a las siguientes fórmulas:
representar la probabilidad de que suceda el evento durante la
realización del proyecto.
\item I: Impacto del riesgo. Número real del 0 al 1. Donde \(I = 0\)
- representa un riesgo con consecuencias muy bajas o inperceptibles, mientras
+ representa un riesgo con consecuencias muy bajas o imperceptibles, mientras
\(I = 1\) representa que el riesgo tiene consecuencias críticas para el
éxito del proyecto.
\item S: Severidad del riesgo. Calculado como \(S = P*I\).