![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec618ee3cd3bb31c939c0c2cbe013272.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec618ee3cd3bb31c939c0c2cbe013272.jpeg)
Tipos de datos
Numéricos o cuantitativos
Tasa de desempleo, tasa de inflación, ingreso de los hogares, gasto de los hogares. Categóricos o cualitativos
Transversales
Sexo, nivel de instrucción formal, tipo de universidad. Generalmente, se puede transformar estadísticas numéricas a través de frecuencias (absolutas o relativas).
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Observaciones realizadas en el mismo período de tiempo a un grupo específico (Tabla 1.2).
Series de tiempo
Datos de panel /longitudinales
Secuencia de observaciones en diferentes períodos de tiempo de un mismo individuo (Tabla 1.1).
Observaciones repetidas sobre los mismos individuos en diferentes períodos de tiempo (Tabla 1.6): Es una combinación entre datos transversales y series de tiempo.
Si se observan los precios de diferentes hard drives en un determinado período de tiempo (2004): datos transversales.
Si se observa el precio de un hard drive de 200GB durante el período 2003-2007: series de tiempo. 1. 2.
Fuente: Smith, G. (2015). Essential Statistics, Regression, and Econometrics. Pgs. 4 10.
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/d779b58b5c47497ab9b81e71ab1b15e4.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/4df6f6e7115387f5a226e452ef9255e0.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/75b1b6100a0eea0f87385480c697e3da.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/203804abcbd92f43a8954e275d9afa9d.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/d2c020b7e96ea79b0742789a4db243a3.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/203804abcbd92f43a8954e275d9afa9d.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/c9862d239571968100df17067c9bb0d1.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/4df6f6e7115387f5a226e452ef9255e0.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/97bd4e5400b51a15ebbfb528792e7c5e.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/4df6f6e7115387f5a226e452ef9255e0.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/92c81e8d5717bbe9103884674b39989a.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/203804abcbd92f43a8954e275d9afa9d.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/41d074fe8d42ad36eff1ffb39b2e8d0d.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/e1ec01cd0874ab3674c1ab489dac33c6.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/7b95daf7e8b1c1a788c30e866a1a32d7.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Número de hijos de una familia
CUALITATIVA
Tipos de variables
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Discreta
CUANTITATIVA
Continua
Número de libros leídos
Número de hijos de una familia Número de libros leídos Monto de recauda ción tributaria Precipitación anual en Quito
Datos únicamente clasificados
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/10c4767aca7eb18636d59e6c3f3b859e.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Niveles de medición
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6791cf8878840a5bd7c1068b08eaea5a.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/be8b186f6bd9af576eb361243a2dfaa1.jpeg)
Datos ordenados
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/7a85892ece1ad6d64a5a6735c0e45ac5.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6b4f0cd0863fdd06475cb5678c908463.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6b4f0cd0863fdd06475cb5678c908463.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/7a85892ece1ad6d64a5a6735c0e45ac5.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/896e162307c12bb42261241b627f386a.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6b4f0cd0863fdd06475cb5678c908463.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/3d6caaffbc4a10fae324e1429f96a1c4.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6b4f0cd0863fdd06475cb5678c908463.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6b4f0cd0863fdd06475cb5678c908463.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/2dd344250794ee58337b21f66d85b7b2.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6b4f0cd0863fdd06475cb5678c908463.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/2dd344250794ee58337b21f66d85b7b2.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6b4f0cd0863fdd06475cb5678c908463.jpeg)
Punto 0 significativo
Número de pacientes atendidos Marca de automóvil Nivel de instrucción
Técnicas de investigación CUANTITATIVA
Muestreo probabilístico
Encuesta y cuestionario
Escala tipo Likert
Análisis cuantitativo de datos secundarios
Pruebas objetivas
Recopilación de registros administrativos
Revisión de documentos y análisis de contenido de textos, documentos (cuantitativos)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/7c84f49581d2e5dd19072263b10f0b83.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/31eec41d8d26387de7f506a3caaf601d.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6cd17b05b82ad21ffad3d9c5935e01d2.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Técnicas de investigación CUALITATIVA
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/c10de7722281121d2017e48d8a598c42.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/297a74726c28c87f33f5724461d2c3dc.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/297a74726c28c87f33f5724461d2c3dc.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/297a74726c28c87f33f5724461d2c3dc.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/cd2efc2d8e6e22a923189836b00bf117.jpeg)
Revisión
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Utiliza la base de datos de entrenamiento para realizar predicciones
Aprendizaje supervisado
TIPOS DE APRENDIZAJEciencia de datos
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Aprendizaje no supervisado
Clases: clasificación o categorización y regresión
Utiliza inferencias de la base de datos, la misma que no tiene respuestas categorizadas
Clases: clustering y reducción dimensional o asociación
Etiquetado manual, pocos datos etiquetados y mucho no etiquetados
Aprendizaje semi supervisado
Clases: self learning
Aprendizaje por refuerzo
Psicología del comportamiento para la toma de decisiones (recompensas y penalidades)
Clases: Componentes y nexos
Ciencia de datos y algoritmos
AlgoritmoDescripción EjemploClase
Clasificación
Predice si un dato pertenece a una clase predeterminada
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Árbol de decisión, redes neuronales, modelos Bayesianos
Regresión
Predice el valor utilizando datos determinados
Detección de anomalías
Predice si un dato es un dato atípico (outlier) comparando con el resto de datos
Predicción por series de tiempo
Utiliza datos históricos para realizar la predicción en un horizonte de tiempo
Clustering
Identifica clusters naturales en el conjunto de datos utilizando sus propiedades
Regresión lineal, regresión logística
Identificación de un consumidor en un grupo de consumidores conocidos
Distancy based, density based, local outlier factor (LOF)
Autorregresive integrated moving average (ARIMA), regresión
Predicción de la tasa de desempleo para el siguiente año
K means, clustering
Detección de transacciones fraudulentas por medio de tarjeta de crédito
Predicción de ventas
Segmentos de consumidor en base a transacciones, web
Identifica las relaciones utilizando datos de transacción
Análisis de asociación Frontera de producción, algoritmo de crecimiento
Oportunidades de venta cruzada en función del historial de compra (transacciones)
Aprendizaje supervisado vs. Aprendizaje no supervisado
• Datos etiquetados
• Usado para generalizar las relaciones existentes entre las variables de ingreso (input) y variables de salida (output)
• Datos sin etiquetar
• Utilizado para descubrir patrones e información.
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Estrategias de aprendizaje
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Aprendizaje supervisado
Variables de entrada de salida Datos
Clasificación por etiquetas (clases), que son los valores que se desean predecir (resultado).
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Ejemplos de Aprendizaje supervisado
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Fuente: https://sven-mayer.com/pml/
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/4e52a8a0deb886d880659c9e4ae9f3f9.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/01170bb42a036352a6757955bb10da6e.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/a6103d1a401ecdf085ba03ecd65803da.jpeg)
Aprendizaje supervisado – Pasos básicos
04
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/4087f9b2958e647824adf7158771f680.jpeg)
Entrenar el modelo a través de múltiples interacciones de datos de entrenamiento para mejorar la precisión y velocidad de predicción
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/59b9b8daa8218d62372a3ba374829818.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/79377720692332c4dd019ab5656ab949.jpeg)
05
Realizar predicciones y evaluar el modelo
01
Seleccionar el tipo de datos de entrenamiento, determinar la naturaleza de los datos
03
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/4c107c01c6b21ad86f785c97a9ed7e54.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Elegir un modelo utilizando un algoritmo de aprendizaje supervisado: naturaleza clasificación o regresión.
02
Recopilar y limpiar los datos de entrenamiento
Aprendizaje supervisado – Clasificación o categorización
Objetivo: predecir las etiquetas de clase categóricas de nuevos registros, con base a las observaciones pasadas.
Regresión
Proceso estadístico predictivo mediante la relación entre variables dependientes e independientes
• Dependiendo de la etiqueta, la clasificación puede ser binaria (etiqueta discreta, 0 o 1) o multiclase (múltiples categorías).
• Generalmente se utiliza con etiquetas discretas
• Predicción de valor continuo (ventas, precio, calificación)
• Resultado: Ecuación
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Aprendizaje supervisado – Tipos de algoritmos
Línea recta como gráfico de la ecuación, método de Mínimo Cuadrados Ordinarios (MCO), utiliza datos continuos Regresión lineal
Regresión logística
Clasificación binaria, resultado: probabilidad de que pertenezca a una clase, utiliza datos discretos
Combinación de árboles de decisión independientes entre sí para reducir la varianza Random forest Similar al diagrama de flujo, se evalúan valores en cada nodo para llegar a la clasificación final Árbol de decisión (clasificación)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Aprendizaje supervisado – Ejemplos
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6e495e85413f04d8815ebc8edb8a6fcc.jpeg)
Clasificación binaria
Clasificación multiclase:
Regresión logística
Email spam etiquetado con 1, email no spam etiquetado con 0
Detección de la raza de un perro. Predicción altura –peso Regresión lineal
Probabilidad de ser un buen cliente (score de crédito)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Árbol de decisión (clasificación)
Random forest
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/4518a26d74a4d95d5dffdd2f25ac2f12.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/afcccd5107a8f916737223dd8d48063d.jpeg)
Cielo: opción 1 sol, opción 2 nublado, y opción 3 lluvia
Predecir la enfermedad de un paciente tomando en cuenta los síntomas que presenta e historial clínico
Aprendizaje supervisado – Aplicaciones en finanzas, negocios, y economía
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/787de8e3225c8a8bb51fd5190f8400d6.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/d933af910f6f25b20b4c95e9eb3331d8.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6f8cf585c14ab37ece3613b2b6f0f81d.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/d933af910f6f25b20b4c95e9eb3331d8.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/6f8cf585c14ab37ece3613b2b6f0f81d.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/e94552b2a0fe3ebd84abb3f0b21de64d.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/3a84af227b989996f33be706e18fbc6d.jpeg)
Predicción de cotización de acciones en bolsa
Incremento del comercio electrónico a través del estudio de tendencias de consumo
Segmentación de mercados para crear campañas de marketing, cálculo de éxito y fallo de la campaña
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ff8b0ab6b793d2f728482f38c349737a.jpeg)
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Identificación de las fuentes significativas de riesgos en operaciones bancarias
Personalización de las pólizas de seguros dependiendo de los hábitos de los clientes
Detección de fraude
BIBLIOGRAFÍA
Géron, A. (2017). Hands-On Machine Learning with Scikit-Learn & Tensor Flow. Concepts, Tools, and techniques to Build Intelligent Systems. O’Reilly.
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/33ec27081e45c575d743b72073196888.jpeg)
Mayer, S. (s/f). Course: Practical Machine Learning, disponible en: https://svenmayer.com/pml/
Saura, R., Palos-Sanchez, P., & Grilo, A. (2019). Detecting Indicators for Startup
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/ec7452717dbd2f425e8c77608b12befd.jpeg)
Business Success: Sentiment Analysis Using Text Data Mining. Sustainability 11(3), 917, disponible en: https://doi.org/10.3390/su11030917
Smith, G. (2015). Essential Statistics, Regression, and Econometrics. Elsevier.
![](https://assets.isu.pub/document-structure/220926204710-7a1a7a64897710f170b28efcb2aa7e4d/v1/3d4e54818417c369c784c55461f78096.jpeg)