CURSO R PARA DATA SCIENCE E INTRODUCCIÓN A
MACHINE LEARNING: APLICADO A LA INVESTIGACIÓN ESCUELA DE POSGRADO
DEMUESTRALE AL MUNDO QUE ESTÁS PREPARADO... Mg. Ing. Candy Ocaña Zúñiga Directora de la Escuela de Posgrado de la UNJ 942 909 360
/ @unjperu www.unj.edu.pe
¡BIENVENIDO! El crecimiento y la demanda del lenguaje de programación estadístico R demuestra la importancia que los data scientist, administraciones, empresas y organizaciones más prestigiosas del mundo están otorgando al análisis de datos y al análisis predictivo, puesto que posteriormente se convertirán en información de valor.
POTENCIA TUS
HABILIDADES, MEJORA TU
PRODUCTIVIDAD
R es el software de referencia en la estadística, una de las herramientas más potentes y eficientes, además, es un software OPEN SOURCE, es decir que no usa encriptación (código abierto), por ello, no tiene coste de adquisición y además está disponible para todos los sistemas operativos, es un software estable, confiable, flexible y a la vanguardia. Las posibilidades que ofrece este software son muy potentes, puesto que es capaz de conectarse a cualquiera de las bases de datos más utilizadas. R es un lenguaje de programación y un entorno descriptivo con una amplia gama de técnicas y herramientas estadísticas clásicas y avanzadas para el análisis y la representación gráfica de alta calidad de datos cuantitativos exportables en diversos formatos que permiten comprender mejor la información de la que disponemos y realizar estimaciones con información útil. En este contexto, la Escuela de Posgrado de la Universidad Nacional de Jaén presenta el curso “R para Data Science e introducción a Machine Learning: aplicado a la investigación”, el cual permitirá a los participantes con o sin experiencia en lenguaje R, mejorar sus conocimientos de forma significativa hasta llegar a un nivel intermedio para el análisis de datos estadísticos, el procesamiento para Data Science, Machine Learning, y visualización datos. Todo abordado desde una perspectiva integral, multidisciplinaria e interdisciplinaria.
NUESTROS
OBJETIVOS Programar en R mediante la herramienta Rstudio. Usar los algoritmos de Data Science y Machine Learning con R. Crear visualizaciones bรกsicas y avanzadas de datos con R. Elaborar informes u lizando el paquete Rmarkdown para formato HTML, powerpoint, word y PDF.
COMPETENCIAS
INICIO FEBRERO 2021
Conocimiento para adquirir, manejar y visualizar datos usando R. Uso de algoritmos de Data Science y Machine Learning con R. Conocimiento en la creaciรณn de reportes visuales con RMarkdown.
Programación básica y avanzada en R - Programación básica en R: estadística descriptiva, operaciones lógicas, sentencias condicionales if else, bucle while y bucle for y ejercicios de programación básica. - Programación avanzada en R: funciones predefinidas, aplicación de funciones sobre un vector o una lista, funciones anónimas, funciones matemáticas, expresiones regulares, manipulación de la fecha y hora, manipulación de datos con dplyr y ejercicios de programación avanzada.
Visualización de datos - Visualización de datos con gráficos básicos. - Visualización de datos con ggplot 2. - Gráficos avanzados. - Ejercicios de gráficos básicos y avanzados.
SECCIÓN 2
- Bienvenido al curso. - Instalación de R y RStudio – entorno de trabajo de Rstudio. - Instalación y activación de paquetes en Rstudio. - Configuración del directorio de trabajo. - Uso de comandos de ayuda, y del directorio. - Diseño de la estructura de trabajo.
SECCIÓN 4
Introducción a R
SECCIÓN 6
SECCIÓN 5
SECCIÓN 3
SECCIÓN 1
PLAN DE ESTUDIO Datos - operaciones en R - Tipos de datos básicos. - Estructura de datos. - Operaciones básicas con R. - Estructura de control. - Lectura y escritura (guardar) de datos. -- Ejercicios de estructura de datos.
Preprocesamiento de datos - Valores perdidos y filas duplicadas. - Algunas técnicas de reemplazo de valores perdidos. - Detección de outliers. - Reescalando los valores. - Categorización de información numérica. - Creación de tablas de frecuencia. - Filtros en lenguaje R. - Normalizando o estandarizando datos de un dataframe. - Corrección de datos - Ejercicios de procesamiento de datos.
Creación y reportes visuales - Creación de reportes en HTML. - Creación de reportes con formato Word. - Creación de reportes en forma de presentación en Powerpoint. - Ejercicios de crear reportes en R.
NUESTRO DOCENTE William Watler Reyes
Sergio Velasquez Mazariegos
Especialista en Cuencas Hidrográficas, Suelos, RiesgoVulnerabilidad, SIG-aplicado a R y Python.
Especialista en SIG y R, Hidrología, Manejo de Cuencas, Riesgo a Desastres
Profesor tular de Edafología, Estadís ca, SIG en la Universidad de las Regiones Autónomas de la Costa Caribe Nicaragüense (URACCAN) y de la Bluefields India and Caribbean University (BICU-CIUM).
Profesor auxiliar en la Facultad de Agronomía (FAUSAC) de la Universidad de San Carlos de Guatemala. Profesor tular de la FAUSAC. Funcionario del CATIE (Misión Internacional) en el Unidad de Cuencas Hidrográficas del CATIE. Elaboración y ejecución de proyectos del BID, Banco Mundial, USAID, PNUD, entre otros. Docente e Inves gador de la Escuela de Posgrado del CATIE. Consultor Internacional del BID; PNUD, CATIE, USAID, entre otros. Del 1992 a la fecha, profesor de cursos de capacitación en el CATIE. Coordinador y profesor del diplomado de SIG aplicado al Manejo de Recursos Naturales.
Funcionario del CATIE en la Unidad de Ges ón y Oportunidades (UGO) con funciones en elaboración de propuestas de proyectos al BID, Banco Mundial, FIDA, AECID, Unión Europea, USAID, PNUD, entre otros. Docente inves gador de la Unidad de Cuencas Resiliencias, Seguridad Hídrica y Suelos de CATIE. Director de la Maestría en Ges ón para la Reducción del Riesgo y Prevención de Desastres de la Universidad Central (UC) de Costa Rica.
ESCUELA DE POSGRADO Mg. Ing. Candy Ocaña Zúñiga Directora de la Escuela de Posgrado de la UNJ 942 909 360 / posgrado@unj.edu.pe
www.unj.edu.pe
/ @unjperu