ÁREA DE TECNOLOGÍAS DE LA INFORMACIÓN PROGRAMA ACADÉMICO DE INFRAESTRUCTURA DE REDES DIGITALES MATERIA: INTRODUCCIÓN A BIG DATA PROFESOR(A): MIGUEL VICENTE MATA SANTOS TÍTULO: DATA SCIENCE ALUMNO(A): FÁTIMA ABIGAIL PORRAS NORIEGA GRUPO: IRD501 LEÓN, GUANAJUATO. 01 DE ABRIL DE 2020
INTRODUCCIÓN AL TEMA En la siguiente presentación, se explicará lo que es el data science o ciencia de datos, cuáles son los campos de trabajo de comprende, además de cuáles son algunas de las
aplicaciones que se le dan en la actualidad. Será importante también, mencionar cuáles son los procesos que se deben llevar a cabo para sacar valor a los datos y cuáles son las prácticas más habituales. También se explicará en qué sectores y cómo ayuda la ciencia de datos, además de cuál es la función y características de un data scientist. Todo esto, para poder comprender de manera muy completa el tema tan interesante que es el big data en la actualidad.
¿QUÉ ES EL DATA SCIENCE? ES
EL
ESTUDIO
DE
Obtener información (para toma de decisiones).
LOS
Predicciones de sucesos
DATOS DISPONIBLES EN LAS ORGANIZACIONES PARA:
Un
ejemplo
podría
Recomendaciones
ser
NETFLIX,
almacena y recoge información para
recomendaciones
en
función
de
El data science es un campo que, para analizar grandes volúmenes de datos, variedad de ecuaciones, modelos y algoritmos de estimación y predicción, comprende: Estadística (interpretación en números y datos)
gustos, opiniones o necesidades y
analiza patrones de consumo para
Data Minining (herramientas de extracción de patrones)
decidir qué series o películas producir con base en los intereses del usuario.
Conocimiento del área de trabajo
El data science requiere un científico de datos, además de ordenadores, para realizar los análisis de datos. Y utiliza lenguajes de programación como R o Python. A partir de este análisis
de datos, se pueden proporcionar los INSIGHTS.
¿QUÉ SON LOS INSIGHTS? Son los resultados generales de un análisis de datos que ayudan a las empresas en: Una mejor toma de decisiones, tanto de negocio como de estrategia. TEXTO PREDICTIVO
Una producción de modelos de machine learning para realizar tareas.
Algunos ejemplos podrían ser los siguientes:
RECOMENDACIÓN DE RUTAS
¿QUIÉNES APROVECHAN EL DATA SCIENCE? La base para el data science, son los datos, pero actualmente su aprovechamiento no está limitado a ninguna industria o sector, sino que puede aplicarse en casi todas las industrias. Por ejemplo, en:
ACTUARÍA: Pueden utilizarla para predecir siniestros o determinar precios.
MONITORIZACIÓN DE DEPORTISTAS: La utilizan para mejorar el rendimiento físico.
TELEVISIÓN Y AUDIENCIA: Pueden optimizar el precio de los anuncios, horas eficientes para transmitir contenido.
ANÁLISIS DEPORTIVOS: Pueden predecir futuros estilos de juego y de entrenamientos.
EPIDEMIOLOGÍA: Puede utilizarse para predecir causas o curas de enfermedades o expansión de éstas.
METEOROLOGÍA: Puede utilizarse para predecir desastres naturales o lo más común, el tipo de clima.
En todas estas profesiones, se tiene en común la analítica de datos y la ciencia de datos puede
ser útil para la resolución de problemas, la toma de decisiones y la prevención de eventos e incluso a la ayuda de mejora de procesos.
Algunas marcas reconocidas que utilizan la ciencia de datos son:
¿Y QUÉ ES UN DATA SCIENTIST? Es un experto en Data Science, su trabajo consiste en extraer conocimiento a partir de los
datos para poder responder a las preguntas que se le formulan.
CUALIDADES NECESARIAS: Para ser un data scientist se debe tener actitud y ganas de aprender, además de no tener miedo a lo desconocido. Sin embargo, las principales cualidades son: 1. 2. 3. 4.
Obsesión por la calidad del dato Ser curioso Entender el negocio Saber cuándo parar
¿QUÉ PROCESO SIGUE UN DATA SCIENTIST? El proceso que sigue un Data Scientist para responder a las cuestiones que se le plantean se pueden resumir en estos 5 pasos: PASO 1: Extraer los datos, independientemente de su fuente (webs, blogs, apis, etc.) y de su volumen (Big Data o Small Data). PASO 2: Limpiar los datos, para eliminar lo que distorsiona las mismas. PASO 3: Procesar los datos usando diferentes métodos estadísticos (inferencia estadística, modelos de regresión, pruebas de hipótesis, etc.) PASO 4: Diseñar nuevos tests o experimentos en caso necesario.
PASO 5: Visualizar y presentar gráficamente los datos.
¿QUÉ HACE IMPORTANTE A LA CIENCIA DE DATOS? En la actualidad, las empresas están almacenando cada vez más cantidad de datos debido a la tecnología
moderna, lo cual les puede generar grandes beneficios ya que, al saberlos interpretar, son una gran de entrada de más usuarios, de ganancias económicas o también de prestigio. Y con base en encuestas realizadas, se puede saber que la ciencia de datos de big data es casi la tecnología que más se ha adoptado en diferentes países.
ADOPCIÓN DE TECNOLOGÍAS NUEVAS EN LA INDUSTRIA 60 50 40 30 20 10 0 CHILE
MÉXICO
BOLIVIA
PERÚ
DATA SCIENCE
IOT
COLOMBIA
BRASIL
ARGENTINA
CLOUD
También es importante ya que se cree que revoluciona la industria de 5 maneras: GENERANDO CONOCIMIENTOS; ANALIZANDO CONTENIDOS; MEJORANDO LA COMPETITIVIDAD; ANALIZANDO RIESGOS; CREANDO ECONOMÍAS DIGITALES.
CONCLUSIÓN La ciencia de datos es un tema de gran importancia en la actualidad, no sólo para nosotros
en el campo de la informática, sino en todos los sectores, porque como ya vimos, esta ciencia ayuda a mejorar los procesos ya sea de análisis, de ventas, de predicción, etc. Que
resultan ser totalmente beneficiosos para la industria. El hecho de que actualmente estemos generando tanta información para las empresas, hace que esta ciencia y sus expertos
como los data scientist, se abran muchas posibilidades de trabajo. Sin duda, la ciencia de datos no se puede negar y considero que, en los próximos años, estaremos viendo un
incremento muy grande de las empresas que decidan adoptar este tipo de tecnología.