PA S O S PA R A A P L I C A R
BIG DATA EN
EDUCACiON
INDICE 3
B I G D ATA
4
E D D ATA
10
I N I C I AT I VA S
7
QUIEN lO USA?
8
PA S O A PA S O
20
SEGURIDAD
21
CONCLUSIONES www.zoem.com.ar
2
BIG DATA La cantidad de información que se genera en la
técnicas para capitalizar la información masiva
actualidad en variedad, volumen y velocidad es
registrada en las bases de datos, procesarla y
impresionante. Esta alza tremenda en los registros
generar puntos de vista (insights) que ayuden a
de datos que hacen las organizaciones y las
tomar mejores decisiones.
empresas se da básicamente por los nuevos sistemas informáticos, los reducidos costos de
Al fin de cuentas no es más que procesar
almacenamiento y por la democratización de los
información, pero si se hace de forma adecuada y
dispositivos como los smartphones que pueden
además se aplican metodologías como la inteligencia
registrar datos por acción de los usuarios o
artificial o la minería de datos, big data presenta una
automáticamente por medio de sensores. Lo que
gran
sobra son los datos y lo que escasea es el
educativas.
oportunidad
para
generar
innovaciones
conocimiento sobre cómo generar valor sobre esos
datos para facilitar la toma de decisiones. Big data o en su mayor medida la ciencia de datos, propone
www.zoem.com.ar
3
ED DATA Los datos generados en educación son diversos y
internas o externas a la institución educativa. Las
provienen desde distintas fuentes. A pesar de que
internas pertenecen a sistemas formales y las
podría sacarle mayor provecho, el sistema educativo
externas que pueden ser sistemas informales
en su gran mayoría es arcaico a la hora de
creados por alumnos y/o las familias, educadores o
apropiarse de datos (propios o publicados) para
inclusive
mejorar
generados por los gobiernos o publicados en
la
calidad
educativa,
la
atención
a
estudiantes, docentes o la mejora de la gestión
“un
poco”
más
formales
como
los
repositorios públicos especiales.
institucional en general. La segunda parte de la ciencia de datos es la
Para comenzar un proyecto de ciencia de datos en
limpieza de esos datos y la puesta a punto para
educación hay que definir un problema a resolver o
unificar toda fuente en una única base de datos que
hipótesis que se necesite probar. A partir de allí el
de paso a la tercera parte en la cual se realiza la
proceso de la ciencia de datos consta de 3 grandes
analítica o se inyectan algoritmos especiales (minería
partes. La primera tiene que ver con la búsqueda de
de datos, inteligencia artificial) para descubrir-
las fuentes de datos. Estas fuentes pueden ser www.zoem.com.ar
4
ED DATA tendencias invisibles al ojo humano. Todo esto confluye en gráficos, reportes o declaraciones que permitan a las personas o en su defecto a máquinas o algoritmos, comprender qué decisiones son las
que hay que tomar para resolver un problema.
1 Definición del problema Búsqueda de fuentes de datos
2 Limpieza de datos
www.zoem.com.ar
3 Procesamiento y extracción de puntos de vista 5
INICIATIVAS ¿Qué se puede hacer con big data?: SEGUIMIENTO DE NECESIDADES DE ALUMNOS/EDUCADORES/INSTITUCION S I S T E M A S D E A L E R TA S T E M P R A M A S S I S T E M A S A D A P TAT I V O S RENDIMIENTO AS I G N ACI O N D E R ECU RSOS COM PRAS I NTELI GENTES
L O G I S T I C A E F E C T I VA LECTURA DE CONTEXTO – ANALISIS DE OPINION P R O S P E C T I VA … M AS…
www.zoem.com.ar
6
QUIEN LO USA Si bien el big data puede ser de gran ayuda para la
Los educadores lo usan como un medio para
dirección de una institución educativa en realidad
comprender mejor al estudiantes, sus hábitos, sus
todos los actores educativos pueden beneficiarse de
dificultades, sus fortalezas e incorporar todo este
su uso.
conocimiento a la práctica en el día a día. Además
sirve como un medio para acceder a métricas La dirección para tomar decisiones sobre las
cuantificables sobre el desempeño en clase y crear. A
políticas
partir de ello, nuevas oportunidades de mejora.
institucionales,
la
efectividad
de
las
iniciativas o para buscar nuevas oportunidades para la mejora de la calidad educativa. Retención de
estudiantes, logística, compra de insumos inteligente o simplemente para cambiar cosas imperceptibles que mejoran mucho el servicio al alumno y
educador.
Además puede ser utilizado para
Aplicar big data en educación no es tan complicado y puede hacerlo cualquier actor educativo.
comprender y mejorar los sistemas de comunicación y posicionamiento de la institución. www.zoem.com.ar
7
PASO A PASO
8
1 PARTE 9
1PARTE El primer paso en un proyecto de big data es definir
trayectos por tiempo a través de los años. Estas
muy bien cuál es la problemática a investigar. La
bases contienen además la información de los
definición
educadores asignados a cada comisión, encuestas a
adecuada
del
problema
es lo
que
permitirá transitar todo el proyecto, y en el mejor de
los
casos,
encontrar
las
causas
para
los estudiantes y mucha información valiosa.
tomar
decisiones que lo resuelvan.
Bases de datos e-learning: Aquellas que derivan de los sistemas de aprendizaje en línea y que
Para comprender cómo los datos masivos pueden
contienen datos sobre el comportamiento de los
ayudar a una institución educativa primero hay que
estudiantes a la hora de estudiar y realizar tareas.
identificar las fuentes o las bases de datos que
Aquí también hay información interesante sobre los
contienen esa información en potencia.
momentos de estudios, la cantidad de tiempo destinado a actividades, navegación, las evaluaciones
Bases de datos académicas: Aquellas que
online, etc.
contienen el historial académico del estudiante. Exámenes,
notas,
recuperatorios,
asistencias, www.zoem.com.ar
10
1PARTE Bases de datos Social Learning Places(SLP): Los SLP son espacios presenciales donde se utiliza la tecnología para acelerar los procesos de aprendizaje. Si bien los encuentros son presenciales, existe
registro de información de las interacciones que ocurren en los sistemas que los soportan.
relevante para educadores, alumnos y directivos está fuera de este ámbito.
Iniciativas gubernamentales: organismos
internacionales
Los gobiernos u
miden
cada
cierto
tiempo los niveles académicos de los estudiantes de distintas regiones. Esta información es pública y
Bases de datos informales: Existe información sobre múltiples dimensiones de la educación en
bases de datos que están fuera de una institución. Los blogs, las redes sociales y cualquier otro tipo de sitio web creado por profesores, familiares y/o
alumnos aportan datos muy importantes para tomar decisiones en el ámbito educativo. No todo pasa por sistemas formales, mucha de la información más
puede ser accedida por las instituciones educativas para adquirir conocimiento valioso. Esto en cuanto se analice desde el punto de vista propio y se
realicen comparaciones lógicas que tengan sentido y no generalistas como se suelen hacer. El cruce de información
de
este
tipo
con
información
institucional interna es fundamental para bajar a tierra estrategias que sean pertinentes a cada
establecimiento.
www.zoem.com.ar
11
1PARTE Open data:
El concepto datos abiertos (open
data, en inglés) es una filosofía y práctica que persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, de patentes o de otros mecanismos de control. Tiene una ética similar a otros movimientos y comunidades abiertos, como el software libre, el código abierto (open source, en inglés) y el acceso libre (open access, en inglés).
que a simple vista no parezcan que tienen relación con educación, pero ante el análisis de un experto hacen mucho sentido. Por ejemplo, la seguridad, la accesibilidad, el nivel de pobreza de una zona
cercana a un colegio puede afectar el desempeño académico de los estudiantes o inclusive a los mismos educadores. Los open data son una fuente infinita de datos del cual se pueden encontrar causas muy profundas a ciertas problemáticas educativas.
Existen múltiples repositorios en internet que contienen información valiosa sobre educación, que si bien puede que no pertenezcan a mi institución educativa, sirven para tomar conciencia de realidad que pueden afectar. Los repositorios de open data
también pueden proporcionar otros tipos de datos www.zoem.com.ar
12
2 PARTE 13
2PARTE Una vez obtenidos los datos que servirán como
Por último y no por eso menos importante, se deben
materia prima para buscar puntos de vista que
limpiar todos los datos que estén mal registrados
permitan tomar decisiones ante una problemática
para que, al momento del procesamiento, no
definida, el siguiente paso es la limpieza de esos y la
produzcan análisis erróneos.
carga en los sistemas informáticos adecuados para
La segunda parte del proceso de big data es una
su procesamiento.
tarea ardua que lleva mucho tiempo y que se debe
Los datos provenientes de las diferentes fuentes
realizar muy detalladamente dada su importancia en
pueden estar almacenados en una diversidad de
la tercera parte, donde se analiza la información y se
formas y sistemas muy grandes y complejos. Desde
extrae el conocimiento.
un simple MS Excel hasta una base de datos de última generación. La conexión y extracción de esos datos será la segunda parte del proceso de big data.
Si los datos provienen de diferentes fuentes, se deben realizar los procesos de unificación necesarios para unir y dar sentido a la información dispersa. www.zoem.com.ar
14
2PARTE Hardware En un proyecto de big data existen limitantes relacionados al hardware, es decir al equipo que procesará los datos. Los límites están determinados por un gran número de factores, que incluyen los siguientes:
o un servicio en la nube (aplicaciones que funcionan
Recursos de hardware como RAM, CPU y espacio en disco.
data educativo es la selección de la o las aplicaciones
•
El tipo de fuente de datos (Bases de datos)
dependerá del tamaño de la base de datos porque
•
Rendimiento y capacidad de uso percibidos.
esto repercutirá en la arquitectura que se use para el
•
en la web) Aplicaciones
Un punto muy importante en un proyecto de big para procesar los datos. La elección de la aplicación
procesamiento de la información. A grande rasgos En general tomaremos como límite el millón de
podríamos decir que si la base de datos contiene
registros o filas en la base de datos para procesar
menos de un millón de registros o filas se usan
con una computadora casera (la que usamos
sistemas analíticos OLAP y si la cantidad de registros
comúnmente). Si la cantidad de datos supera ese
superan
número se deberá trabajar con un hardware especial
arquitecturas big data o cloud.
www.zoem.com.ar
esa
cifra
se
deberá
trabajar
con
15
2PARTE Aplicaciones segĂşn la necesidad de procesamiento:
1M Muchas aplicaciones son gratuitas o tienen licencias gratuitas para educadores o instituciones educativas
www.zoem.com.ar
16
3 PARTE 17
3PARTE En la tercera parte de un proyecto de big data se
necesario
analizan los datos y la información y se extrae el
convertirlos en conocimiento relevante para tomar
conocimiento
se
decisiones. La información en crudo tiene sólo un
materializa a partir de gráficos analíticos. La analítica
valor potencial, es su análisis y sistematización lo que
de datos y sus herramientas deben permitir a los
incrementa
usuarios analizar los datos masivos de forma rápida
instituciones educativas.
para
tomar
decisiones.
Esto
saber
la
organizarlos,
capacidad
de
refinarlos
innovar
en
y
las
y eficiente. Los usuarios deben ser capaces de explorar y visualizar datos mediante gráficos e infografías, cuadros de mandos, tableros de control y
visualizaciones de informes de resultados cuando sea necesario. En el entorno Big Data no basta con capturar y
almacenar
grandes
volúmenes
de
datos,
es
www.zoem.com.ar
18
3PARTE Además de la analítica de datos se pueden aplicar
automáticamente
técnicas como la minería de datos a los registros de
alumnos con alto y bajo desempeño académico. En
la base de datos. La minería de datos consiste en
este caso las dimensiones como la asistencia a clase,
aplicar algoritmos predefinidos a los datos para que
la notas de las evaluaciones en las distintas materias,
automáticamente
tendencias,
la constitución familiar y muchas otras pueden
comportamiento, patrones, agrupaciones , etc. Sin la
develar puntos de vista que una persona no podría
necesidad de que una persona lo haga o en muchos
ver en el análisis.
detecten
características
comunes
a
casos cuando la tarea resultaría imposible. Para realizar la minería hay que tener conocimiento básico sobre lo que hace cada algoritmo y luego formatear los datos de una manera específica para que el algoritmo lo entienda.
Un ejemplo de aplicación de minería de datos en el ámbito de la educación es cuando se buscan
www.zoem.com.ar
19
SEGURIDAD Muchas instituciones educativas no están realizando
mejora.
big data por el tema de la seguridad y la
Por otro lado, si los datos se los busca en bases de
confidencialidad de los datos. Se teme que puedan
datos externas, como por ejemplo una iniciativa que
existir
explora comentarios sobre la institución en las redes
problemas
de
filtraciones,
quejas
o
acusaciones de persecución.
sociales para realizar acciones de marketing, el
Todo proyecto de big data interno a una institución
problema de la confidencialidad no es tan sensible y
educativa debe tener en cuenta la seguridad de los
se puede trabajar con mayor libertad.
datos para que no existan filtraciones y asegurar el anonimato
de
los
datos.
Para
lograr
la
confidencialidad es necesario establecer políticas de ofuscación (esconder) de los datos personales. De esta forma se protege la identidad a los alumnos y
profesores pero se permite ejecutar la analítica con conclusiones generales y también particulares que expongan problemas,
acciones correctivas y de www.zoem.com.ar
20
CONCLUSION Big data es una realidad que la mayoría de la
se puede aprender a usarlos.
organizaciones del mundo están adoptando para mejorar el desempeño y la calidad. En educación es muy incipiente pero en un futuro cercano será
indispensable su utilización en todo nivel y para todos los actores educativos. Por otro lado, por más que parezca una tecnología que sólo la maneja un grupo selecto de técnicos, en realidad cualquier persona puede hacer análisis big data con una computadora
personal.
Hoy
en
día
existen
aplicaciones de big data que son gratuitas o que facilitan licencias para educadores e instituciones
educativas. La mayoría de las aplicaciones tienen una gran cantidad de tutoriales en la web de donde
www.zoem.com.ar
21
2018 Licencia CC