Introducción al Periodismo de Datos
Por Sandra Crucianelli scrucianelli@icfj.org www.facebook.com/sandracrucianelli www.facebook.com/periodismodedatos @spcrucianelli
¿Qué hay de nuevo?
Muckrakers Â
Jacob Riis: La estadística asociada a la imagen como elementos de denuncia
¿Cómo vive la otra mitad?
Un libro clave
Philip Meyer Exploró las causas de los disturbios raciales en la década de 1960 http://www.sampler.isr.umich.edu/2011/featured/revealing-‐the-‐ roots-‐of-‐a-‐riot/
Investigación Social aplicada a la Investigación Periodística n Investigación Cualitativa: I. II. III.
Estudio de Casos Grupos Focales Análisis del Discurso
n Investigación Cuantitativa I. II.
Investigación Descriptiva (censo) Investigación Inferencial (encuestas)
Encuentre la diferencia n
Periodismo de Investigación: Sobre la base de la iniciativa del reportero, se descubre una verdad social importante que alguien intenta mantener en secreto
n
Periodismo de Precisión: Indagar por iniciativa propia, un conjunto de datos difíciles de obtener y más complejos de verificar o interpretar, con los que se pone en evidencia una realidad oculta que no se quería revelar.
Periodismo Asistido por Computadora n PAC: introduce el uso de hojas de
cálculo, como herramienta para procesar datos
I. II. III.
IV.
Clarence Jones (Miami Herald) , 1969, buscó patrones en el sistema de justicia penal. David Burnham (The New York Times), 1972, expuso discrepancias en las tasas de delitos denunciados por la policía Elliot Jaspin (The Providence Journal), 1986, usó bases de datos para denunciar malos historiales de conducción y antecedentes penales de choferes de transporte escolar Bill Dedman (The Atlanta Journal-‐Constitution), Pulitzer 1988, “El color del dinero”: abordó el tema de la discriminación racial en la otorgación de préstamos hipotecarios
América Latina
¿Periodismo de Datos? Todo el periodismo se hace a partir de datos: Cierto n Cualquier cosa que se diga del Periodismo de Datos hoy, no es definitiva ¿Qué hay de nuevo? n Casi todo se expresa con números n En el mundo digital, tenemos capacidad para acceder a grandes cantidades de datos n En el proceso, los datos no se transforman; la única transformación que hay es desde lo abstracto hacia lo tangible n Visión Científica: el periodista de datos reporta sus métodos, de modo que otros podrían replicar el proceso y llegar a la misma conclusión n
Del PAC al PAH Periodismo asistido por Hackers
Grandes conjuntos de datos: Big Data n n n n
Búsqueda de Datos Extracción de Datos Procesamiento de Datos Visualización de Datos El programador se incorpora al equipo periodístico
Periodismo de Datos
Manual Colaborativo (traducción al español)
http://interactivos.lanacion.com.ar/ manual-‐data/
1) Salarios de 667.000 empleados públicos 2) Crearon una aplicación incorporando un buscador de sueldos por nombre, oficina gubernamental, año, categoría. 3) Socializaron la información http://www.texastribune.org/library/data/government-‐employee-‐salaries/
¿No tenemos ningún dato? n n n n n n n n
¿Realizó el diagnóstico? Búsqueda avanzada Búsquedas reversas Por defecto, restringiendo dominio, formatos y/o fechas Búsquedas geolocalizadas Lectura de URLs y recorte de dominio Bases de Datos interactivas Monitoreo de redes sociales
http://www.google.com.ar/advanced_search • Explorar la Web Profunda • Usar el Académico • Buscar en Grupos, Libros e Imágenes
http://datos.bancomundial.org/
Herramientas Analíticas (software de descarga gratuita) 1. Análisis económico 2. Medidas de Pobreza 3. Cruce de variables para Pobreza 4. Mapeo de pobreza
Monitoreo en redes sociales: ¿de qué habla la gente? www.socialmention.com www.48ers.com www.twitterfall.com
Pro Pública: Datos cualitativos se “cuantifican” -‐ Vecinos expresaron curiosidad, vía Twitter, por recibir mails de campaña
de Obama, pidiendo distintos montos en donación y los hicieron públicos -‐ En 190 mensajes, encontraron 6 variaciones del contenido -‐ http://www.propublica.org/article/reverse-‐engineering-‐obamas-‐message-‐machine
Ver no es lo mismo que acceder Formatos deberían ser reutilizables ¿Cómo extraer datos cuando no están accesibles?
Un PDF de un JPEG Datos de campañas publicidad oficial En el sitio de la Jefatura de Gabinete de Ministros http://www.jgm.gov.ar/paginas.dhtml?pagina=196
Scraping de Datos Programas informáticos o técnicas de programación cuya finalidad es la de extraer datos (“raspar”) para: 1. Obtener datos estructurados (De PDF a Excel) 2. Leer datos de imágenes fotográficas para convertirlos en textos o tablas (OCR: Reconocimiento Óptico de Caracteres) Secuencia: I. Recoger (Ruby: lenguaje de programación) II. Procesar (Google Refine: para limpiar y organizar los datos) III. Almacenar (Panda Project: repositorio para compartir bases de datos)
Minería de Datos: detecta patrones sobre un gran conjunto de datos
Proceso n n n n n
n
Búsqueda de relaciones entre variables cualitativas Búsqueda de relaciones entre valores, dentro de una base de datos Establece relaciones de jerarquía entre los datos Calcula proporciones (3 de cada 10) Calcula frecuencias (veces que un mismo dato se repite o combinaciones de datos que se repiten) Datos abstractos Datos inteligentes
Caso Diario La Nación (Argentina) http://www.transporte.gov.ar/content/subsidios-‐sistau/ 13 meses de trabajo, 285.000 documentos: estudio de la progresión en los pagos Finalista Data Journalism Award 2012 http://blogs.lanacion.com.ar/projects/data/subsidies-‐for-‐the-‐bus-‐transportation-‐system-‐datajournalism-‐project-‐in-‐argentina-‐la-‐ nacion/
Aplicaciones Sociales Where does my money go?
¿A dónde van mis impuestos?
Iniciativas en Argentina n www.gastopublicobahiense.org n www.mapa76.info n www.quepasariachuelo.org.ar n http://www.malvinastreinta.com.ar/
Muchas Gracias…
scrucianelli@icfj.org
www.facebook.com/sandracrucianelli www.facebook.com/periodismodedatos @spcrucianelli