Gobierno Abierto Docente: MarĂa Celeste Gigli Box ( mcgb_br@yahoo.com.br | @CelGBox)
Segunda clase Parte 1) Datos abiertos: ¿Qué es la OGD?. Opendata y transparencia. Opendata y RISP. Qué datos pueden ser abiertos. Niveles (W3C). Parte 2) Plan de datos abiertos: Madurez. PDA. Metodologías: equipo y perfiles. Clasificación, análisis y priorización de la información. Metadatos. Bibliografía obligatoria: ● AGESIC (2012): Guía básica para la apertura y reutilización de datos: Montevideo (disponible aquí) ● Gobierno en Línea (2012): Guía para la apertura de datos en Colombia, Programa Gobierno en Línea: Bogotá (disponible aquí) ● Poggi, Eduardo (s/d): Introducción a la publicación de datos (aquí); Implementando la publicación de datos. Análisis de caso (aquí); Implementando el consumo de datos (aquí)
¿Qué son datos abiertos? Son los datos primarios (sin procesar), en formato estándar, estructurados e interoperables con acceso libre e irrestricto y pasibles de reutilizarse. Bajo custodia de las entidades públicas, su reutilización por parte de terceros permite la creación de servicios derivados. ¿Cómo entendemos lo abierto? Desde tres perspectivas distintas: 1. Desde la disponibilidad y el acceso: disponibles en la Red y sin costo de acceso 2. Desde la reutilización y redistribución: provistos para reutilización, redistribución, y reintegración con otros datos (estructurados en formato estándar, en bruto) 3. Desde la participación universal: toda persona deben poder usarlos, reusarlos y redistribuirlos.
¿Cuáles datos pueden ser abiertos? Cualquier dato puede ser abierto (CEPAL, 2012). Nos interesamos por los gubernamentales (Open Government Data), pero las sociedades deben avanzar a abrir datos de empresas, activistas e instituciones de enseñanza e investigación. Si todo dato producido por las AAPP es un dato público, puede ponerse a disposición del público por gobiernos, administraciones y entidades públicas en el desarrollo de sus funciones.
O aquí
O aquí
Financiados y recopilados con dinero público, contienen información pública, por lo que deben estar a disposición de cualquier ciudadano para cualquier fin, sujetos a requerimiento de atribución y compartirse de la misma manera. El foco se pone en información no personal, pero aún así los datos pueden tener limitaciones (derechos fundamentales, derechos de privacidad y razones de seguridad nacional). No resultan efectivas las limitaciones para el uso comercial de los datos o restricciones para ciertos propósitos (por ejemplo, restringir el uso de datos sólo para educación).
¿Qué es open data? ¿y la RISP? Es un movimiento que busca poner a disposición los datos que gestiona la AAPP en formatos fáciles de manipular, para favorecer: La apertura de los gobiernos: si un ciudadano puede analizar, reutilizar y redistribuir información, se concreta la apertura del gobierno a través del uso del activo estratégico (los datos). La generación de servicios: si una empresas puede acceder a datos podrá monetizar a partir de esos activos desarrollando servicios o mejorando los que ya brinde. RISP significa Reutilización de la Información del Sector Público y también busca poner a disposición de la sociedad datos crudos de la AAPP. Pero los datos abiertos persiguen ofrecer formatos libres y gratuitos. Y la RISP prevé la posibilidad del pago por el uso de datos y su publicación en formatos propietarios.
El comienzo En diciembre de 2007, en California, 30 activistas del open government se juntaron a desarrollar ‘Los ocho principios de los datos abiertos’, mostrando por qué resulta central para la democracia, el activismo cívico, el bienestar público y el uso eficiente de los recursos públicos para generar gobiernos más efectivos y transparentes. Esta declaración señala que un dato es información electrónica (alojada o grabada), como pueden ser documentos, bases de datos, transcripciones de audio, grabaciones audiovisuales. La información no electrónica -en soporte físico- no está alcanzada por esta declaración, pero esa información se ha ido haciendo disponible también de manera electrónica por lo que queda dentro de su esfera.
Para ser abierto, un dato debe ser: Públicos: se abren datos no privados, o que vulneren la seguridad nacional, derechos de autor o privilegio previo. Primarios. Recolectados en la fuente de origen (sin modificación o agregado), con el mayor nivel de detalle (‘granularidad’). Automatizados. Mínima estructuración para garantizar la reutilización automática. Actualizados. Publicados oportunamente para mantener valor y pertinencia. Accesibles. Sin restricción para el uso o propósito (“el mayor rango de usuarios para el mayor rango de propósitos”).
No discriminatorios. Los datos estarán disponibles para cualquier persona, sin necesidad de acreditar condición personal alguna para su acceso. No propietarios. Disponibles en formato abierto, sin derechos que restrinjan su uso. Licencias libres. Los datos no deben estar condicionados por derecho, patente, marca o regulación de secrecía. Sólo se permiten las restricciones del ítem ‘público’. Esta declaración no establece qué datos deberían ser públicos y abiertos, dado que la privacidad, seguridad y otras restricciones pueden ser legal y legítimamente aceptables. Estos principios especifican las condiciones que los datos deberían cumplir para ser abiertos.
La intensidad de la apertura En 2010, Tim Berners-Lee estableció una clasificación quíntuple para puntuar la calidad (intensidad) de los datos abiertos. (OL: Open License): Dispone información bajo una licencia abierta (PDDL, ODC-by y CC0), pero los datos están encerrados en un documento (como el PDF que presenta información imposible de extraer). Aquí hay disponibilidad de información, pero no está estructurada: muchas veces no es posible publicar datos legibles a las máquinas, y se apela a OpenDocument, enlaces a otros sitios web, mapas interactivos, o incluso RSS. Como consumidores, podemos conocer un dato o conjunto de ellos, imprimirlo, guardarlo, integrarlo a otro sistema, intercambiarlo y distribuirlo. Como infomediarios, resulta simple para publicar y se está habilitado a compartir esos datos.
(OL, RE: Readable): datos en formato estructurado (=legible por las máquinas) pero, otra vez, encerrados en software propietario. Como consumidor, se los puede manipular (agregar información, calcularla, cruzarla, visualizarla) sólo que con un software propietario, o bien exportarla a otro formato abierto estructurado. Como infomediarios, es simple la publicación, y en esta instancia ya es preciso utilizar XML (Lenguaje Etiquetado Extensible, un metalenguaje simple que interpreta datos para diferentes lenguajes). También podemos valernos de SHP, ODS y JSON (un formato para intercambio de datos basado en JavaScript que facilita el tratamiento en navegadores y reduce el flujo de datos entre cliente y servidor). Y, en el caso de necesitar trabajar con información geográfica se puede apelar a KML, WMS, WCS o WFS.
(OL, RE, OF: Open Format): hace la información disponible vía Web, en un formato abierto (como CSV). Si bien el panorama es mejor que en las dos estrellas, aún son datos en la web y no de la web (no están en contexto, linkeados entre sí). Como consumidores, tenemos la posibilidad de manipularlos de cualquier manera, sin tener que comprar software propietario. Como infomediario, resulta aún fácil de publicar, pero se pueden necesitar plugins para exportar los datos desde un formato propietario.
(OL, RE, OF, URL): Si a lo anterior agregamos una URL, los datos son de la Web y pueden ser compartidos en la Red (las URLs indican origen y propiedades del dato). La cuarta estrella implica adecuarse a los estándares de la W3C con RDF-XML (Infraestructura para Descripción de Recursos: un modelo estándar para el intercambio de datos que permite intercambiar y enlazar datos desde diferentes aplicaciones y recursos sin que pierdan su significado, lo que facilita la reutilización). Como consumidor, se puede alojar el material (permite bookmarks), se puede combinar con otros datos y reutilizar partes de ellos -en este nivel hay granularidad-, usando herramientas y alojamientos preexistentes. Como infomediario, al tener control granular se puede optimizar su acceso (almacenamiento en caché, etc.)
(OL, RE, OF, URL, LD: Linked data): En este nivel, los datos están linkeados entre sí. Están en contexto. Son datos de la Web, por lo que se puede mostrar, intercambiar y conectar datos con URLs desreferenciables. Tanto los consumidores como los infomediarios disfrutan efecto network (un usuario se beneficia de la existencia de otros usuarios), porque se pueden descubrir más datos relacionados, aprovecharlos y aprender del esquema de los datos. Por supuesto, abundan los links rotos (los ‘error 404’ son usuales).
Datos abiertos enlazados La Web Semántica está construida en RDF (un estándar W3C que describe recursos web, especifica metadatos y representa información). Pero el término Linked Data no implica que los datos deban ser gratuitos, de libre disponibilidad o abiertos como postula el Open Data. De este modo, una empresa puede publicar dos universos de datos linkeados -ambos sistemas interoperan con RDF- pero en una red privada). Por eso, es necesario hablar de Linked Open Data o datos abiertos enlazados. Así indicamos que son datos abiertos en RDF, el usuario puede enlazarlos desde diversas fuentes, instituciones u organizaciones, explorar y combinarlos sin restricciones para nuevos desarrollos web. Este será un nuevo escalafón de la Web Semántica, que incorporará información con descripción del contenido, significado y relación de los datos. Eso la transformará en la Web de Datos, donde conviven múltiples bases de datos distribuidas, abiertas y enlazables.
Todo esto necesita un para qué Abrir datos generar progreso cívico y económico gracias a la disponibilidad masiva del activo que describe el corazón mismo de la era que vivimos: la sociedad de la información. En el caso de la ciudadanía, la razón es evidente: así verá los principios del gobierno abierto en acto. La transparencia colaborativa, a través la disponibilización de datos crudos, actualizados en formatos abiertos, estándar y reutilizables. La colaboración, a través del insumo para innovar y co-crear soluciones utilizando el conocimiento de los ciudadanos. La participación, con la utilización efectiva de un output del Estado (los datos) para utilizarlo para cualquier fin. Y el principio de la igualdad (acceso libre a los datos), para una ciudadanía que innova sin restricciones.
Las empresas pueden generar valor económico a partir de los datos públicos creando servicios y aplicaciones, y encontrar así un nuevo nicho de mercado basado en contenidos digitales. La innovación es un medio para re-colocarse en relación a su competencia a un costo bajo (monetizan información de libre disponibilidad al costo de desarrollo de servicios digitales). A esto hay que sumarle una externalidad positiva: la creación de nuevos servicios conlleva la generación de nuevos puestos de trabajo. O bien, pueden desarrollar productos de mayor valor añadido, y aprovechar la información que pueden obtener de los datos para mejorar procesos internos de su producción.
Las AAPP también se pueden verse favorecidas en el costado colaborativo de la utilización de datos: la producción y desarrollo de festivales (camps, hackatones, etc) de datos para el desarrollo de aplicaciones que luego brindarán a sus ciudadanos. A esto debemos agregar la mejora dinámica de los procesos informáticos internos, facilitados por compartir datos entre diferentes carteras y agregaciones (local, provincial y nacional) promoviendo interoperabilidad -que no es otra cosa que 'la colaboración de las oficinas'-. Esto resultará en una mayor eficacia en el funcionamiento de la AAPP.
Algunas distinciones Transparencia pasiva (o reactiva): requiere de mandato legal para que las oficinas gubernamentales publiquen y actualicen información pública básica, para luego entregar la información a los ciudadanos, sólo luego de su solicitud. Transparencia activa (o proactiva): es la obligación de la AAPP de presentar información sin que sea solicitada, junto a la publicación de información esencial (estructura orgánica, funciones, atribuciones, personal, demanda y prestación de servicios…). Transparencia focalizada: disponibilización de información con el fin de resolver necesidades concretas de una audiencia determinada.
Transparencia colaborativa: basada en el uso de TIC y datos abiertos. Es un modelo interactivo por lo que precisa de colaboración entre organismos públicos. Además, implica la publicación bajo los estándares de datos abiertos, para garantizar el derecho de la ciudadanía a reutilizarlos en proyectos propios. Esta especie puede ser desvirtuada con la opacidad encubierta (usualmente centrada en disponibilizar datos no pertinentes, en formatos no estructurados o software privativo).
Datos
información
Conocimiento introyectado (‘sabiduría’)
Tengo que parar el auto
Merendamos una torta
Conocimiento
La luz del semáforo en mi dirección se puso roja
Hicimos una torta
Información
Luz roja mano derecha sur Corrientes y Callao
Combinación de ingredientes (receta)
Datos
Rojo, 192.234.235.245.678, v2.0
Huevos, harina, leche…
O aquí
O aquí
Plan de Datos Abiertos (PDA) •Identificación: (y caracterización de) los datos que posee una oficina pública. •Análisis de paquetes de datos (datasets) publicables: discriminar la publicable y la que no lo es acorde derecho (los ‘datos públicos’ de la Declaración de Datos Abiertos) •Priorización de los datos: definir los datos prioritarios (decisión estratégica y política). A partir de aquí se realiza el inventario a publicar. •Documentación: realizar la descripción de los datos a publicar (metadatos), para su comprensibilidad (esto facilita la búsqueda y el uso). •Estructuración, carga y publicación: identificar los formatos estructurados para la carga y publicación en la plataforma que permitirá el acceso de los ciudadanos.
Plan Apertura de Datos (2016) Invocando CN, la Declaración Universal de DDHH, el Pacto Internacional de Derechos Civiles y Políticos, la Convención Americana sobre DDHH, la Convención de la ONU y la Interamericana contra la Corrupción, e inserto en la modificatoria (Dec 13/2015) de la Ley de Ministerios (D438/92) de creación del Ministerio de Modernización (autoridad de aplicación y asistencia técnica de la gestión y desarrollo de tecnologías aplicadas a la AAPP central y descentralizada). Se menciona como de la política de Gobierno Abierto, a la que se entendida como una medida que favorece la gestión de datos preservados digitalmente por Ministerios, Secretarías y organismos descentralizados del PEN).
El decreto señala a esos datos un activo cívico y gubernamental de carácter estratégico (y exhorta a su publicación proactiva, completa y oportuna, en y por los canales, medios, formatos y bajo licencias que mejor faciliten su ubicación, acceso, procesamiento, uso, reutilización y redistribución)
Esto implica un cronograma de publicación gradual de todos los datos producidos, almacenados o recopilados en medios digitales (no excluidos por normas específicas), con la intervención de la Secretaria de Ética Pública, Transparencia y Lucha contra la Corrupción. Para ello se instruirá a Ministerios, Secretarías y organismos desconcentrados y descentralizados del PEN, elaborar y presentar en un plazo de hasta 180 días (desde el 12/I/2016) su Plan de Apertura de Datos, el que deberá detallar los activos de datos bajo su jurisdicción y/o tutela, junto a el cronograma de publicación conforme lineamientos de la Autoridad de Aplicación.
El decreto establece noventa (90) días para la implementación del Portal Nacional de Datos Públicos (que fue lanzado a principios de marzo, antes del plazo), donde se publicará: • • • • •
Estructura orgánica y nómina de Autoridades del PEN y su DDJJ Nómina de personal contratado vigente Escalafones y escalas salariales de los regímenes de empleo público Créditos presupuestarios Contrataciones en el sistema Sistema Electrónico de Contrataciones Públicas • Solicitudes de Acceso a la Información y las audiencias de Gestión de Intereses.