Reflexiones sobre la gestión y custodia de datos oceanográficos en España. Recursos existentes y recomendaciones para el futuro Marta Estrada, Enrique Álvarez, Antonio Barragán, Óscar Bermúdez, Mª Jesús García, Alicia Lavín, Pere Masqué, Fiz F. Pérez, Jaume Piera
SCOR Scientific Committee on Oceanic Research Comité Científico sobre Investigación Oceánica Representación española
Reflexiones sobre la gestión y custodia de datos oceanográficos en España. Recursos existentes y recomendaciones para el futuro
Marta Estrada (coordinadora), Enrique Álvarez, Antonio Barragán, Óscar Bermúdez, Mª Jesús García, Alicia Lavín, Pere Masqué, Fiz F. Pérez, Jaume Piera
SCOR Scientific Committee on Oceanic Research Comité Científico sobre Investigación Oceánica Representación española
Grupo de Trabajo de SCOR-España Estrada, Marta (coordinadora) Álvarez, Enrique Barragán Antonio Bermúdez, Óscar García, Mª Jesús Lavín, Alicia Masqué, Pere Pérez, Fiz F. Piera, Jaume
Con la colaboración de: Chic, Òscar Díez, Susana
Agradecimientos. La preparación de este informe ha sido posible gracias a una Acción Complementaria Internacional sobre “Actividad SCOR en España” (PCI2005-A5-0141), concedida por el Ministerio de Educación y Ciencia (MEC). Agradecemos a D. Severino Falcón y a Da. Ángeles Yuste, del MEC, la valiosa ayuda prestada en diversas fases de este proyecto.
Este documento puede encontrarse en: http://www.scor-es.org/documentacion/Reflexiones_Gestion_Datos.pdf
ÍNDICE RESUMEN EJECUTIVO 1. Introducción 2. Términos de referencia del Grupo de Trabajo 3. Análisis de la situación actual en España 4. Recomendaciones 4.1 ¿Qué debería contemplar el sistema de gestión de datos oceanográficos en España? 4.1.1 Recopilación, control de calidad y archivo de datos de manera que queden disponibles para el futuro 4.1.2. Distribución de datos a científicos, industria y el público. 4.1.3. Establecimiento de protocolos para la adquisición y tratamiento de datos 4.1.4. Desarrollo de productos de datos adecuados 4.1.5 Adopción de una Política de datos 4.2. Acciones requeridas 4.2.1. El centro Coordinador 4.2.2. Centros Acreditados 4.2.3. Estructura y gobernancia del centro Coordinador 4.2.4. Financiación 4.2.5. Priorización de tipos de datos 4.2.6. Elaboración de la Política de datos ANEXOS A. El contexto español e internacional A.1. Marco administrativo en la Unión Europea A.2. Iniciativas internacionales A.2.2. GEO-GEOSS A.2.3. EuroGOOS A.2.4. IBI-ROOS A.2.5. SeaDataNet A.2.6. PANGAEA A.3. Gestión de datos oceanográficos en Francia, Gran Bretaña y Estados Unidos A.3.1. Francia. Systèmes d’Informations Scientifiques pour la Mer (SISMER) A.3.2. Gestión de datos marinos en el Reino Unido de Gran Bretaña A.3.3. Estados Unidos. El Integrated Ocean Observing System (IOOS) A.4. Algunas iniciativas españolas A.4.1. CNDP. Centro Nacional de Datos Polares A.4.2. El proyecto ESEOO A.4.3. Centro de datos del Instituto Español de Oceanografía A.4.4. Sistemas de datos de Puertos del Estado A.4.5. SAIDIN (Satellite Image Database Interface). CSIC A.4.6. IDEE, IDECSIC B. Conceptos básicos B.1. Definiciones B.1.1. Datos
B.1.2. Metadatos B.1.3. Conjuntos de datos B.1.4. Productos de datos B.1.5. Bases de datos B.2. Sistemas distribuidos y centralizados B.2.1. Centralizados B.2.2. Distribuidos B.3. Modelos de datos B.4. Formatos de metadatos B.5. Formatos de datos espaciales B.5.1. Mapas de bits y mallas B.5.2. Datos vectoriales B.6. ESEOOXML C. Glosario D. Miembros del Grupo de Trabajo
Resumen ejecutivo El conocimiento científico de los océanos es fundamental para la toma de decisiones que fomenten el bienestar de la población humana, reduzcan las pérdidas de vida y propiedades debidas a riesgos naturales, y permitan una mejor conservación de la biodiversidad y del ambiente global. Para avanzar en este conocimiento es necesaria una coordinación global del acceso a datos e información científica de alta calidad. Este enfoque, reconocido en numerosas propuestas internacionales, requiere colaboración a través de fronteras estatales y la existencia de una gestión adecuada de los datos oceanográficos en cada país. En España existen varios centros y servicios de datos oceanográficos, a cargo de diversas instituciones individuales o grupos de instituciones, que realizan una meritoria actividad. Sin embargo, ninguno de ellos tiene ni la misión ni los medios para ejercer una gestión coordinada de datos oceanográficos a nivel estatal. Es fundamental la creación de una estructura que permita la integración y gestión de toda la información oceanográfica dispersa, que ofrezca los servicios de datos que los centros existentes no pueden ahora proporcionar y que genere productos de valor añadido para la sociedad. Esta estructura podría estar constituida por “Centro Coordinador” de nueva creación, que coordinaría una red de “Centros Acreditados”. El Centro Coordinador sería una institución o figura jurídica nueva. Los Centros Acreditados incluirían los centros y servicios ya existentes que superasen unas determinadas condiciones. El Centro Coordinador debería contar con el personal científico y técnico necesario y un Director de reconocida experiencia. El funcionamiento del centro estaría supervisado por un Comité de Dirección, en el que estarían representados los principales organismos estatales y de Comunidades Autónomas con actividad en el campo de la obtención de datos oceanográficos. Las funciones del Centro Coordinador incluirían: - Recopilar, validar, almacenar y custodiar los datos que se le confíen. - Garantizar el acceso fiable y eficiente a los datos oceanográficos generados en España o disponibles a través de organizaciones internacionales. - Actuar como centro de datos para los datos generados por OPIS (Organismos Públicos de Investigación) que no dispongan de un centro de datos acreditado. El Centro Coordinador debería contar con una financiación estable, procedente de fuentes públicas, que cubriese una parte sustancial de sus costes básicos de funcionamiento. Debería asegurarse también la continuidad de los Centros Acreditados que se aprueben. Los proyectos financiados con dinero público deberían suministrar los datos obtenidos, de acuerdo con la política de datos que se adopte, al Centro Coordinador o a un Centro Acreditado. Para que este objetivo sea factible, debería preverse un sistema de financiación adecuado.
1. Introducción El conocimiento de cómo funcionan los océanos es fundamental para la toma de decisiones que fomenten el bienestar de la población humana, reduzcan las pérdidas de vida y propiedades debidas a riesgos naturales y permitan una mejor conservación del ambiente global. Para avanzar en este conocimiento es necesaria una coordinación global del acceso a datos e información científica de alta calidad. Este enfoque requiere no sólo la colaboración a través de fronteras estatales, sino la existencia de servicios de datos oceanográficos en cada país. Uno de los retos con que se enfrenta la investigación oceanográfica en España es el de establecer un sistema adecuado de almacenamiento y gestión de datos. La Jornada sobre Diagnóstico y Proyección de la Investigación Marina en España, celebrada el 20 de septiembre de 2005 en la Dirección General de Investigación del Ministerio de Educación y Ciencia, Madrid, identificó una serie de problemas, entre los que se cuenta la dificultad de obtener datos o metadatos de campañas o proyectos financiados con fondos públicos, o el que a veces haya que duplicar esfuerzos para repetir información existente, pero que no estaba disponible para toda la comunidad. Por otra parte, se puso de manifiesto la existencia, en España, de algunas iniciativas interesantes. Entre los objetivos de SCOR (Scientific Committee on Oceanic Research) está el de contribuir a mejorar la resolución de problemas conceptuales y metodológicos que entorpezcan la investigación oceanográfica. En relación con este objetivo, y para contribuir a resolver los problemas citados en el apartado anterior, la Representación Española de SCOR (SCOR-Es) decidió convocar un grupo de trabajo (GT) sobre el tema: “Reflexiones sobre la gestión y custodia de datos oceanográficos en España. Recursos existentes y recomendaciones para el futuro”.
2.Términos de referencia del GT La misión de este GT se resume en los siguientes términos de referencia: - Revisar las principales iniciativas sobre archivo y gestión de bases de datos/metadatos oceanográficos disponibles a nivel español e internacional. - Identificar las principales lagunas existentes entre las iniciativas disponibles y las necesidades de la comunidad oceanográfica española y de la sociedad en general. - Desarrollar recomendaciones sobre cómo podría estructurarse la gestión y custodia de datos oceanográficos españoles para solucionar los eventuales problemas detectados. - Preparar y publicar un informe con las recomendaciones del GT y con los aspectos más relevantes de la información recopilada Este documento recoge las consideraciones del GT. Incluye un análisis de la situación actual en España y recomendaciones de actuación. Los anexos presentan información sobre diversas iniciativas internacionales y estatales, y sobre conceptos básicos de gestión de datos.
3. Análisis de la situación actual en España Como se ha comentado en la introducción, las conclusiones de la Jornada sobre Diagnóstico y Proyección de la Investigación Marina en España, señalaban una serie de problemas de la gestión de datos oceanográficos en España. A diferencia de lo que ocurre en países de nuestro entorno, España presenta una serie de deficiencias de infraestructuras y servicios, en particular por lo que se refiere a la custodia y gestión de datos. Del examen de la situación realizado por los miembros del GT se deriva el siguiente diagnóstico general, expresado en la metodología DAFO (Debilidades, Amenazas, Fortalezas, Oportunidades).
Debilidades - Variedad de los agentes implicados en la financiación de la investigación y en la obtención de datos. En España existen varios centros de datos (véase A.4) a cargo de distintas instituciones, pero ninguno tiene la misión (ni los medios) para ejercer la gestión de datos oceanográficos a nivel estatal. Las debilidades citadas a continuación son, en parte, una consecuencia de ésta. - Falta de política de datos global a nivel nacional e internacional (incluida la necesidad de reconocimiento a los suministradores de datos). - Muchos datos no están custodiados en depósitos fiables. Por ejemplo, se encuentran sólo en carpetas o en ficheros del investigador responsable. - Falta de coordinación entre las iniciativas existentes, fragmentación de depósitos de datos y falta de interconexión entre ellos - Díficil búsqueda de datos y metadatos en los archivos existentes. Falta de una lista completa de los datos disponibles. - Diversidad de formatos y falta de interoperabilidad - Falta de indicaciones de calidad de los datos en muchos archivos - Falta de productos de datos destinados a usuarios no especializados
Amenazas - La falta de una buena infraestructura de datos en España puede dificultar la obtención de la información necesaria para estrategias de mitigación y adaptación a problemas como el cambio global. - La falta de infraestructura para gestión de datos España puede dificultar la aportación científica española a proyectos internacionales. - La pérdida de conjuntos de datos que no están adecuadamente archivados ni documentados. - La próxima jubilación de muchas de las personas que han contribuido a generar datos que no están adecuadamente documentados puede hacer imposible su rescate. - El cambio de tecnología puede dejar obsoletos muchos soportes de datos que no están en depósitos adecuados.
Fortalezas - Existencia de importantes conjuntos de datos. - Se cuenta con ejemplos de centros de datos internacionales (véanse A.2 y A.3) y con valiosas iniciativas parciales a nivel estatal (véase A.4). - España tiene una comunidad oceanográfica activa y con experiencia. - Amplia participación en redes y sistemas de gestión de datos internacionales.
Oportunidades - Necesidad cada vez mayor de la comunidad científica de disponer de una infraestructura de gestión de datos. - Existencia de obligaciones internacionales que pueden incentivar la búsqueda de soluciones. - Posibilidad de diseñar un sistema sin arrastrar excesivas restricciones por decisiones anteriores. - Existencia, en fase de planificación o ya en marcha, de nuevas iniciativas tanto estatales como europeas o internacionales en general (véanse secciónes 6-8). - Aparición de nuevos adelantos tecnológicos referentes a la gestión y distribución de datos. - Existencia de financiación europea para rescate de datos.
4. Recomendaciones 4.1. ¿Qué debería contemplar el sistema de gestión de datos oceanográficos en España? La consideración del análisis de la sección anterior, junto con las conclusiones de otros análisis y estudios (véase anexo A) sugieren que el sistema de gestión de datos oceanográficos en España debería garantizar los siguientes servicios: - Recopilación, control de calidad y almacenamiento de datos de manera que queden disponibles para el futuro. - Distribución de datos a científicos, gestores, industria y público. - Establecimiento de protocolos para la adquisición y tratamiento de datos - Adopción de una Política de datos - Desarrollo de productos de datos adecuados En los párrafos siguientes se analiza la situación española actual y sus deficiencias, en relación con los servicios citados. 4.1.1. Recopilación, control de calidad y almacenamiento de datos de manera que queden disponibles para el futuro. ¿Qué tenemos? - Diversos centros de datos con segmentos de información y con niveles heterogéneos en cuanto a organización y prestaciones (véase A.4) - Conexiones a sistemas de datos internacionales a través de algunos proyectos y centros de datos. ¿Qué falta? - Rescate de datos y metadatos que no estén accesibles actualmente. - Política de datos que contemple: - Obligatoriedad de depositar datos generados con dinero público en “Centros Acreditados” - Fuentes de financiación para asegurar la gestión de datos - Normativa sobre restricciones y permisos de uso - Una estructura (“Centro Coordinador”, véase 4.2.1) que permita la coordinación e integración de la información de los centros que funcionan actualmente y que ofrezca servicios de datos a los miembros de la comunidad científica que lo requieran. 4.1.2. Distribución de datos a científicos, industria y el público. a) Facilitar el acceso en tiempo presente a los datos de las estaciones meteorológicas y oceanográficas operativas en aguas españolas ¿Qué tenemos? - Algunos portales mantenidos por una o varias instituciones, con datos en tiempo presente. Un ejemplo es ESEOO (véase A.4.2). - Participación en portales europeos en desarrollo (como EUROGOOS, véase A.2.3) ¿Qué falta? - Continuidad de iniciativas existentes. Existe el compromiso político de dar continuidad a ESEOO a
10
través de una Oficina Española de Oceanografía Operacional, que debería estar estrechamente coordinada con el Centro Coordinador. b) Facilitar el acceso a datos y metadatos archivados ¿Qué tenemos? - Diversos centros de datos con segmentos de información y con niveles heterogéneos en cuanto a organización y prestaciones - Conexiones a sistemas de datos internacionales a través de algunos proyectos y centros de datos ¿Qué falta? - Coordinación e integración de las bases de datos existentes, de manera que los usuarios puedan localizar la información necesaria a través del Centro Coordinador. 4.1.3. Establecimiento de protocolos para la adquisición y tratamiento de datos ¿Qué tenemos? - Protocolo común para series temporales de medidas puntuales (ESEOO) - Diversos protocolos estandarizados para otros tipos de datos oceanográficos (a nivel europeo e internacional se encuentran los de SEADATANET para todo tipo de datos e información marina). - Existen guías de buenas practicas para los distintos tipos de datos, elaboradas en el marco de grupos de trabajo internacionales. ¿Qué falta? - Seleccionar los protocolos adecuados y diseminar la información pertinente a todos los investigadores interesados. - Apoyo a las iniciativas existentes como SEADATANET. 4.1.4. Desarrollo de productos de datos adecuados ¿Qué tenemos? - Las instituciones existentes (véase A.4) ofrecen datos y productos de datos de diversos niveles (incluido el nivel regional, como el Atlas Oceanográfico del Mediterráneo MEDATLAS 2001). - Esfuerzo conjunto de diversas instituciones en relación con las series temporales puntuales (ESEOO). Entre otros productos, este proyecto ha realizado un atlas institucional de información marina homogéneamente analizada, que está disponible en su página web. ¿Qué falta? - Nuevos productos de datos adecuados a la evolución de la demanda. 4.1.5. Adopción de una Política de datos ¿Qué tenemos? - Cada Organismo tiene una política de datos o reglamentación particular 11
- Política de datos Antárticos a nivel estatal - Compromisos con políticas internacionales ¿Qué falta? - Elaborar una política nacional de datos de obligado cumplimiento para todos los datos y productos obtenidos y elaborados con financiación pública.
4.2. Acciones requeridas 4.2.1. El centro Coordinador Es fundamental la creación de una estructura que permita la integración de la información gestionada por los centros que funcionan actualmente y que ofrezca a toda la comunidad científica estatal, gestores y público los servicios de datos que estos centros no pueden ahora proporcionar. Esta estructura podría estar constituida por “Centro Coordinador” y una red de “Centros Acreditados” que incluiría los centros ya existentes que superasen unas determinadas condiciones. La misión del El Centro Coordinador sería la de ofrecer servicios propios de gestión de datos y actuar como integrador y foco de referencia, a nivel estatal e internacional, de la información administrada por los Centros Acreditados. El centro Coordinador sería una institución o figura jurídica nueva, pero podría basarse y/o alojarse físicamente en una entidad preexistente. Es importante: a) Que participen en su gestión todas las instituciones españolas relevantes en el campo de la obtención de datos oceanográficos. b) Que se trate de una institución con vocación de servicio técnico-científico. Las funciones del Centro Coordinador incluirían: - Recopilar, validar, almacenar y custodiar los datos que se le confíen. - Garantizar el acceso fiable y eficiente a los datos oceanográficos (incluidos los existentes a tiempo presente) generados en España o disponibles a través de organizaciones internacionales. - Actuar como Centro de datos para los conjuntos de datos y proyectos generados por OPIS (Organismos Públicos de Investigación), universidades y otros centros de investigación que no dispongan de un Centro de Datos. - Establecimiento y selección de protocolos para la adquisición y tratamiento de datos, adopción de una política de datos y elaboración de productos de datos, de acuerdo con las necesidades de científicos, gestores, industria y público. - Contribuir a la formación de técnicos. - Interaccionar con la administración y el público. Junto con las actividades anteriores, el Centro Coordinador debería: - Mantener en funcionamiento un portal para coordinar e integrar el acceso a metadatos, datos y productos, sea directamente o a través de Centros Acreditados. - Elaborar y mantener una lista de “Centros Acreditados” 4.2.2. Los Centros Acreditados Existen ya en España (véase A.4) un número de centros y otros servicios de datos que dan prestaciones enfocadas a un determinado tipo de datos, una institución o grupo de instituciones, o una región geográfica. Los Centros Acreditados deberían superar unas determinadas condiciones de calidad y alcance de los servicios proporcionados y deberían facilitar el acceso a sus datos, metadatos y productos por medio de una adecuada coordinación con el Centro Coordinador.
12
4.2.3. Estructura y gobernancia del Centro Coordinador El Centro Coordinador debería contar con: - Un Director, responsable del funcionamiento del centro, que debería ser una persona con reconocida experiencia. El director estaría asistido por un responsable o Vicedirector científico y un responsable o Vicedirector técnico. - Un Comité de Dirección que incluiría representantes de las Universidades y OPIS estatales y de Comunidades Autónomas con actividad en el campo de la obtención de datos oceanográficos. Para ser operativo, el número de miembros de este Comité no debería exceder de unos 10. Dado que el número de instituciones relevantes es mucho mayor, debería establecerse un sistema transparente de elección y rotación de los miembros del Comité. La función del Comité Asesor sería la de aprobar el Plan Estratégico del Centro, establecer una política de datos y revisar aprobar el nombramiento de “Centros Acreditados”. - El personal administrativo, científico y técnico necesario para cumplir su función. 4.2.4. Financiación - El establecimiento de un Centro Coordinador y la integración de una red española de Centros Acreditados requiere una decidida actuación presupuestaria que podría ser asumida a través de acuerdos entre Ministerios y CCAA con áreas costeras. El Centro Coordinador debería recibir una financiación estable que cubriese una parte sustancial de sus costes básicos de funcionamiento. Debería asegurarse también la continuidad de los Centros Acreditados que se aprueben. - Debería ser obligatorio que los proyectos financiados con dinero público suministrasen los datos obtenidos, de acuerdo con la política de datos que se adopte, al Centro Coordinador o a un Centro Acreditado. Para que este objetivo sea factible, o bien debería financiarse a los centros de datos para que pudiesen atender gratuitamente a los proyectos aprobados, o bien deberían incluirse los gastos generados por la gestión de datos en el presupuesto del proyecto, de modo que éste pudiese costear la contribución del centro de datos adecuado. 4.2.5. Priorización de tipos de datos Una vez puesto en marcha el Centro Coordinador, deberían establecerse unas prioridades de actuación en relación con el tipo de datos a los que habría que dar servicio. Dado que existe una relación inversa entre la complejidad del proceso de obtención del dato y la cantidad, en un principio, el énfasis se establecería en:
- Datos oceanográficos básicos: temperatura, salinidad, concentración de clorofila y de nutrientes - Series temporales de datos obtenidos en continuo, como nivel del mar, corrientes y oleaje. En una segunda fase, se deberían considerar datos más complejos, como los ecológicos.
4.2.6. Elaboración de la Política de datos El acceso abierto a datos e información científica es fundamental para la investigación, la educación y la toma de decisiones fundamentadas. Por otra parte, la adquisición de datos representa un trabajo que tiene que ser reconocido. El grupo de investigadores originadores de los datos, además de ser el responsable de los datos finales, calibrados y depurados, tiene derecho al reconocimiento en cualquier publicación científico y/o informe en el que se haga uso de esos datos y puede tener privilegios como la exclusividad de uso de los datos en un plazo que se reglamenta atendiendo a diversas causas. Diversos organismos internacionales (como ICSU, IODE, ICES) y estatales han adoptado o tienen en fase de elaboración normativas sobre política de datos oceanográficos. 13
ANEXOS
A. El contexto español e internacional A.1. Marco administrativo en la Unión Europea El GMES (Global Monitoring for Environment and Security) es una iniciativa de la Unión Europea (UE) para apoyar los objetivos europeos de desarrollo sostenible y proporcionar datos de alta calidad, infomación y servicios (EEA Working paper, marzo 2007). GMES proporciona acceso a información geoespacial para gestores y autoridades y contribuye al Global Earth Observation System of Systems (GEOSS). El funcionamiento de GMES (http://www.bmvbs.de/Anlage/original_1006811/The-Way-toEuropean-Earth-Observation-Services-GMES-The-Munich-Roadmap-accessible.pdf) requiere datos de observación in situ y remotos. En principio, la recogida de datos se basará en los mecanismos ya existentes. El contexto político del acceso a los datos está determinado por: El “Blue Book” sobre Política Marina Integrada de la UE, publicado en 2007 junto con un detallado Plan de Acción (http://ec.europa.eu/maritimeaffairs/), propone el desarrollo de un Red Europea de Observación e Información del Mar (European Marine Observation and Data Network, EMODNET), que se basaría, entre otras, en la iniciativa GMES. - La Convención de Aarhus (www.unece.org/env/pp/documents/cep43e.pdf), que requiere que los organismos públicos de los países signatarios compartan información, si son requeridos para ello. Véase también UNECE(1998). - La directiva INSPIRE (www.ec-gis.org/inspire), que entró en vigor el 15 de mayo de 2007, posibilita un marco de referencia para una infraestructura de datos espaciales (IDE) que proporcione servicios integrados de información espacial a las autoridades públicas de los países miembros. Para ello, deben eliminarse obstáculos a la interoperabilidad de los datos y deben implementarse servicios que permitan encontrar, visualizar y compartir datos de diversas fuentes. Referencias United Nations Economic Commisssion for Europe (UNECE). 1998. Convention on access to information, public participation in decision-making and access to justice in environmental matters (http://www.unece.org/env/pp/documents/cep43e.pdf). Guía de interpretación disponible en: http:// www.unece.org/env/pp/acig.htm.
A.2. Iniciativas internacionales Esta sección describe brevemente los objetivos de varias acciones internacionales de relevancia en el contexto español: A.2.1. IODE IOC Committee on International Oceanographic Data and Information Exchange = Comité de la COI sobre Intercambio Internacional de Datos e Información Oceanográfica El IODE fue establecido en 1961 para “favorecer la investigación, explotación y desarrollo marinos a través de facilitar del intercambio de datos e información oceanográficos entre los Estados Miembros y de cubrir las necesidades de productos de datos y de información de los usuarios” (IOC, 2007). El sistema IODE lo conforma una “red mundial orientada al servicio” que se basa en Agencias Nacionales Designadas (Designated national Agencies) y Centros Nacionales de Datos Oceanográficos (NODCs= National Oceanographic Data centres). El nuevo Plan Estratégico para la gestión del sistema de datos y de información de la COI (IOC, 2007) propone el establecimiento de un “IOC Data and Information Management Steering Group”, que reuniría diversos programas de la COI (GOOS, tsunami, HAB...) junto con organizaciones que 17
colaboran con la COI (JCOMM, WMO, ICES, ICSU WDCs Oceanography...). El Steering Group sería responsable de implementar el Plan Estratégico, con la ayuda de una Oficina de Proyecto de IODE (IODE Project Office). Junto a los NODCs, el sistema IODE se apoyará en centros de Datos Oceanográficos Regionales y Centros de Datos Oceanográficos Especializados. Algunos de estos centros funcionarán como “Centros de Archivo”, para lo que deberán adoptar una Normativa de Archivo de Datos (“Data Archive Policy”) como la propuesta por el DMAC del IOOS (EEUU) (Hankin and the DMAC Steering Committee, 2004). Los criterios de (policy) de intercambio de datos oceanográficos de la COI están descritos en la página web: http://www.iode.org/index.php?option=com_content&task=view&id=51&Itemid=95. Básicamente, la COI requiere a los estados miembros que permitan el acceso, libre y sin retrasos indebidos, a todos los datos, metadatos y productos generados en programas de la COI. En el caso de otros programas, se anima a los estados miembros a que permitan el acceso a sus datos oceanográficos para fines no comerciales de investigación y educación, de acuerdo con las condiciones que determinen los estados (dentro de las convenciones aplicables). La política de datos de ICES (adoptada en 2006) para los datos gestionados por esta organización (http://www.ices.dk/Datacentre/Data_Policy_2006.pdf) se basa en al de IODE, pero indica expresamente que hay que reconocer adecuadamente el origen de los datos y respetar las condiciones existentes para su uso y reproducción (por ejemplo, en caso de fines comerciales). Referencias Hankin, S. and the DMAC Steering Committee, 2005, Data Management and Communications Plan for Research and Operational Integrated Ocean Observing Systems: I. Interoperable Data Discovery, Access, and Archive, Ocean.US, Arlington, VA 304 pp. http://dmac.ocean.us/dacsc/imp_plan.jsp IOC. - 2007. IOC STRATEGIC PLAN FOR OCEANOGRAPHIC DATA AND INFORMATION MANAGEMENT (2008-2011). IOC-XXIV/2 Annex7. Borrador disponible en www.iode.org, París, 41 pp. A.2.2. GEO-GEOSS El Group on Earth Observation (GEO, http://www.epa.gov/geoss/) o Grupo de Observación de la Tierra fue instituido en respuesta a las peticiones del 2002 World Summit on Sustainable Development y de la reunión de los países del G8 en 2003. El objetivo central del GEO es organizar la colaboración internacional para establecer un GEOSS (Global Earth Observation System of Systems) que permita maximizar la utillidad de las observaciones de la Tierra como ayuda para la toma de decisiones. En la actualidad (febrero de 2008), el GEO incluye 72 gobiernos y la Comisión Europea. GOOS (Global ocean Observing System, http://www.ioc-goos.org/) es el componente oceanográfico de GEOSS; lo patrocinan varias agencias de las Naciones Unidas (IOC, WMO, UNERP e ICSU). Sobre la política de datos de ICSU, puede verse: http://www.icsu.org/1_icsuinscience/DATA.html. A.2.3. EuroGOOS EuroGOOS (http://ioc.unesco.org/goos/eurogoos.htm) es una asociación informal de organizaciones estatales europeas que tiene como objetivo maximizar los beneficios de las actividades de oceanografía operacional existentes y promover la integración de estas actividades dentro de la estructura de GOOS. Las organizaciones españolas que participan en GOOS son el Instituto español de Oceanografía y Puertos del estado. Un documento sobre política de datos de EuroGOOS puede encontrarse en: http:// www.eurogoos.org/pdf/EG99_37DataPolicy.pdf
18
A.2.4. IBI-ROOS Iberia-Biscay-Ireland Operational oceanographic System IBI-ROOS (http://www.ibi-roos.eu/) es un sistema regional de observación de GOOS/EuroGOOS en el que participan diversos organismos españoles. El principal objetivo de IBI-ROOS es establecer una organización de oceanografía operacional para el área marítima que bordean la península Ibérica, Francia, Gran Bretaña e Irlanda. A.2.5. SeaDataNet A Pan-European Infrastructure for Ocean and Marine Data Management = Una Infraestructura Paneuropea para la gestión de datos Oceánicos y Marinos SeaDataNet es una “Iniciativa Integrada de Infraestructura” del programa de la Unión Europea para “Infraestructuras de Investigación”. Es el sucesor de Sea-Search para el período 2006-2010. Tiene como objetivo el mantenimiento y expansión de los directorios de Sea-Search y la interconexión de los centros de datos oceanográficos existentes con el fin de facilitar el acceso online a conjuntos y productos de datos y metadatos marinos. Está formado por un consorcio de 49 instituciones de 35 países e incluye NODCs (National Oceanographic Data Centres), SDCs (Centros de Datos de Satélite), centros expertos de modelado marino y 3 organismos internacionales, COI, ICES y JRC (Joint Research Laborarory). Está coordinado por IFREMER (Francia). Entre las funciones de SeaDataNet están el apoyo a programas de investigación marina, y la constitución de una infraestructura europea eficiente de gestión de datos marinos, de acurdo con las convenciones internacionales y la futura directiva europea INSPIRE sobre datos ambientales. A.2.6. PANGAEA Publishing Network for Geoscientific & Environmental Data Pangaea es una biblioteca electrónica de acceso libre cuyo objetivo es archivar, publicar y distribuir datos georeferenciados derivados de las diferentes disciplinas de investigación y observación de la tierra. El acceso a los datos se realiza a través del buscador de PANGAEA (http://www.pangaea.de/), el cual redirecciona a los diferentes enlaces donde se encuentran los datos. El sistema está gestionado por dos instituciones alemanas: el Alfred Wegener Institute for Polar and Marine Research (AWI), y el Center for Marine Environmental Sciences (MARM), de la Universidad de Bremen, pero incluye datos de diversos países. La mayoría de los datos existentes son de acceso libre y pueden utilizarse referenciando la publicación o el identificador del conjunto de datos. En algunos casos, los datos derivan de proyectos en curso y su acceso puede estar restringido temporalmente. Los metadatos siempre son accesibles e incluyen la dirección de contacto de los investigadores principales de los proyectos que han generado los datos.
A.3. Gestión de datos oceanográficos en Francia, Gran Bretaña y Estados Unidos
Esta sección presenta información sobre los sistemas de gestión de datos oceanográficos en tres países de nuestro entorno investigador que han hecho esfuerzos importantes en este campo. A.3.1. Francia. Systèmes d’Informations Scientifiques pour la Mer (SISMER) SISMER (http://www.ifremer.fr/sismer/) es el Centro Nacional de Datos Oceanográficos de Francia (French NODC) para el International Oceanographic Data Exchange Program (IODE) de la COI. Fue creado en 1990, forma parte de IFREMER y representa una gran infraestructura para oceanografía. El antecesor de SISMER fue el Bureau National de Données Océanographiques, que comenzó su actividad 19
en 1968. SISMER se fundó como respuesta a los problemas de acceso a los datos que aparecieron en los años 80, cuando el establecimiento de redes impulsó la tendencia a una gestión de datos totalmente distribuida. Los principales campos cubiertos por SISMER son física, química y biología marina, geología y geofísica, e información general sobre campañas y conjuntos de datos oceanográficos franceses. Los datos de monitoreo de las estaciones costeras, la información sobre pesquerías y la base de datos de biología béntica (Biocean) están centralizadas también en IFREMER, pero fuera de SISMER. Por razones históricas, las mediciones de nivel del mar son gestionadas por el Servicio Hidrográfico (aunque los dos sistemas están convergiendo), y los datos de oleaje y meteorología marinas por MeteoFrance. La misión de SISMER incluye la compilación, custodia y diseminación de datos recogidos durante proyectos nacionales e internacionales. SISMER diseña sistemas de información científica y bases de datos, proporciona información sobre metodología y formatos e implementa controles de calidad. Software de SISMER Aparte de software comercial, el sistema de software de SISMER incluye: - Interfases RDBS ORACLE e IFREMER/ISI (Ingénierie des Systèmes Informatiques) - Servidor de datos e información de SISMER - Base de datos Argo/Coriolis - Software IFREMER/ISI - Herramientas para reformateo, control de calidad (System of Control Oriented Oceanographic Parameters, SCOOP y System of Control Oriented Geophysical Data collected underway, CQDG) y edición y diseminación de datos (portal de web NAUTILUS y software SELMED para selección y grabación de datos en disco o cd-rom. El Servidor de datos e información de SISMER contiene: 1. Una base de datos relacional 2. Un servidor para web e internet 3. Varios accesos servidor/servidor 4. Varias interfases gráficas de usuario 5. Software de gestión de datos 6. Interfases con software de calificación de datos Este servidor proporciona acceso a metadatos, y catálogos y direcciones lógicas de los ficheros de datos. Por otra parte, incluye herramientas de gestión para custodia de los datos, acceso online a metadatos y diseminación automática y controlada de datos.
Figura 1. Equema de las funciones de la bse de datos de Coriolis.
20
Base de datos Argo/Coriolis Las funciones de la base de datos Coriolis están esquematizadas en la figura 1. Puede hallarse información técnica sobre las interfases externas y otros aspectos de Coriolis en el documento Cordo/dti-die/00-056.pdf (http://www.coriolis.eu.org/cdc/cdc_info/etc/cordo-die-00-056.pdf) y en las referencias citadas en él. A.3.2. Gestión de datos marinos en el Reino Unido de Gran Bretaña Centros de datos del National Environmental Research Council (NERC) http://www.nerc.ac.uk/research/sites/data/ La red de centros de datos de NERC ayuda a la gestión de datos en los centros financiados por NERC y es responsable de facilitar el acceso a estos datos y de su de mantenimiento a largo plazo. NERC gestiona datos de diversas disciplinas: - Ciencias atmosféricas - Ciencias de la tierra - Ciencia Marina - Ciencia Polar - Arqueología Científica - Ciencia terrestre y de agua dulce - Hidrología - Bioinformática Ciencias Marinas http://www.nerc.ac.uk/research/sites/data/marine.asp El British Oceanographic Data Centre centraliza la información sobre datos de ciencias marinas, aunque existen otras organizaciones que custodian datos marinos: - Antartic Environmental Research Centre - Dundee Satellite Receiving Station (AVHRR, CZCS, SeaWIFS) - Global Population Dynamics Database - MarLIN (Marine Life Information Network for Britain and Ireland) - National Geosciences Data Centre(Geofísica Marina, Plataforma continental) - NERC Earth Observation Data Centre (Exploración costera aérea) - NERC Remote Sensing Data Analysis Service (Temperatura marina superficial, derivada de datos de Dundee) - OceanNET (Portal nacional de datos e información del ambiente marino, organizados por el BODC para el Inter-Agency Committee on Marine Science and Technology (IACMST) - National Oceanography Centre, Southampton – SeaDOG (Geofísica del océano profundo, British Mid-Ocean Ridge Programme) Centro de Datos BODC http://www.bodc.ac.uk/about/what_is_bodc/ El BODC es una institución nacional para custodiar y distribuir datos sobre el ambiente marino. Su sede física se encuentra el el Proudman oceanographic Laboratory (Liverpool, Gran Bretaña). Las bases de datos del BODC están dedicadas a datos biológicos, químicos, físicos y geofísicos y contienen medidas de casi 10000 variables diferentes. El enfoque del BODC implica: - Almacenamiento cuidadoso, control de calidad y almacenamiento de los datos, de modo que no 21
se vean afectados por cambios de tecnología y estén disponibles en el futuro. - Distribución de datos para investigadores, educación, industria y el público. - Apoyo a los investigadores durante proyectos de investigación marina. BODC proporciona un servicio de gestión de datos durante el período de actividad del proyecto. - Producción de atlas digitales y productos innovativos sobre datos marinos. El papel del BODC en el Reino Unido http://www.bodc.ac.uk/about/our_national_role/ En el contexto nacional, el BODC cumple las siguientes funciones: - Centro de Datos Marinos del Reino Unido - Mantenimiento y desarrollo de la National Oceanographic Database (NODB). - Gestión de la Red de mareógrafos del Reino Unido. - Es el centro de datos marinos para el NERC. - Gestión de datos de proyectos. - Coordinador nacional de datos ambientales marinos (Marine Environmental Data, MED) del Reino Unido para la IACMST. Esta organización es un comité gubernamental responsable de la supervisión de las actividades relacionadas con el mar en los Departamentos miembros. Gran parte del trabajo de la IACMST se realiza a través de dos grupos de acción, el Marine Environment Data Action Group (MEDAG) y el Global Ocean Observing System (GOOS) Action Group del Reino Unido. - Marine Environmental Action Group (MEDAG). Se ocupa de mejorar la accesibilidad y disponibilidad de los datos marinos, del desarrollo de normas de gestión de datos y de mejorar los mecanismos de intercambio de datos. - UK GOOS Action Group. Coordina la contribución del reino Unido a GOOS y EuroGOOS, el componente europeo de GOOS. Tembie es responsible del desarrollo de un plan de acción para monitoreo y modelado de cambios en procesos marinos y clima. - OceanNET. Actúa como portal de datos e información sobre el ambiente marino y promotor de las actividades del GOOS Action Group. A.3.3. Estados Unidos. El Integrated Ocean Observing System (IOOS) El Congreso de los Estados Unidos ha encargado a la comunidad científica marina el diseño e implementación del denominado Integrated Ocean Observing System (IOOS). IOOS se plantea como una red de sistemas regionales, nacionales y globales para adquisición y diseminación de datos y productos de datos que sirvan las crecientes necesidades de protección ambiental, salud pública, industria, educación, investigación y recreo. Representa también la contribución de EEUU al Global Ocean Observing System (GOOS). La oficina nacional de IOOS, Ocean.US, estableció en 2002 un Data Management and Communications Steering Committe. Este comité ha desarrollado un minucioso Data Management an Communications Plan (DMAC), publicado en Hankin and the DMAC Steering Committee (2004), disponible en http:// dmac.ocean.us/dacsc/imp_plan.jsp. En los párrafos siguientes se presentan algunas de las características básicas del plan. El sistema IOOS está compuesto por tres subsistemas: - Subsistema de observación. - Subsistema de modelado y análisis. - Subsistema de gestión de datos y comunicación (DMAC). El DMAC (figura 2) provee los enlaces entre los subsistemas de IOOS y conecta IOOS con sistemas internacionales de gestión de datos oceanográficos, y con sistemas de gestión de datos de otras disciplinas. La infraestructura de DMAC comprende standards, protocolos, instalaciones, software y sistemas de hardware. Los servicios de DMAC incluyen 1) Metadatos; 2) la capacidad de buscar y localizar
22
Figura 2. Comunicación de datos en IOOS. Los componentes del DMAC se han delimitado con línea contínua. Las flechas indican mecanismos de feedback y control (Hankin and the DMC Steering Committee, 2004).
conjuntoy productos de datos; 3) la capacidad de transporte de datos y productos a través de Internet; 4) La posibilidad de evaluar las características de los datos online; y 5) Archivo de datos a largo plazo. El diseño del DMAC tiene en cuenta las siguientes características: 1. Organizaciones federades de modo flexible. 2. Depósitos de datos distribuidos geográficamente. 3. Heterogeneidad de los datos. DMAC considera que su éxito dependerá de su aceptación y reconocimiento por parte de los proveedores y usuarios de datos y de que tanto unos como otros consideren que DMAC les ayuda a conseguir sus objetivos. PDMAC podrá ser efectivo si usa métodos de persuasión no coercitivos. El Sistema de Archivo de Datos de IOOS comprenderá un conjunto de instalaciones designadas, nuevas y ya existentes (figura 3). Se procurará aprovechar al máximo la infraestructura y experiencia
Figura 3. Esquema del Sistema de Archivo de Datos del DMAC (Hankin and the DMAC Steering Committee, 2004; véase referencia en sección A.2).
23
y conjuntos históricos de datos de centros ya existentes como el national Oceanographic Data center (NODC), operado por la NOAA. La política de datos del Sistema de IOOS estará de acuerdo con los principios de GOOS y con las política de intercambio de datos de IOC/IODE y de la organización metorológica Mundial (World Meteorological Organization, WMO).
A.4. Algunas iniciativas españolas Esta sección, que no pretende ser exhaustiva, presenta información sobre algunas de las principales iniciativas españolas. A.4.1. CNDP. Centro Nacional de Datos Polares Antecedentes Internacionales EL SCAR-COMNAP, en la Reunión del XXII SCAR, en junio de 1992, estableció un Grupo Especial de Planeamiento para la Gestión de la Datos Antárticos, en sustitución del anterior CCAD (Commitee for the Coordination of Antarctic Data). Este Grupo de Planeamiento incluía el desarrollo de un Plan para la coordinación y la gestión de estos datos. El primer informe de este Grupo, en Octubre de 1992, propuso un Consejo de Administración a fin de gestionar el desarrollo de un Sistema de Directorios de Datos Antárticos (Antarctic Data Directory System - ADDS) comprendiendo los Centros Nacionales de Datos (National Antarctic Data Centres-NADCs) conectados a través de la red global –INTERNET- con un Directorio Maestro de Datos (Antarctic Master Directory-AMD). La tecnología propuesta por el AMD fue la de la Red Internacional de Directorios (International Directory Network-IDN) utilizando para el intercambio de datos el formato DIF (Directoy Interchange Format). Las recomendaciones de su Informe fueron aceptadas por el SCAR y el Comité Ejecutivo del COMNAP en abril de 1992, así como en la Reunión del Tratado Antártico de Noviembre de 1992. Estos DIF o metadatos (dato de dato), contienen un resumen conciso de las personas, tareas e investigaciones realizadas en las diferentes disciplinas, con información valedera y suficiente para su difusión internacional. SCAR/COMNAP JOINT COMMITTEE ON ANTARCTIC DATA MANAGEMENT (JCADM) El 23 de mayo de 1997 el Grupo de Planeamiento (establecido en 1992) fue reemplazado por el Joint Committee on Antarctic Data Management (JCADM). El JCADM esta integrado por los representantes y responsables de los Centros de Datos de cada país (National Antarctic Data Centres - NADCs). El Tratado Antártico ha manifestado un activo interés en cuanto a la gestión de los metadatos Antárticos. La XXII Reunión Consultiva del Tratado Antártico, 1998, a través de su Recomendación XXII-4 y, conforme a la información presentada por el SCAR y el COMNAP en nombre del JCADM, instó a los Países Miembros del Tratado, al establecimiento de sus Centros Nacionales de Datos (NADCs), apoyando el desarrollo de sus políticas institucionales. Es compromiso de estos centros promover procesos de educación a sus científicos a fin que estos contribuyan con su información, así como asistir en la generación de los registros de metadatos, siendo además sus depositarios, todo ello en aras de una mejor difusión de las investigaciones. Estos centros prestarán el apoyo necesario a sus investigadores y serán los responsables del control de los registros de metadatos, según las estructuras predeterminadas, para su posterior inserción y actualización en el AMD, participando igualmente en el desarrollo de la Red de Directorios de Datos (IDN).
24
El Sistema de Directorios de Datos Antárticos (ADDS) es un muy apropiado punto de partida para la difusión de los metadatos. El Directorio Maestro de Datos (AMD) es la central que contiene todos los grupos de metadatos generados y enviados por los CNDAs. El AMD, con identidad propia, se encuentra actualmente alojado en el Global Change Master Directory (GCMD) que, con su tecnología y su dinámica, permite una fácil remisión, inclusión y mejor acceso a la información. Política de datos Antárticos. Iniciativa Española El Centro Nacional de Datos Antárticos – CNDA (National Antarctic Data Centre – NADC), actualmente Centro Nacional de Datos Polares Español (CNDP) es miembro del JCADM desde el año 1999, y ha venido generando registros de “metadatos” de los proyectos de investigación españoles en la Antártida. Por iniciativa del Comité Polar Español (CPE) en el marco Subprograma Nacional de Investigación Polar (SNIP), incluido en el Programa Nacional de I+D+i y según la resolución de 30 de noviembre de 2005, de la Secretaría de Estado de Universidades e Investigación, por la que se hace pública la convocatoria de ayudas para la realización de proyectos de investigación, en el marco de algunos Programas Nacionales del Plan Nacional de Investigación Científica, Desarrollo e Innovación Tecnológica 2004-2007. Se incluye el siguiente punto: “14. De conformidad con lo previsto por el Comité Polar Español en su reunión del 30 de mayo de 2003, los investigadores principales de los proyectos polares deberán enviar los datos brutos y los de
Figura 4. Portal del CNDP en el Global Change Master Directory Portal
25
las calibraciones instrumentales para su archivo en el Centro Nacional de Datos Antárticos, en un plazo máximo de tres meses posteriores a la campaña finalizada [...] La no remisión de dichos datos hará incompatible al Investigador Principal para nuevos proyectos antárticos. Asimismo, todos lo anterior referente al envío de datos, calibraciones e incompatibilidad será aplicable a todos los proyectos que impliquen campañas oceanográficas, independientemente del programa a que hayan sido presentados.” En cumplimiento de esta resolución desde la campaña Antártica 2005/2006 el CNDP español, no solo se ocupa de la generación de “metadatos” sino también del almacenamiento, custodia y gestión de los “datos brutos” derivados de la los proyectos de investigación. El CNDP radica en el Instituto Geológico y Minero de España (IGME) y los datos son almacenados y gestionados en servidores de esta institución. La aplicación de la anterior resolución implica el establecimiento de una “Política de Datos”, que de respuesta a las dudas derivadas de la aplicación de la misma, en referencia plazos, formatos, confidencialidad de los datos…..etc. En este sentido y de acuerdo con el CPE el CNDP ha elaborado una “PROPUESTA DE PROTOCOLO DE REMISIÓN, ALMACENAMIENTO Y DIFUSIÓN DE DATOS ANTÁRTICOS EN ESPAÑA”. Este protocolo (http://hielo.igme.es/index.php) ha sido aprobado en la 16º reunión del Comité Polar Español celebrada en Madrid, el 27 de noviembre de 2007 y actualmente se está aplicando a los proyectos de investigación españoles en la Antártida. A.4.2. El proyecto ESEOO El proyecto ESEOO (Establecimiento de un Sistema Español de Oceanografía Operacional), de tres años de duración (2004-2007) y financiado por el Ministerio de Educación y Ciencia, ha producido un profundo cambio en el panorama español de la oceanografía operacional y la lucha contra la contaminación en el mar al dotar al país de mecanismos modernos de generación de información océano-meteorológica imprescindibles para una toma de decisiones basada en el conocimiento. Los resultados del proyecto son, por un lado, productos y servicios tangibles (p. ej. sistemas de predicción de corrientes, de trayectorias de contaminantes y objetos a la deriva, servicios de datos en tiempo real, etc.) y, por otro, un notable incremento en el nivel de coordinación entre las instituciones nacionales y de estas con centros claves en el extranjero. Esta coordinación ha cristalizado en el diseño y puesta en marcha de la USyP (Unidad de Seguimiento y Previsión), una unidad operativa que se activa en caso de emergencia y tiene como labor suministrar a la sala de crisis y al organismo rector toda la información océano-meteorológica necesaria. Por último, ESEOO ha diseñado un esquema de generación y distribución de la información que asegurará que los productos desarrollados puedan ser empleados en un futuro. En lo referido a datos, el objetivo fundamental del proyecto fue la creación de un servicio de datos analizados que proporciona rápido acceso a información procesada y útil a partir de las fuentes de datos existentes en aguas españolas. La creación de dicho sistema exigió el desarrollo de un inventario de metadatos, la homogeneización de formatos (mediante el estandar ESEOOXML), la definición de controles de calidad y un análisis homogéneo de la información disponible, que ha requerido el desarrolló un software de análisis de series temporales accesible a través de la web. Con los resultados de todo el proceso se ha realizado de un atlas institucional de información marina homogéneamente analizada, que está disponible en la página web de ESEOO (el denominado servicio de datos analizados). Adicionalmente, se creó un directorio de datos en tiempo real capaz de proporcionar los valores de las medidas que se estén registrando en el momento de la consulta. A continuación se describen estos avances. Inventario de datos ¿En qué consiste? Este producto se desarrolló con el objetivo de inventariar los datos físicos y químicos medidos en el medio marino y hacer públicas sus características o “metadatos”. Anteriormente, la información sobre
26
Figura 5. Puntos con medidas de corrientes. Mapa extraído de la página de ESEOO
la existencia de datos estaba desperdigada en diversos institutos, de forma que la determinación de los disponibles para una determinada zona resultaba prácticamente imposible. Gracias a este inventario, accesible a través de Internet, los usuarios pueden tener un rápido conocimiento de los datos existentes en una determinada zona y de cómo acceder a ellos. La figura 5 muestra el resultado de realizar una consulta la página de ESEOO sobre los puntos donde existen medidas de corrientes. Algunas zonas presentan vacíos que corresponden, probablemente, a ausencias de información que deben ser subsanadas en un futuro. ¿Para qué sirve? Entre las aplicaciones más destacadas encontramos: - Obtención de datos útiles para el diseño de infraestructuras portuarias. - Fuente de datos para trabajos de investigación de naturaleza diversa (oceanografía física, biología, etc.). - Enumeración de datos disponibles para la creación de un servicio de datos analizados (ver sección siguiente). Servicio de datos analizados ¿En qué consiste? El servicio de datos analizados pretende ser una fuente de descripciones estadísticas del medio marino accesible rápidamente en el caso de una emergencia. En ocasiones, informaciones básicas, como la corriente u oleaje medio en una zona, son fundamentales para el apoyo a la toma rápida de decisiones. A modo de ejemplo, a la hora de decidir el destino de un barco que amenaza hundirse es imprescindible conocer el comportamiento más probable del medio marino a fin de que las decisiones a tomar tengan una sólida base técnica. En estos casos, de nada sirve tener largas series de datos, pues literalmente no hay tiempo para analizarlas y sacar información práctica. Estas estadísticas han de ser confeccionadas a priori y este trabajo debe ser accesible a través de Internet. 27
Figura 6. Servicio de datos analizados
En el ámbito de ESEOO, se analizaron los datos existentes en el inventario con una batería de programas única y con los resultados se preparó el servicio de datos analizados (ver figura 6). ¿Para qué sirve? Entre las aplicaciones a destacar se encuentran: - Apoyo a la toma de decisiones en caso de crisis. - Ingeniería marítima (diseño de infraestructuras portuarias mediante el cálculo de oleaje y nivel del mar máximo, periodos de retorno, etc…). - Estudios biológicos (a partir de la evolución estacional de las temperaturas y otras variables) - Estudios de calidad de agua en la línea de costa (las corrientes medias y máximas en una zona dan idea de los tiempos de renovación de las masas de agua). - Evolución de la línea de costa (los valores de corrientes y oleaje máximos determinan el proceso de erosión). - Los datos de viento y oleaje medidos por las boyas son empleados para el diseño de plantas eólicas y oleomotrices “offshore”. Servicio de datos en tiempo presente ¿En qué consiste? Este producto es una página web que permite un acceso a toda la información generada en tiempo presente en los diversos institutos que mantienen redes de medida operativas y sistemas de previsión (ver figura 7). ¿Para qué sirve? Este servicio tiene como función fundamental proporcionar información en tiempo presente de la situación existente en el mar en un momento de crisis. Esta información es vital para la toma correcta de
28
Figura 7. Servicio de datos en tiempo presente y uno de los productos accesibles (predicción de viento).
decisiones y la movilización de recursos. Además, tiene múltiples aplicaciones tales como: - Monitorización de condiciones ambientales durante la realización de obras marítimas. - Proporcionar información sobre el estado de la mar para las actividades pesqueras. - Servir de apoyo para la navegación, incluyendo la deportiva. - Ofrecer de forma accesible información en tiempo presente para la industria turística (p. ej. temperatura del mar o altura de las olas para empresas de buceo). Servicios basados en teledetección ¿En qué consiste? Este producto es idéntico al descrito en la sección anterior (servicios de datos en tiempo presente) con la particularidad de que la información presentada es generada a partir de las medidas de satélites. Se han creado servicios de datos basados en medidas de satélite y medidas “in situ” accesibles a través de la página de ESEOO. La figura 8 muestra una imagen extraída de uno de dichos servicios. ¿Para qué sirve? Las aplicaciones de este producto son idénticas a las de el servicio de datos en tiempo real explicadas en la sección anterior. A.4.3. Centro de datos del Instituto Español de Oceanografía Antecedentes En 1964, se estableció en el Instituto Español de Oceanografía (IEO) el Centro Español de Datos Oceanográficos (CEDO), integrado en el sistema de Centros Nacionales de Datos Oceanográficos (NODCs), representando oficialmente a España en el Comité para el Intercambio de Datos e Información Oceanográfica (IODE) de la Comisión Oceanográfica Intergubernamental (COI). Asimismo, el IEO 29
Figura 8. Imagen de temperatura superficial extraída del servicio de datos de teledetección
como miembro del Consejo Internacional para la Explotación del Mar (CIEM) un representante del IEO participa en el Grupo de Trabajo de Gestión de Datos Marinos del CIEM (ICES MDMWG). Si bien el IEO ha participado de forma activa en los comités anteriormente mencionados, enviando los datos de campañas oceanográficas al centro mundial de datos (WDC-A), ubicado en Estados Unidos y los datos del nivel medio del mar al Servicio Permanente del Nivel del Mar (PSMSL), ubicado en el Reino Unido, así como los formularios de ROSCOP y datos de campañas del área del ICES al Centro de Datos del ICES, pero ha sido en los últimos años y con la aparición de los programas marcos de la Unión Europea cuando se ha dado un mayor empuje a esta actividad. Así en el marco de los proyectos MEDATLAS, MEDAR/MEDATLAS II, se han recopilado y armonizado un volumen muy importante de datos de temperatura, salinidad, oxigeno y nutrientes en el área del Mediterráneo y se ha desarrollado aplicaciones bajo el entorno de Windows para la gestión de datos marinos. Asimismo en el marco del proyecto CANIGO se ha hecho una recopilación completa de los datos originados en el propio proyecto CANIGO. Asimismo, se ha participado en los proyectos europeos EDMED y SEA-SEARCH cuyo objetivo es el mantenimiento de un directorio de datos europeo. Por otra parte, en los últimos años, en el marco del proyecto estructural del IEO Sistema de Información Científica de Datos Marinos (SIC_DAMAR) se ha venido difundiendo los datos y productos a través del servidor WEB del IEO, para lo que se ha diseñado la pagina http://indamar.ieo.es. Desde el año 2000, el IEO facilita también la información de temperatura superficial del agua a partir de imágenes AVHRR de NOAA que se reciben en el Centro Oceanográfico de Santander. El objetivo es hacer llegar la información a los usuarios que lo requieran y enviarla a las campañas y acciones del IEO. Para ello se diseñó una página web en la que se dispuso de imágenes ordenadas por 5 áreas (Golfo de Vizcaya, Atlántico Este, Mediterráneo, Estrecho y Canarias). Las imágenes ordenadas por año y mes, se ponen en la web (http://www.teledeteccionoceanografica-ieo.net/) y se pueden descargar libremente. Para obtener imágenes de mayor calidad hay que solicitarlas a través de la página web o por medio de un correo electrónico. La serie de datos está disponible desde 2000 hasta 2007. En junio de 2007, el IEO fondeó una boya Oceano-meteorológica a 22 millas al Norte de Santander, en aguas profundas (2850m) del Golfo de Vizcaya, gracias a financiación del IEO, Ministerio de Educación y Ciencia y Gobierno de Cantabria. Es una boya ODAS tipo “Seawatch”. La boya transmite datos meteorológicos (presión atmosférica, temperatura del aire, humedad, dirección y velocidad viento), oleaje direccional y parámetros oceanográficos (temperatura del agua, salinidad, velocidad y
30
dirección de la corriente (hasta 100m), oxígeno disuelto y fluorescencia) con frecuencia horaria al Centro de Santander del IEO. Tras un control de calidad, su distribución se realiza a través de la web del IEO (boya_agl.st.ieo.es) y tambien integrada en la Red de Boyas de Aguas Profundas de Puertos del Estado. Los datos transmitidos se almacenan y pueden ser consultados libremente en gráficos y solicitados, previo registro. Los datos históricos se depositarán en el Centro de datos del IEO (el sistema está a punto de funcionar). En la actualidad el IEO está participando en el proyecto europeo “Infraestructura pan-europea para la gestión de datos marinos y oceánicos” SeaDataNet http://www.seadatanet.org Organización de Centro de datos del IEO En 2002-2003. La Secretaría General de Política Científica encomendó al IEO elaborar un estudio para el establecimiento de un Sistema Nacional para la coordinación de las bases de datos oceanográficos y del material de muestras referencial La dirección del IEO constituyo un grupo de trabajo de datos e información marina para elaborar una estrategia de gestión de datos en el IEO con el fin de alcanzar los objetivos a corto y largo plazo siguientes: - Guardar y organizar los datos y elaborar información marina relevante. - Facilitar su accesibilidad a los usuarios, según los medios tecnológicos al uso. - Atender los compromisos nacionales e internacionales en esta materia. Con este fin se diferenciaron 3 grupos de datos: - Grupo de datos I : datos de oceanografía y contaminantes y sus efectos biológicos. - Grupo de datos II : datos de pesquerías y comunidades biológicas. - Grupo de datos III : datos de geología. Cada grupo de datos esta formado al menos por: - Gestor científico de datos marinos (1): responsable del equipo y su función será la de planificar el trabajo del grupo, preparar y co-dirigir, en representación del IEO, los proyectos nacionales e internacionales de gestión de datos. - Experto/s en la gestión de datos marinos (2): cuya función será la de describir estructuras de información, criterios de control, métodos de análisis, supervisar las actividades de explotación de la información. - Ayudante/s de investigación (2): cuya función será la del procesamiento de información. El equipo de trabajo responsable del grupo de datos I es también el responsable del Centro Nacional de Datos. La plantilla actual de este grupo es: - 4 funcionarios: 3 titulados superiores (1 en excedencia) y 1 ayudante de investigación. - 2 contratados por el proyecto SeaDataNet (1 titulado superior y un técnico superior). - 1 asistencia Técnica. El equipo de trabajo responsable del grupo de datos II es responsable de la gestión de los datos enmarcados en el proyecto “ Plan Nacional de Datos para la Política Pesquera Común” en la que participan un número importante de contratados y funcionarios. El equipo de trabajo responsable del grupo de datos III es el responsable de los sistemas de información geográfica de fondos marinos. A.4.4. Sistemas de datos de Puertos del Estado Introducción Puertos del Estado es una institución dependiente del Ministerio de Fomento que tiene la responsabilidad global sobre el sistema portuario dependiente del Estado. Comprende un total de 27 Autoridades Portuarias y es la encargada de coordinar dicho sistema, así como de implementar la política 31
del gobierno en materia portuaria. Uno de sus papeles fundamentales es el mantenimiento de las redes de observación del medio físico que afecta al sistema portuario. Esta labor se realiza por parte del Área del Medio Físico. Los servicios desarrollados por el Área del Medio Físico están disponibles para uso público. La distribución se realiza vía web en la página (http://www.puertos.es). El Área del Medio Físico tiene 3 ámbitos fundamentales de actividad:1) Redes de Observación; 2) Sistemas de predicción y 3) Bases de datos. Redes de observación Puertos del Estado opera las siguientes redes de observación del océano: - La Red de aguas profundas está formada por 13 boyas Seawatch y 3 Wavescan. Los instrumentos están ubicados en puntos con profundidades entre 200 y 800 metros y miden parámetros oceanográficos y meteorológicos. Los datos son transmitidos cada hora vía satélite y se envían a la web tras un control de calidad automático. - Red Costera de Puertos del Estado. Proporciona datos de oleaje en tiempo real en puntos de aguas poco profundas. Su objetivo es complementar las medidas de la red exterior en lugares de especial interés para las actividades portuarias o la validación de modelos de oleaje. Consta de boyas escalares Waverider y de boyas direccionales Tryaxis. - Red de correntímetros. El objetivo de esta red es obtener medidas oceanográficas (corrientes, temperatura y salinidad) que complementen y ayuden a interpretar las obtenidas por las boyas de la red exterior. Está formada por cadenas de correntímetros (modelo RCM7) que se ubican a profundidades predefinidas. No transmiten en tiempo real. - La Red de Mareógrafos REDMAR. Está en funcionamiento desde 1992. El objetivo es la monitorización del dato de nivel del mar en tiempo real y la generación de series históricas para su posterior explotación. En la actualidad está constituida por 14 mareógrafos acústicos SONAR, 7 mareógrafos de presión Aanderaa y 12 mareógrafos de radar Miros. - La tecnología Radar de Alta Frecuencia (Radar HF). Permite la monitorización remota de corrientes y oleaje en un área con rango entre centenas y miles de kilómetros cuadrados. Puertos del Estado, la Autoridad Portuaria de A Coruña, la Autoridad Portuaria de Vigo y Qualitas Instruments suscribieron el pasado 14 de abril de 2005 un protocolo encaminado a implantar dos estaciones radar HF SeaSonde de Codar Ocean Sensors, para la monitorización remota de corrientes y oleaje en los faros de Finisterre y Silleiro, a efectos de demostración de su utilidad en las necesidades derivadas del diseño, seguridad y operatividad de las infraestructuras portuarias. Los registros de estos sistemas, junto con los generados por los modelos de previsión se almacenan en el banco de datos de Puertos del Estado. Asimismo incluye varias bases de datos numéricos de retroanálisis. La base es accesible on-line. Los datos de Puertos del Estado en tiempo real son gratuitos y se accede a ellos a través de Internet. Los datos históricos han de ser solicitados a Puertos del Estado. Para propósitos de investigación se proporcionan a coste cero. Para empresas tienen asociado un pequeño gasto por gestión. A.4.5. SAIDIN. Satellite Image Database Interface, Estació Litoral de Barcelona. Centre Mediterrani d’Investigacions Marines i Ambientals (CMIMA, CSIC), Instituto de Ciencias Marinas de Andalucía (ICMAN, CSIC) Introducción SAIDIN (http://saidin.cmima.csic.es/) es una aplicación para la web, desarrollada para visualizar y distribuir datos de satélite de la estación receptora HRPT (High Resolution Picture Transmission) del CMIMA y de otras fuentes. El objetivo de SAIDIN es facilitar el trabajo con datos de satélite tanto a usuarios interesados en imágenes cualitativas, como a usuarios interesados en datos cuantitativos crudos.
32
Características principales - Temperatura marina superficial (SST) del AVHRR de NOAA, en tiempo casi real (Mediterráneo Occidental), datos históricos de viento (Quikscat) y promedios mensuales de clorofila del SeaWIFS. - Calendario interactivo para búsqueda de datos. - Poderosas herramientas de visualización y posibilidad de descaga de imágenes. Inspección rápida de imágenes y de metadatos. Posibilidad de guardar los metadatos en disco. - Se pueden descargar datos crudos en formato netCDF funcionament a través del catálogo THREDDS (http://ers.cmima.csic.es/thredds). - Posibilidad de superponer los datos de boyas de Puertos del estado. - Animación diaria de SST y temperaturas medias nocturnas. La aplicación está implementada en el lenguaje Java y puede utilizarse a través de un servidor o puede descargarse para su uso como aplicación independiente. Los ficheros de configuración de la aplicación web.xml permiten la transferencia fácil a otros servidores y que otras instituciones sirvan sus datos con esta aplicación. Política de datos Los datos ERS (Estación Receptora de Satélite) se distribuyen libremente, pero se requiere a losnusuarios de SAIDIN que hagan constar en los agradecimientos que “estos datos han sido obtenidos de los ERS del CMIMA (Barcelona) y del ICMAN (Cádiz), ambos del CSIC, España”. Las imágenes de SeaWIFS sólo pueden usarse para fines científicos y educacionales. Los usos comerciales deben coordinarse con ORBIMAGE. Financiación El proyecto SAIDIN se inició con fondos del proyecto MAMA (EVR1-CT-2001-20010), de la UE, que tenía como objetivo general contribuir a las observaciones marinas rutinarias y predicciones en el Mediterráneo (MedGOOS). Actualmente, el funcionamiento de SAIDIN está financiado por los dos Institutos del CSIC que lo mantienen (CMIMA e ICMAN). A.4.6. IDEE, IDECSIC A nivel español, una respuesta a la directiva INSPIRE es el proyecto de desarrollo y mantenimiento de una Infraestructura de Datos Espaciales de España (IDEE), que forma parte del plan estratégico del Instituto Geográfico Nacional (http://www.idee.es/show.do?to=pideep_pidee.ES). Por su parte, el área de Humanidades y Ciencias Sociales del CSIC está impulsando la creación de una Infraestructura de Datos Espaciales del CSIC (IDECSIC; http://sig.ieg.csic.es/documentos/ Borrador_Resumen_IDECSIC.pdf), con los siguientes objetivos: - La implantacion de las herramientas necesarias para servir la información geoespacial disponible en los distintos Centros del CSIC. - El desarrollo e implantación de un visualizador (Geoportal) para presentar los datos y generar los servicios OGC (Open Geospacial Consortium) adecuados. - La implicación de los Centros y grupos de investigación que dispongan de datos georeferenciados de interés común, para visualización desde el citado Geoportal de referencia o desde los suyos propios. En relación con la IDECSIC, el CSIC ha contratado licencias corporativas de diverso software de las empresas ESRI España y Leica Geosystems, y ha firmado un convenio con el IGN.
33
B. Conceptos básicos Los siguientes apartados proporcionan una breve introducción a conceptos y definiciones de uso geenral en relación con la gestión de datos.
B.1. Definiciones B.1.1. Datos Los datos son representaciones simbólicas (numérica, alfabética, imágenes, etc.) de atributos o características que describen sucesos y entidades. Los datos pueden consistir en mediciones y observaciones o bien ser derivados de modelos. La importancia de los datos está en su capacidad de asociarse dentro de un contexto para convertirse en información. Las Etiquetas de calidad (Quality flags) son indicadores alfanuméricos que se añaden a cada dato al final de un proceso de control de cualidad. B.1.2. Metadatos Metadatos es el término genérico que le damos a toda aquella información sobre el contexto, calidad, condición o características de un conjunto de datos, es decir, información sobre la propia información, datos sobre los datos, y tienen la finalidad de facilitar su tratamiento automatizado. Por lo tanto, los metadatos son descripciones estructuradas que están disponibles de forma pública para ayudar a localizar objetos. Ejemplo de datos y metadatos: Dato: Foto de una nueva especie de pez. Metadato: Localización del descubrimiento (latitud, longitud, profundidad), otras especies de la zona, salinidad y temperatura del agua, cantidad de individuos encontrados, etc. Los beneficios derivados de la utilización de metadatos son diversos: - Los metadatos adhieren contenido, contexto y estructura a los objetos de información. - Los metadatos permiten el intercambio de la información sin la necesidad de que implique el intercambio de los propios recursos. - Los metadatos permiten un acceso a los recursos en forma controlada ya que se conoce con precisión el objeto descrito. - Los metadatos permiten preservar los objetos de información permitiendo migrar (gracias a la información estructural) sucesivamente éstos, para su posible uso en un futuro. - Los metadatos son esenciales para sostener un crecimiento de una Web a mayor escala, permitiendo búsquedas, integración y recuperación del conocimiento desde un mayor número de fuentes heterogéneas. El fin último de los metadatos es el de convertir la información en algo accesible a nivel internacional, de manera que independientemente de la región, el idioma, el sistema operativo, la versión de navegador y demás factores cualquier tipo de información, pueda ser procesada de manera automática, favoreciendo su recuperación. B.1.3. Conjuntos de datos Un conjunto de datos es un grupo de datos individuales asociados y relacionados de acuerdo con un determinado criterio (perfiles verticales, campañas, experimentos).
34
B.1.4. Productos de datos Son conjuntos agregados o combinados de datos o metadatos (incluidos servicios a través de la web), poseedores de un valor añadido en relación con una aplicación determinada. B.1.5. Bases de datos Las más utilizadas son las bases de datos relacionales, que se define una base de datos como una serie de datos organizados en tablas y relacionados entre sí, que se almacenan sin redundancia para ser útiles en diferentes aplicaciones. Componentes principales de una base de datos: - Datos. Los datos son la Base de Datos propiamente dicha. - Hardware. El hardware se refiere a los dispositivos de almacenamiento en donde reside la base de datos, así como a los dispositivos periféricos (unidad de control, canales de comunicación, etc.) necesarios para su uso. - Software. Está constituido por un conjunto de programas que se conoce como Sistema Gestor de Base de Datos (SGBD o DMBS: Data Base Management System). Es un sistema con capacidad para definir, mantener y utilizar una base de datos. Ej: SQL-Server (Microsoft), Oracle Server (Oracle), MySQL (Open Source) o Microsoft Access (de menor tamaño). - Usuarios. Existen tres clases de usuarios relacionados con una Base de Datos: 1. El programador de aplicaciones, quien crea programas de aplicación que utilizan la base de datos. 2. El usuario final, quien acceda la Base de Datos por medio de un lenguaje de consulta o de programas de aplicación. 3. El administrador de la Base de Datos (DBA: Data Base Administrator), quien se encarga del control general del Sistema de Base de Datos. Características de un sistema gestor de bases de datos: - Los datos se organizan independientemente de las aplicaciones que los vayan a usar (independencia lógica) y de los ficheros en los que vayan a almacenarse (independencia física). - Los usuarios y las aplicaciones pueden acceder a los datos mediante el uso de lenguajes de consulta (p.ej. SQL, Query-by-example…). - Los datos se gestionan de forma centralizada e independiente de las aplicaciones. - Consistencia e integridad de los datos. - Fiabilidad (protección frente a fallos) y seguridad (no todos los datos deben ser accesibles a todos los usuarios).
B.2. Sistemas distribuidos y centralizados B.2.1. Centralizados En el modelo de sistema centralizado hay una máquina denominada servidor, que dispone de los recursos a compartir, al cual los demás ordenadores (denominados clientes) acceden para utilizar los recursos. B.2.2. Distribuidos Colección de servidores independientes que se encuentran físicamente separados y no comparten una memoria común, pero están enlazados por una red y equipados con un sistema de software distribuido y que de cara al usuario funcionan como un sistema único y centralizado. 35
Ventajas de los sistemas distribuidos vs centralizados: - Economía: Los microprocesadores ofrecen mejor relación precio/rendimiento que los mainframes (ordenadores centrales). - Velocidad: Tiene mayor poder de cómputo que un mainframe. - Distribución inherente: Aplicaciones en máquinas separadas geográficamente. - Confiabilidad: El sistema sobrevive a cualquier falla en una máquina. - Crecimiento por incrementos según las necesidades. Desventajas de los sistemas distribuidos vs centralizados: - Software: Hay poco software disponible para sistemas distribuidos. La administración es compleja - Redes: Se pueden saturar o causar otros problemas y la velocidad de propagación de la información puede ser lenta - Más problemas de seguridad - Mantenimiento más complejo - No existe una memoria global (cada nodo tiene su memoria local).
B.3. Modelos de datos Un modelo de datos es una serie de conceptos que se utilizan para describir un conjunto de datos y las operaciones para manipularlos, es decir, describe la estructura de un sistema de gestión de base de datos (SGBD) Un modelo de datos consiste en: - Objetos (entidades que existen y que se manipulan). - Atributos (características básicas de estos objetos). - Relaciones (forma en que enlazan los distintos objetos entre si). Hay dos tipos de modelos de datos: - los modelos conceptuales: disponen de conceptos cercanos a la forma en que los usuarios finales perciben una base de datos. - los modelos lógicos: disponen de conceptos que describen detalles sobre el almacenamiento de los datos en la computadora. En el diseño de bases de datos se usan primero los modelos conceptuales para lograr una descripción de alto nivel de la realidad, y luego se transforma el esquema conceptual en un esquema lógico. Clasificación de los modelos de datos Los modelos de datos sirven para clasificar los distintos tipos de SGBD. Existen diferentes modelos de datos para bases de datos: Modelos lógicos basados en objetos a) Modelo relacional-objeto: se basa en una percepción del mundo compuesta por objetos, llamados entidades, y relaciones entre ellos. Las entidades se diferencian unas de otras a través de atributos. b) Modelo orientado a objetos: también se basa en objetos, agrupados en clases, los cuales contienen valores y métodos, entendidos como órdenes que actúan sobre los valores.
36
Modelos lógicos basados en registros: estos modelos se usan para especificar la estructura lógica global de la base de datos, estructurada en registros de formato fijo de varios tipos - Modelo relacional: representa los datos y sus relaciones mediante tablas bidimensionales, que contienen datos tomados de los dominios correspondientes. - Modelo de red: está formado por colecciones de registros, relacionados mediante punteros o ligas en grafos arbitrarios. - Modelo jerárquico: es similar al de red, pero los registros se organizan como colecciones de árboles. El más extendido es el relacional, mientras que los otros dos existentes, jerárquico y de red, se encuentran en retroceso. Relaciones entre Sistemas de Información Científica (Scientific Information Systems) y Sistemas de Información Geográfica (Geographic Information Systems) Los formatos y modelos de datos pueden clasificarse también en función de la comunidad a la que sirven. Por un lado existen sistemas orientados a la comunidad científica de Ciencias de la Tierra (Scientific Information Systems) y, por otro, sistemas usados por la comunidad científica de los Sistemas de Información Geográfica (Geographical Information Systems o GIS). La progresiva convergencia de intereses entre ambas comunidades ha planteado la necesidad de integrar ambos tipos de sistemas, aunque el objetivo no es fácil debido a los problemas de operar con los diferentes formatos y herramientas de análisis que se han desarrollado en cada uno de esos sistemas. La necesidad de llegar a una interoperabilidad entre estas comunidades ha sido considerada por autores como Nativi et al. (2006). En la comunidad de las Ciencias de la Tierra se han desarrollado a lo largo de los años una serie de formatos y modelos de datos específicos (netCDF, HDF, BUFR, GRIB…), herramientas de acceso a estos datos (OpenDAP, ADDE…) y aplicaciones para trabajar con estos datos (Matlab, IDL). Por otro lado, la comunidad SIG ha trabajado tradicionalmente con formatos de datos (SHP, DWG, GeoTIFF…) y Sistemas de Gestión de Bases de Datos generalmente propietarios aunque recientemente está incoporporando estándares abiertos a través de los OGC Web Services. El ArcGIS Marine Data Model es un modelo de datos orientado a objetos para un amplio rango de datos marinos, como por ejemplo puntos, datos raster y series temporales. Incluye también información del instrumento que ha generado las observaciones, campañas, etc. El modelo está desarrollado en UML (Unified Modelling Language) e incluye metadatos.
B.4. Formatos de metadatos científicos Muchos formatos de metadatos se basan en XML (Extensible Markup Language). Es un lenguaje que cabe mencionar debido a que se ha utilizado en la definición de muchos de los formatos de metadatos. Este lenguaje se diseñó para mejorar la interoperatibilidad de la red, proporcionando un sistema de identificación de la información más flexible y adaptable. Del mismo modo que el lenguaje HTML, los datos en XML se identifican utilizando etiquetas (identificadores englobados en paréntesis angulares del tipo: <...>). Colectivamente, las etiquetas se conocen con el término inglés “markup”. A diferencia de HTML, las etiquetas XML se utilizan para describir los datos, y no como se visualizan. Así como en HTML una etiqueta puede indicar la visualización del texto en negrita (<b>...</b>), una etiqueta XML proporciona un descriptor del dato, por ejemplo, <cruise id>...</cruise>. El lenguaje se denomina extensible porque no tiene un formato predefinido (a diferencia de otros lenguajes basados en etiquetas, como HTML). XML es de hecho un “metalenguaje” —un lenguaje para describir otros lenguajes— que permite definir lenguajes propios adaptados a la descripción de diferentes tipos de datos y documentos (por este motivo ha sido utilizado ampliamente en la definición de metadatos). XML está escrito en SGML, el metalenguaje internacional estándar para sistemas de texto basados en etiquetas (ISO 8879). 37
Formatos usuales de metadatos científicos ISO 19115 es un estándar de metadatos geo-espaciales propuesto por la ISO/TC 211. Dentro de el estándar se ha definido un subconjunto reducido de metadatos debido a que algunos de los conjuntos de datos no requieren de la complejidad de las especificaciones del estándar. El ISO 19115 no especifica un formato concreto de almacenamiento aunque se han realizado algunos esquemas basados en XML para su implementación. CSDGM (Content Standard for Digital Geospatial Metadata) es el estándar de metadatos para objetos geográficos desarrollado por la FGDC (Federal Geographic Data Committee). El modelo de metadatos CSDGM es muy detallado aunque muchos de sus componentes son opcionales. Se pueden desarrollar perfiles específicos, adaptando el estándar a las necesidades particulares de una aplicación específica (manteniéndose dentro del estándar). El modelo CSDGM se ha utilizado ampliamente en U.S.A. y en menor grado en otros países. La FGDC ha desarrollado una una codificación del estándar en XML (DTD). Dublin Core Metadata es un estándar general para metadatos descriptores de recursos disponibles en la red. Fue desarrollado por la Dublin Core Metadata Initiative, un foro abierto para la definición y desarrollo de un estándar de metadatos en línea que soportara un amplio abanico de aplicaciones y modelos de negocio. El Dublin Core (DC) se está utilizando ampliamente para la documentación de fondos bibliográficos (artículos, libros y recursos similares) que son accesibles vía Internet. MarineXML. El desarrollo de Marine XML (también denominada MML) es una iniciativa de IOC/IODE para mejorar el intercambio de datos dentro de la comunidad marina. El proyecto europeo MarineXML EC contribuyó al proceso de “pre-estadarización” basada en XML. DIF (Directory Interchange Format) es un formato general de intercambio de información de conjuntos de datos científicos. DIF fue propuesto en una reunión de trabajo para la interoperatibilidad de catálogos que se realizó en febrero de 1987. Después de algunas exhibiciones, reuniones de trabajo y revisión por parte de la comunidad científica, el Directory Interchange Format (DIF) fue aprobado y adoptado formalmente por el CI Science Advisory Group en 1988. Desde entonces se ha utilizado ampliamente en sistemas de catalogación, entre otros, en el Global Change Master Directory (GCMD) para aplicaciones de Ciencias de la Tierra (inicialmente denominado NASA’s Master Directory (NMD)). DIF es un estándar para la creación de directorios descriptores de datos, y contiene una colección de campos en los que se detalla información específica de los datos. Seis de estos campos son obligatorios (identificador de la entrada del directorio, título, parámetros, centro de datos, resumen y autor del documento); el resto son opcionales y se utilizan para ampliar la información proporcionada. El Directory Interchange Format es compatible con el estándar CSDGM. Los datos DIF es almacenan en ficheros con formato ASCII. ANZLIC. La Spatial Information Council es una iniciativa conjunta de los gobiernos de Australia, Nueva Zelanda y de los Estados y Territorios de Australia. El estándar de metadatos ANZLIC define un conjunto de elementos de metadatos central, que debe especificarse para cada conjunto de datos. Los elementos centrales de ANZLIC se definen en el ANZMETA Document Type Definition (DTD). NcML (NetCDF Markup Language) define los metadatos para datos genéricos en formato NetCDF. NetCDF es un formato utilizado ampliamente en aplicaciones oceanográficas, entre las que se encuentra el programa ARGO . El Netcdf Metadata Object Model (NMOM) se desarrollo para datos genéricos en formato in NetCDF. Por ello, NcML se desarrolló de la forma más genérica posible y sólo incluye características que sean comunes para todos los datos en formato NetCDF. NcML está implementado en un esquema XML. IWICOS (Integrated Weather, Sea Ice and Ocean Service System) es una especificación de metadatos desarrollada durante el proyecto IST (2000-2002). La especificación de IWICOS es similar en estructura al estándar CSDGM , pero se han añadido algunos elementos adicionales para describir algunos de los tipos de datos met-ice-ocean desarrollados en el proyecto IWICOS. Las especificaciones de IWICOS se definen utilizando esquemas XML. Los datos son almacenados en ficheros separados en formatos BSQ, GRIB, Shapefile o XML.
38
B.5. Formatos de datos espaciales B.5.1. Mapas de bits y mallas SDTS (Spatial Data Transfer Standard) es un estándar para la transferencia de datos espaciales desarrollado por el USGC (U.S. Geological Survey). Es ampliamente usado en softwares desarrollados por ESRI, ERDAS y MapInfo entre otros. SDTS puede guardar datos raster (mapas de bits) y vectoriales así como metadatos (por ejemplo calidad de los datos). NetCDF (network Common Data Format) es una estándar de datos binarios desarrollado por el Unidata Program Center in Boulder, Colorado. NetCDF es un formato abstracto para matrices multidimensionales (orientada a vectores) y es muy utilizado como formato de entrada y salida de muchas aplicaciones GIS y en general para el intercambio de datos científicos. También puede registrar metadatos. HDF (Hierarchical Data Format) es un formato binario estructurado de múltiples objetos diseñado en el National Center for Supercomputer Aplications (NCSA) para facilitar la transferencia de datos. Los metadatos son registrados como atributos de las clases. GeoTIFF es un estándar de datos de domino público que permite que información georreferenciada sea encajada en un archivo de imagen de formato TIFF. La información adicional incluye el tipo de proyección, sistema de coordenadas, elipsoide, datum y todo lo necesario para que la imagen pueda ser automáticamente posicionada en un sistema de referencia espacial. El formato GeoTIFF es completamente compatible con TIFF 6.0, por lo que un programa informático incapaz de leer e interpretar esa información podrá aún así abrir el archivo de imagen GeoTIFF y visualizarlo como si de un archivo TIFF normal se tratara. B.5.2. Datos vectoriales S57 es un estándar del IHO (International Hydrographic Organization) para el intercambio de datos digitales hidrográficos. S57 se utiliza para la elaboración de Cartas de Navegación electrónicas (ENCs) pero también puede incluir datos útiles en otras áreas de aplicación. Los datos pueden ser guardados en ficheros ASCII o binario e incluyen metadatos. SDTS: descrito en el apartado B.5.1. Shapefile es un formato binario vectorial de almacenamiento digital donde se guarda la localización de los elementos geográficos y los atributos asociados a ellos. Carece de capacidad para almacenar información topológica. Desarrollado por la compañía ESRI actualmente se ha convertido en un formato estándar ampliamente utilizado por muchas aplicaciones, tanto comerciales como libres.
B.6. ESEOOXML El ESEOOXML es una especificación de XML desarrollada atendiendo a los objetivos de ESEOO con el fin de estandarizar el intercambio de información relativa a series temporales de datos entre distintos usuarios. Se trata de un lenguaje de marcado para documentos que almacenan una información de manera estructurada y jerarquizada, ideado para incorporar información auxiliar y almacenar metadatos. La definición del ESEOOXML consistió en establecer las etiquetas de marcado válidas y una estructura jerarquizada para los documentos (figura 8). Básicamente los documentos ESEOOXML constan de un elemento raíz llamado <ESEOO> en el que se “anidarán” los dos grandes paquetes de información. Por un lado, dentro del elemento <Head> irá toda la información que describa los datos que contiene el mismo documento (metadatos): unidades de medida, posición, origen, organismo generador, etc. Este elemento constituye la información “de cabecera” del documento. Por otro lado, la otra gran rama del documento ESEOOXML cuelga del elemento <Data>, que contiene el grueso de los datos numéricos. Los nombres de las etiquetas 39
Figura 8. Esquema de la estructura-árbol de las etiquetas de marcado válidas establecidas para la especificación ESEOOXML.
que contienen los datos indicarán la variable de la que se trata y están pensadas para poder incluir información de distintos registros temporales y de la calidad de los datos. La documentación que describe detalladamente el formato ESEOOXML está disponible en la página web: http://www.eseoo. org/intranet/menu_temas.asp. También se desarrollaron herramientas, todas ellas basadas en software libre, que permiten manipular y procesar documentos escritos en ESEOOXML. Estas herramientas son de dos tipos: de transformación, que permiten crear documentos ESEOOXML a partir de ficheros en otros formatos así como leer documentos ESEOOXML y transformarlos a otro formato, y de validación, que permite verificar que el documento cumple con la especificación ESEOOXML. Todas las herramientas y su documentación están disponibles en la página web de ESEOO (http://www.eseoo.org/intranet/menu_ temas.asp >> Software Disponible) Referencias Nativi, S., Domenico, B., Cron, J., Davis, E., Bigagli, L.- 2006. Extending THREDDS middleware to serve OGC community. Adv. Geosci., 8: 57-62.
40
C. Glosario ADDS Antarctic Data Directory System (SCAR) AMD Antarctic Master Directory BODC British Oceanographic Data Centre CCAD Commitee for the Coordination of Antarctic Data (SCAR) CNDP Centro Nacional de Datos Polares (España) COI Comisión Oceanográfica Intergubernamental de UNESCO (En inglés, IOC, Intergovernmental Oceanographic Commission) COMNAP Council of Managers of National Antarctic Programs CPE Comité Polar Español DIF Directory Interchange Format (SCAR) EMODNET European Marine Observation and Data Network ESEOO Establecimiento de un Sistema Español de Oceanografía Operacional DMAC IOOS Data Management and Communications (EEUU) DNA Designated National Agency GEO Group on Earth Observations GEOSS Global Earth Observation System of Systems GMES Global Monitoring for Envieonment and Security (UE) GOOS Global Ocean Observing System IBIROOS Iberia Biscay Ireland Operational Oceanography System ICES International Council for the Exploration of the Sea ICSU International Council for Science IDE Infraestructura de datos espaciales IDECSIC Infraestructura de datos espaciales del CSIC IDEE Infraestructura de datos espaciales de España IDN International Directory Network (SCAR) IFREMER Institut français de recherche pour l’exploitation de la mer IGME Instituto Geológico y Minero de España IGN Instituto Geográfico Nacional (España) IOC Intergovernmental Oceanographic Commission (UNESCO) IODE International Oceanographic Data and Information Exchange ISI Ingénierie des Systèmes InformatiqueS (Francia) IOOS Integrated Ocean Observing System (EEUU) JCADM Joint Committee on Antarctic Data Management (SCAR) JCOMM Joint WMO/IOC Tehcnical Commission for oceanography and Marine Meteorology JRC Joint Research Laborarory (UE) NADC National Antarctic Data Centre NOAA National oceanographic and Atmospheric Administration (EEUU) NODC National Oceanographic Data Centre OGC Open Geospacial Consortium SAIDIN Satellite Image database Interface (CSIC) SCOR Scientific Committee on Oceanic Research SCAR Scientific Committee on Antarctic Research SDC Centros de Datos de Satélite SeaDataNet A Pan-European Infrastructure for Ocean and Marine Data Management SGBD Sistema de gestión de base de datos SISMER Systèmes d’Informations Scientifiques pour la Mer (Francia) UNEP United nations Environmental Programme WMO World Meteorological Organisation WDC World Data Centre 41
D. Miembros del grupo de Trabajo Participantes Estrada, Marta (coordinadora, SCOR-España), Institut de Ciències del Mar (CSIC), Barcelona Álvarez, Enrique, Puertos del Estado, Madrid Barragán Antonio, Instituto Geológico y Minero de España, Madrid Bermúdez, Óscar, Instituto Geológico y Minero de España, Madrid García, Mª Jesús, Instituto Español de Oceanografía, Madrid Lavín, Alicia (SCOR-España), Instituto Español de Oceanografía, Santander Masqué, Pere (SCOR-españa), Institut de Ciència i Tecnologia Ambientals, Universitat Autònoma de Barcelona, Bellaterra Pérez, Fiz F., Instituto de Investigacións Mariñas (CSIC), Vigo Piera, Jaume; Unitat de Tecnologia Marina, CMIMA (CSIC), Barcelona
Colaboradores Chic, Òscar, Institut de Ciències del Mar (CSIC), Barcelona Díez, Susana, Unitat de Tecnologia Marina, CMIMA (CSIC), Barcelona
42