Sean bienvenidos todos aquellos enamorados de la Información Geográfica.
Hemos nacido en un mundo geoespacial, la información de éste tipo es imprescindible en nuestra vida y por ello es tan variada y abundante.
Aquellos que la producen, aquellos que nos dedicamos a la información en general, debemos estudiar y aplicar la mejor forma de describirla y ponerla al servicio del público en general.

jueves, 28 de octubre de 2010

I CONGRESO URUGUAYO DE INFRAESTRUCTURA DE DATOS ESPACIALES CONTRIBUYENDO AL DESARROLLO DE UNA RED REGIONAL

Para todos aquellos a quienes he podido ayudar, a través de estas páginas reproduzco mi ponencia en el Primer Congreso IDE Uruguay, celebrado el 25 y 26 de este mes en Montevideo:

METADATOS GEOGRÁFICOS, HERRAMIENTA FUNDAMENTAL PARA LA BÚSQUEDA Y RECUPERACIÓN DE LA INFORMACIÓN GEOGRÁFICA

RESUMEN
La conformación de una IDE implica el compartir la información geo-espacial. Debemos saber qué produce quién y cómo acceder a ésta información para evaluar los datos a los efectos de su correcta reutilización. Se analizan los conceptos, normativa y procedimiento de Generación de Metadatos Geográficos. El SGM trabaja desde el año 2004 en la confección de metadatos, transitando en estos años el camino desde el estándar FGDC, al ISO 19115, optimizando y simplificando la producción de Metadatos desde un proceso de cuatro pasos a uno de tres etapas, desde un producto correspondiente a la web 1.0, hasta un buscador web 2.0.
Palabras – clave: Metadatos Geográficos

Objetivos
La presente disertación está destinada a brindar a los oyentes bases teóricas y prácticas sobre la confección de Metadatos Geográficos, dando a conocer la experiencia adquirida por el Servicio Geográfico Militar en la materia.

1. Generalidades, conceptos y normativa sobre Metadatos Geográficos

La información geográfica es vital para la toma de decisiones tanto a nivel local como nacional regional o global. Este es un recurso costoso, por lo que debemos optimizar su aprovechamiento.

Existen datos dispersos, múltiples, que se superponen y de ésta realidad surgen los proyectos IDE: debo conocer que-produce-quien, como produjo los datos, como me contacto para obtenerlos. Para construir una IDE, no basta con crear un gran repositorio de datos geo – espaciales, debo también poder acceder a ellos para su explotación.

La cantidad de datos que se crean y almacenan es siempre creciente por lo que es necesario contar con una buena descripción y un buen sistema de recuperación de los datos. La Bibliotecología nos aportó, en su visión tradicional, una descripción bibliográfica estandarizada. Se creó normativa internacional para el intercambio de registros bibliográficos, incluyendo los mapas: ISO 690, ISBD. Con el surgimiento de la web, fue necesario establecer otras formas de descripción y surgieron los Modelos y estándares de descripción bibliográfica para la WWW. Esto es estándares y formatos de metadatos.

Internet es una fuente inagotable de recursos. La popularización del entorno WWW trajo un crecimiento exponencial de la información, y así, el Universo de Información se presenta: Distribuido, Heterogéneo, Cambiante, Dinámico, Poco uniforme y Disperso

Nos encontramos así con:
• Grandes cantidades de información.
• Mezcla de recursos de alta calidad o profesionales con sitios informales, personales, de información poco fiable, etc.

Está desarrollada como un “escaparate” para atraer clientes.

En la WWW no podemos hablar de libros ni de documentos, sino de documentos entendidos como Objetos de Información Digital (OID). Llamaremos OID a Cualquier unidad informativa (texto, imagen, sonido, vídeo, etc.) en un formato de codificación numérica, para cuyo acceso son imprescindibles medios informáticos, es un Objeto de Información Digital. Técnicamente, están constituidos por su propio contenido (conjunto de bits), las propiedades o metadatos asociados a él y un registro de operaciones realizadas.

Las colecciones de datos y documentos digitales tienen la característica de ser: Grandes y diversas, Numerosas y Efímeras (cambian rápidamente)

Esto se aplica a todo tipo de información, y por tanto también a la información geo-espacial.

Para conformar la IDE hablamos de compartir la información, de construir nuestro conocimiento a partir del ya generado, ahorrando costos y TIEMPO. Necesitamos entonces una descripción más detallada que la que nos brindan los estándares y formatos bibliográficos, necesitamos poder evaluar cabalmente un recurso antes de adquirirlo.

En respuesta a éste problema surge la creación de Metadatos, como forma de descripción de la Información Geo-espacial y centrándose en la evaluación y recuperación de los datos.

¿Qué son los metadatos?
• Datos sobre otros datos. Datos sobre documentos, servicios, páginas web...
• Descripciones estructuradas de un objeto de información.
• Un conjunto de elementos y atributos para caracterizar la información.
• Estándares semánticos para describir objetos de datos discretos.

En definitiva los Metadatos son Datos, almacenables en Bases de Datos que describen el contenido o información de un documento o una página servicio web.

Los datos son una abstracción de la realidad, es decir, describen o modelan el mundo real y los metadatos expresan el modelo o abstracción de la realidad, sus reglas, convenciones y características.

¿En qué nos ayudan los metadatos?

Los sistemas informáticos utilizarán información estructurada de forma mucho más eficaz.
Permiten diferenciar la calidad de los recursos.
´
Y… ¿Para qué necesitamos los Metadatos?
• Para describir la información existente. Para organizar el conocimiento.
• Para poder encontrar y utilizar dicha información.

¿Por qué?
• Porque el entorno Web posee grandes cantidades de información en formato electrónico.
• Porque existe la necesidad de aunar recursos en la Web.
• Porque existe la oportunidad de proporcionar a los profesionales servicios de calidad.

Los Metadatos nos permiten: Recuperar recursos, Administrar documentos, Gestionar derechos, Valorar de contenidos, Proporcionar seguridad y autentificación, Conocer el estado de los archivos, Conocer productos y servicios, esquemas de bases de datos, control o descripción de procesos

Nos ayudan a organizar y mantener la inversión en datos de las Organizaciones, brindándonos la información en forma de catálogos estandarizados. Gracias a ellos es posible conocer la existencia de los diferentes conjuntos de datos, y pueden localizarse aquellos que están disponibles, evaluando cuáles son relevantes para nuestras actividades. La redacción de metadatos descriptivos, fomenta la disponibilidad y uso de los datos más allá del ámbito o disciplina en que fueron creados. También son una buena forma de promoción de los datos creados por una institución.

Los Metadatos Geográficos son los recursos que nos permiten la descripción, clasificación y recuperación de la información Geoespacial, y por lo tanto constituyen, conjuntamente con los Datos, uno de los componentes fundamentales de la Infraestructura de Datos Espaciales (IDE).

Pero para que esto se cumpla, los metadatos deben ser normalizados y surgen diferentes estándares, aplicables según el tipo de Documento Electrónico de que se trate:
Metadatos de propósito general: MARC y Dublin Core
Metadatos de información geo-espacial: FGDC, ISO 19115…

Clasificación de Metadatos:
Los metadatos pueden clasificarse, y tendrán diferente extensión, según los objetivos que se persigan en la tarea de su creación. Pueden definir tres niveles de alcance:

• Descubrimiento o Búsqueda: que nos permiten saber qué datos existen, cuales hay disponibles de cierta zona o tema determinado, a cierta escala escala, fecha u otras características específicas que el usuario demanda.
• Exploración o Elección: Permiten comparar distintos conjuntos de datos entre sí, de modo que se pueda seleccionar cuáles cumplen lo que necesitamos de forma más adecuada.
• Explotación o Utilización: Proporcionan todas las características técnicas de los datos, nos dan información sobre la calidad de los mismos.

Cada uno de estos tipos de metadatos requiere un nivel determinado de información y no debe considerarse que éstos sean los únicos niveles de información existentes. Cada nivel es tal que el más sencillo está incluido en el más complejo

Los Metadatos de descubrimiento proporcionan un mínimo de información que permite conocer la naturaleza y contenido de la fuente de datos. Debemos considerar que ésta información será común a todos los niveles de metadatos, pues constituyen el “cuore” o corazón de la norma.

Responden preguntas como:

• ¿Qué? Título y descripción del conjunto de datos.
• ¿Por qué? Razones de creación de los datos y sus usos.
• ¿Cuándo? Fecha de creación y actualización (si corresponde) de los datos
• ¿Quién? Origen, productor de los datos.
• ¿Dónde? Extensión geográfica basada en latitud/longitud, coordenadas geográficas, nombres geográficos, áreas administrativas.
• ¿Cómo? Cómo se crearon y cómo se accede a los datos

El nivel de detalle de los metadatos a documentar depende en parte del tipo de datos que se tenga, de los métodos de acceso y uso y de las políticas institucionales.

Las organizaciones, según sus propósitos, gestionarán sus metadatos como un Conjunto de Datos (por ejemplo una Serie, el Mapa, la capa) o llegando, incluso al objeto mismo, pero sigue existiendo un alto grado de compatibilidad entre los niveles de metadatos que se requieren. En general, la mayoría de los Metadatos se recogen a nivel de conjunto de datos.

Los Metadatos de exploración nos dan información que permite al usuario estar seguro de que datos existen, apropiados para determinado proyecto, conocer sus propiedades y con quien contactarse para obtenerlos.

Los Metadatos de explotación nos dan información sobre el acceso, transferencia, carga, interpretación y uso de los datos en la aplicación en que serán explotados. Incluyen detalles del Diccionario de Datos, su organización y esquema, proyección, características geométricas y otros parámetros útiles para el buen uso de los datos geo-espaciales. Podemos así, descubrir, valorar y obtener los datos.

Como dice Blanca Ruiz Franco, Jefe de Área de Banco de Datos de la Naturaleza de España, (Blanca Ruiz Franco, s.f.) “Los metadatos importantes son aquellos detalles difíciles de inferir desde los propios datos”, y en ello se diferencia la catalogación por Metadatos de la catalogación tradicional de la Bibliotecología.

Con el fin de economizar tiempo, debemos poder compartir la descripción y catalogación por Metadatos, de forma que cada institución productora de información, realice sus metadatos y los comparta con el resto de la comunidad de grandes usuarios.

Parte de la información que integran los Metadatos, puede recogerse en forma automática y para que esto sea posible, los Metadatos deben construirse según estándares y formatos específicos.

El estándar más difundido respecto a Metadatos Geográficos es el ISO TC211 19.115.

Los estándares nos definen contenidos y no formas de almacenamiento. Especifican métodos, herramientas y servicios para la gestión de los datos; incluyen definiciones y descripciones, adquisición, procesamiento, análisis, acceso, presentación y transferencia de datos digitales desde diferentes usuarios, sistemas y ubicaciones.

¿Qué elementos integran un metadato?

Según una clasificación funcional:

• Descriptivos: Título, autor, materias, etc.
• Administrativos: Fecha del recurso, número de recurso, etc.
• Conservación y Derechos: Copyright, privilegios de uso, etc.
• Técnicos y estructurales: Tipo de archivo, tamaño del archivo, etc.
• Uso y gestión del sistema: Metadatos internos del creador de la meta-información. Especificidades de gestión.

Los elementos de metadato podremos clasificarlos en:

Dependientes del recurso: Modelos semánticos de representación de las características básicas de un ODI

Dependientes del contenido: Modelos de representación de las materias y de las relaciones entre ellas (Tesauros, ontologías, etc.).

Es fundamental y necesario que los Datos Geográficos que se brindan a través de los Geoportales de las IDE estén catalogados de forma normalizada para optimizar la búsqueda de la Información Geográfica disponible, permitiendo además que el usuario pueda consultar cuales son los datos que mejor se ajustan a sus requisitos.

Normativas:
En cuanto a las normativas más empleadas:
El Doublin Core es un modelo de metadatos se basa en el Marco de Descripción de Recursos para la web y se define por la norma ISO 15836 del año 2003, y la norma NISO Z39.85-2007. Es un estándar apto para todo tipo de documentos electrónicos, pero resulta muy elemental a la hora de describir información geo-espacial.

Desde el desarrollo del estándar ISO 19.115, éste ha sido el más difundido a nivel internacional para la información que nos interesa. Su Objetivo es proporcionar una estructura para describir los Datos Geo-espaciales. Define elementos de metadatos, proporciona un modelo y establece un conjunto común de terminología, definiciones y procedimientos de ampliación para los metadatos. (Figura 1)

Establece metadatos de propósito general en el campo de la información geográfica y proporciona información sobre la identificación, extensión, calidad, modelo espacial y temporal, referencia espacial y distribución de los datos geográficos. Es aplicable a Catalogación de datos, Actividades de geo-portal, Descripción completa de los conjuntos de datos geográficos, Series de conjuntos de datos y Objetos geográficos individuales y sus propiedades.

En Julio del 2003 se aprobó la primera versión como norma internacional. Es una Norma que consta de 140 páginas, 409 elementos, 27 listas controladas.

Se presentan en paquetes UML. Cada paquete contiene una o más entidades (clases UML), que pueden ser particularizadas (subclases) o generalizadas (superclases).

Las entidades contienen elementos (atributos) que identifican las unidades discretas de metadatos y pueden relacionarse con una o más de las otras entidades, pueden estar agregadas y repetirse tanto como sea necesario para satisfacer las necesidades de la descripción.

Esta Norma es muy compleja, pero entre sus elementos encontramos algunos que son obligatorios, otros condicionales, que deberán registrarse cuando los datos cumplen cierta condición, y otros opcionales. Cada comunidad determina un “Perfil” de la Norma que se adapta a sus necesidades y le resulte más sencillo de entender.

El Núcleo o Core de la Norma, está compuesto por 22 elementos, 7 obligatorios y 15 elementos que se dividen en opcionales y condicionales.

Metadato en ISO 19.115:
Se compone de
• Datos de Identificación (OBLIGATORIOS):
- Datos para la cita del recurso (título, autor, edición, serie a que pertenece…)
- Fechas y estado
- Descripción
- Representación Espacial
- Restricciones
- Contactos
• Datos de Distribución (CONDICIONAL, según corresponda si hay transferencia en línea o algún distribuidor o método de distribución específico), proporciona:
- Formato
- Medios
- Distribuidor
• Datos sobre la Calidad de los Datos (OBLIGATORIO) Nos brinda:
- Tipo, método y resultado de la medida de una evaluación de la calidad de los datos.
Linaje y proceso de obtención del Dato.
• Datos del Metadato (OBLIGATORIO)
- Autoría
- Punto de Contacto
- Fecha

Con respecto a quien debe crear los metadatos, El Recetario IDE, 2001 dice “Crear Metadatos correctos es como aplicar la catalogación de una biblioteca excepto que es necesario tener más información científica acerca de que hay detrás de los datos para documentarlos apropiadamente” (El Recetario IDE, 2001).

La confección de un metadato exitoso es una tarea interdisciplinaria. Por un lado debe intervenir el creador de los datos, aportando la información necesaria, y por otro el documentalista, que es quien tiene los conocimientos necesarios para hacer una descripción correcta.

Por ello, la confección de un metadato exitoso es una tarea interdisciplinaria. Por un lado debe intervenir el creador de los datos, aportando la información necesaria, y por otro el documentalista, que es quien tiene los conocimientos necesarios para hacer una descripción correcta.

Pasos para la creación de Metadatos Geográficos
Al crear los Metadatos institucionales, debemos seguir ciertos pasos y tomar algunas decisiones:
• Definir exactamente que datos serán documentados
• Seleccionar un perfil de la Norma que se adapte a nuestras necesidades
• Compilar la información sobre el conjunto de datos
• Crear el archivo o repositorio digital que contendrá los datos ordenados adecuadamente para su consulta y recuperación, es decir una Base de Datos
• Verificar que la información obtenida describe a los datos correcta y completamente

Recordemos que los diferentes estándares y normas lo son de contenido, es decir que no nos indican la disposición de los metadatos en los archivos de la computadora, tampoco nos indica como será el formato de salida o ingreso de los metadatos, solamente la información que debe contener.

Nos enfrentamos así a dos opciones: crear una Base de Datos, según nuestras necesidades y algún mecanismo que verifique el llenado de los campos obligatorios, o recurrir a uno de los Editores de Metadatos, libres o propietarios, que hay disponibles, lo que constituye la opción más eficiente.

Existe un número considerable de Editores de Metadatos Geográficos, por lo que, a la hora de seleccionar una herramienta de catalogación deberán considerarse los siguientes aspectos:
• Estándares empleados para la implementación de metadatos.
• Facilidad para establecer los perfiles documentales que la Institución considere necesario.
• Interfase amigable para el usuario.
• Ser multilingüe.
• Plataforma de desarrollo a utilizar.
• Enlace con Sistemas de Gestión de Base de Datos (DBMS).
• Si la herramienta fue diseñada para servicios web o es únicamente de escritorio.
• Confiabilidad y soporte técnico.
• Costos.

Algunos de estos editores son:
• Herramientas y software libre: Geonetwork, CatMDEdit, MetaD, IME (INTA), M3Cat, Balance
• Herramientas propietarias: ArcCatalog, Geomedia Catalogue
Cada uno presentando sus diferentes características y dificultades

La experiencia del Servicio Geográfico Militar
El SGM comenzó a trabajar en el tema a partir del año 2004, con un equipo formado por dos personas y con el objetivo de desarrollar un modelo de Metadatos Institucional y confeccionar aquellos que corresponden a la Cartografía Analógica desarrollada por la Institución hasta ese momento.
¿Cuál fue la evolución de las tareas de este equipo?

En el año 2005 se trabajó sobre los estándares ISO 19.115 y FGDC, optando por éste último, pues ofrecía, en aquel momento, un mayor desarrollo y existían Editores ya desarrollados. Se confeccionaron los primeros modelos de Metadatos y se realizó la colecta de los datos necesarios para cumplir los objetivos del 2004.
Se optó por el Software tkme, que desarrolla metadatos en el estándar FGDC, versión STD-001-1998 como editor de Metadatos y un nivel de exploración.

En el año 2006 se desarrolló el Servidor de Metadatos en base a software open source sobre plataforma Linux, con el Protocolo: Z39.50 (ISO 23950), para el sistema indexador y herramientas de comunicación.
Se logró la puesta a disposición en Intranet de los primeros Metadatos.

Para el 2007 se habilitó en INTERNET, la consulta al Servidor de Metadatos por parte de los Usuarios y se analizó la migración al Formato ISO 19115.

En el año 2008, se encontraban en el Servidor, los Metadatos correspondientes a la cartografía analógica en Escalas: 1:20.000 (Carta de 1920), 1:25.000, 1:50.000, 1:100.000 y 1:200.000

¿Cómo era el proceso de generación de estos Metadatos?
1. Colecta de Datos: del propio documento y de los antecedentes del trabajo. En este paso intervienen directamente los productores de la información
2. Creación de la plantilla: generada por los Gestores del Servicio de Catálogo, sobre ella el productor de los datos volcará la información necesaria.
3. Se transfieren los metadatos generados al Gestor del Servicio de Catálogo, que verifica su exactitud, sintáxis y los complementa.
4. Se envían al Administrador del Catálogo, para su inclusión en el Servidor de Metadatos.

Actualmente el Servicio se encuentra en pleno proceso de migración al estándar ISO.

A partir de Mayo del corriente año se encuentra disponible un nuevo buscador de Información Geográfica, desarrollado con el software Geonetwork, que nos permite integrar, en un mismo buscador, metadatos en diferentes estándares, de forma que no solamente se accede a la información sobre cartografía actualmente en uso, sino también, al fondo bibliográfico de nuestra mapoteca - biblioteca, al Diccionario Geográfico de Orestes Araujo, 2da. Edición y a fotografías patrimoniales de la Institución. A través de éste nuevo buscador, comenzamos nuestra incursión en la web 2.0.

Con el cambio de tecnología, el proceso de generación se ha simplificado:
Se realiza la colecta de datos por parte de los productores de información, de la misma manera que en el proceso anterior, pero la confección del Metadato en sí, es realizada por los operadores de Metadatos y el Gestor del Servicio de Catálogo, trabajando directamente sobre el Servidor de Internet, con lo que en solamente dos pasos se llega a la publicación.

Un punto que siempre se discute al hablar de Metadatos, es acerca de quien debe confeccionarlos. Nuestra experiencia en la creación de Metadatos nos ha demostrado que la mejor forma es a través de un equipo que integre especialistas en Documentación y productores de Información Geo-espacial.

Conclusiones
Llegada la hora de instrumentar un servicio de metadatos, no existe una única solución. Las necesidades de cada institución marcarán el nivel de información que tendrán los metadatos de sus datos geo-espaciales. Es importante, sin embargo, llegar a un entendimiento, para que la información brindada satisfaga las necesidades de los usuarios de la información.

La normalización internacional nos lleva a que la mejor opción es adoptar perfiles de la Norma ISO 19.115.

La experiencia recogida por el SGM, a lo largo de seis años de trabajos, nos indica que la mejor manera de instrumentarlos es a través de un equipo interdisciplinario


Referencia Bibliográfica
GSDI (2001) “The SDI Cookbook”, versión 1.1, [s.l. : s.n.]
RUIZ FRANCO, Blanca (s.f.) I. D. E. “Nuevas exigencias y aportaciones desde el Medio Ambiente: Los Metadatos, primer paso en la creación de una I. D. E.” [Presentación digital en la Jornada I. D. E. Murcia]

Bibliografía
BRAVO COMERÓN, María José ; RODRÍGUEZ ALCALÁ , Carlos. “La Documentación y el Doublin Core” [Presentación digital en Curso de Infraestructura de Especialista en Infraestructura de Datos Espaciales, UPM]. – Madrid : Latingeo, 2010