Sean bienvenidos todos aquellos enamorados de la Información Geográfica.
Hemos nacido en un mundo geoespacial, la información de éste tipo es imprescindible en nuestra vida y por ello es tan variada y abundante.
Aquellos que la producen, aquellos que nos dedicamos a la información en general, debemos estudiar y aplicar la mejor forma de describirla y ponerla al servicio del público en general.

miércoles, 18 de julio de 2012

Desarrollo de Ontologías para la IDE – Uruguay desde la Teoría de la Información

Introducción
1.        Las Ontologías

Introducción:
Para hablar del desarrollo de Ontologías para la IDE – Uruguay, se debe comprender primero que es una IDE:
Una IDE es un marco básico, una infraestructura que proporciona acceso y facilita la utilización de la Información Geográfica. Se compone de un conjunto de tecnologías, políticas y acuerdos institucionales destinados a facilitar el acceso a la información espacial y se traduce en una serie de servicios brindados a través de la web, entre los que se destaca el servicio de Catálogo por Metadatos. En la medida en que es capaz de proporcionar respuestas, es un Sistema de Información Geográfica que se desarrolla sobre la web. 
Con el desarrollo de la Geomática, cada usuario se ha transformado en un productor de Información Geográfica y esto no sólo trajo un crecimiento exponencial en la creación de este tipo de información, sino que transformó, a una información ya de por sí estratégica, en un insumo imprescindible para la toma de decisiones tanto a nivel de Estado como comercial.
Al observar la Información Geográfica desde diferentes paradigmas aplicados al concepto de Información y explorar la evolución del término ontología para comprender el sentido que tiene este concepto en la informática, lleva a ver la relevancia que toma la hermenéutica de la colección mencionada por Capurro, en el desarrollo de los Sistemas de Información para la recuperación de ésta.

1.        Las Ontologías
¿Qué entendemos por una Ontología?
Se debe tener en cuenta la evolución del término desde que se empleara por primera vez en el Siglo XVII el término griego Ontologia por Rudolf Goclenius en su “Lexicon philosophicum quo tanquam clave philosophia de ente”, o como la transcripción latina empleada por Calvino, en su Metafísica Divina, y que se refiere la Metafísica como una disciplina general de carácter “formal”. 
El término recién se popularizó con Wolf en 1730, para quién la ontología es tal que emplea un método demostrativo (racional y deductivo) para investigar los predicados más generales de todos los entes, siempre destacando el carácter primario de esta ciencia. En un principio presentaba dos significados, por un lado considerada como metafísica o ciencia de la realidad o de la existencia en el sentido más propio del vocablo, significado que, como algunos autores señalan, debe abandonarse, y por otro designaba al estudio de todas lo que afecta al conocimiento de los “géneros supremos de las cosas”.
Para la llamada Escuela de Leibniz – Wolf se trataba de la primera ciencia racional por excelencia. Su objetivo era la determinación de aquello en lo cual los entes consisten y aún del ente en sí: una teoría formal de los objetos.
Ya, en el Siglo XX, Husserl establece dos clases de ontologías: una ontología formal que trata de las esencias formales que conviene a todas las esencias y una ontología material que trata de las esencias materiales y que constituye un conjunto al que él llama ontologías regionales.
Feibleman presenta una ontología finita o positivismo ontológico, el cual se trata de postulados de carácter formal capaces de constituir una red conceptual que capture la realidad. La ontología se entiende así como una construcción en la cual adquieren sentido conceptos metafísicos tales como realidad, esencia y existencia.
Para Stanislaw Lesniewski, ontología es la teoría y cálculo de clases y relaciones y Quine, a su vez, distingue la semántica, o teoría del significado, que incluye entre sus conceptos, además del significado, sinonimia, significación, analiticidad e implicación, y la teoría de la referencia, que incluye conceptos como “nombramiento”, “verdad”, “denominación”, “extención” y “valores de las variables “.
Genesereth y Nilsson (1987) se refieren a la ontología como el conjunto de conceptos y relaciones entre conceptos que son relevantes en un dominio o una aplicación.
De estas nociones se llega a la conceptualización que del término tiene la disciplina informática, donde adopta connotaciones particulares muy distanciadas del concepto filosófico.
La definición más citada es la de Gruber  de 1993 (SANZ, JIMENEZ – RUIZ, 2007):
“Una conceptualización es un extracto, una vista simplificada del mundo que deseamos representar para un cierto propósito. Cada base de conocimiento, cada sistema basado en el conocimiento, o agente del nivel del conocimiento está confiada a una cierta conceptualización, explícitamente o implícitamente. Una ontología es una especificación explícita de una conceptualización. El término se pide prestado de la filosofía, donde se aplica a una ontología sistemática de la existencia“.
Borst (1997) en “An ontology is a formal specification of a shared conceptualization”, clarificó esta idea enfatizando dos conceptos:
-           La ontología es conocimiento compartido, fruto del consenso dentro de un grupo.
-           Una ontología debe ser especificada usando un lenguaje formal, que pueda ser procesado por ordenadores y no sólo por personas

En definitiva, el concepto de una ontología en informática es el de una herramienta útil para un propósito, un dominio o una aplicación concreta. Es decir, cuando hablo de desarrollar una Ontología, me refiero a desarrollar un lenguaje formal para representar cierto conocimiento, las relaciones entre sus conceptos, significado de sus términos, en este caso el que se refiere a la Información Geográfica, que sea común a todos los actores participantes de la Infraestructura de Datos Espaciales de Uruguay y de forma tal que éste lenguaje pueda ser “leído por máquinas”.
Leyendo a Luciano Floridini (2012), la información y el conocimiento constituyen una misma familia conceptual, donde las relaciones entre ambos permiten que uno se explique por el otro. Sin esta relación lo que se obtiene es una cantidad de datos o partes de información que no permiten captar el sentido de la realidad que tratan de expresar. Reconstruyendo la red de relaciones, alcanzamos una información semántica que hace posible el conocimiento.
Lo que se intenta, con el desarrollo de ontologías para la web, es añadir semántica a esos “trozos” de información dispersos, reconstruir la red de relaciones que hagan posible el conocimiento.
El concepto moderno del manejo de la Información Geográfica se centra en la capacidad del computador de almacenar y relacionar información espacial diversa.
Se calcula que un 80% de la información que generan las instituciones públicas y privadas tiene una componente espacial, es decir que es Información Geográfica. La mayoría de esta información es de carácter digital y se halla diseminada en la web. En este hecho, junto al desarrollo del uso de Internet y la búsqueda automática de información, se ancla en la importancia que adquiere la descripción y representación normalizada de la información a favor de su recuperación. Internet solamente puede poner a disposición nuestra, aquello que ha sido puesto al alcance de sus buscadores.

2.        La Información Geográfica y su manejo
Intuitivamente, y antes de realizar cualquier investigación, la información geográfica es un tipo de información que se relaciona a características de algo físico asociado a un par de coordenadas, es decir a un lugar determinado. Se trataría de una concepción física: la información como objeto.
La información es en sí un acto de comunicación de transmisión de un conocimiento a alguien. En este sentido el punto de partida es la Teoría Matemática de la Comunicación de Shanon (1948), donde se alude a la noción de información como mensaje. Es esta una teoría de la codificación y transmisión de un mensaje, pues se refiere a la cantidad de selecciones posibles entre el grupo de mensajes posibles. En esta teoría Shanon estudia la transmisión de los mensajes dejando de lado los aspectos semánticos y pragmáticos característicos de los sistemas sociales en que se basa el uso moderno del término.
La ingeniería, y en particular la informática, ubican la noción de información en forma independiente del ser humano. Los procesos informativos artificiales están basados en la tecnología digital.
Stoiner distingue entre información y sentido, siendo el “mensaje” el concepto subyacente. Para él la información transmitida adquiere sentido recién cuando es procesada por un receptor.
Si excluimos, como en la Teoría de Shanon, los aspectos semánticos y pragmáticos, los procesos de selección, humano y no humano, son  idénticos, difieren en el tipo de interpretación.
¿Y si lo miramos la Información Geográfica desde el punto de vista de la teoría del mensaje? Partimos de un mensaje que encontramos en internet del cual nos apropiamos, modificamos y devolvemos transformado.
Los productores y los usuarios menores comparten sus documentos geoespaciales a través de un portal de Internet y de redes internas, se transforma en un nuevo mensaje que es compartido con los demás a través del portal de la IDE.

Como dice Capurro, en “La Hermenéutica y el fenómeno de la Información” (1986), con el abandono de la primacía de la racionalidad científica en la modernidad, “la información es considerada como teniendo un carácter fragmentario o admitiendo parcelación. La fragmentación tiene dos caras. Al reducir el conocimiento en trozos, al destrozarlo, el contexto original desaparece o se vuelve tácito. El conocimiento se transforma literalmente en parcial, dependiente de 'pre-juicios' o del sistema de referencia del conocedor”…”El conocimiento moderno es algo común, compartido por una comunidad, por ejemplo por una comunidad científica”. 
Las IDE cuentan con muchos actores y de muy diversas características, entre aquellos que producen la información y aquellos que la consultan (arquitectos, ingenieros, informáticos, especialistas ambientales, geógrafos, economistas), quienes investigan la sociedad y quienes toman decisiones en ella.
A mi entender, lo primero es ver cuál es el concepto  de información geográfica que aúna a este grupo ¿hay una definición común en un grupo tan diverso?
En una primera tentativa se consultó a quince representantes de las instituciones participantes de la IDE Uruguay respecto al concepto que manejaban de Información Geográfica (se recibieron únicamente cuatro respuestas, de actores de formaciones diferentes: Ingeniería Civil, Informática, Bibliotecología, Geógrafo):

Ingeniería Civil
INFORMACIÓN GEOGRÁFICA: toda aquella susceptible de asignársele algunas coordenadas espaciales, conformando puntos, poligonales o áreas.”

Bibliotecóloga
“INFORMACIÓN GEOGRÁFICA, Sistema de: Medio informatizado para el registro, control, procesamiento, integración, evaluación y modelado de información alfanumérica y cartográfica referida a un área territorial.” DINOT, MVOTMA. Ordenamiento territorial: definiciones básicas. Montevideo: DINOT, 1995. p. 8

“INFORMACIÓN GEOGRÁFICA: Información que puede ser relacionada con una localización específica en la tierra.” GAVIRONDO, Miguel. Curso de Sistemas de Información Geográfica. Montevideo: Departamento de Geomática. Instituto de Agrimensura. FIng. UdelaR, 2011

Informática
 “INFORMACIÓN GEOGRÁFICA: aquella información que puede ser relacionada con localizaciones de la superficie de la tierra” (Dep. Medio Ambiente – Gran Bretaña – 1987). Es lo mismo decir que son datos referidos geográficamente, o sea situados en la superficie de la tierra, o decir también datos espaciales georreferenciados”.

Licenciatura en Geografía
“INFORMACIÓN GEOGRÁFICA: es toda aquella información que posea datos geográficos, estos pueden ser en forma de mapa, carta o un simple croquis de campo; puede ser en forma descriptiva, crónicas, diarios de navegantes, también un par de coordenadas geográficas, cartográficas etc.”

Estas respuestas muestran coincidencia a la hora de definir el término de “Información Geográfica”; destacan principalmente en el dato en sí mismo y en su forma de presentación, como algo físico. Se centran en el contenido del mensaje y no en el mensaje en sí mismo y su transmisión.
Si consideramos el paradigma físico, este “paquete” de información física, se transmite desde un emisor a un receptor, y es el “mensaje” de la teoría de Shanon; mensaje que debería ser reconocido unívocamente por el receptor, pues debería emplear los mismos signos que el emisor.
Siendo tan importante el contenido de éstos mensajes, y puesto que la fragmentación de la información al fin de la modernidad, la extrae de su contexto, permitiendo diferentes interpretaciones, es que al crear la base de datos subyacente en el Portal que representa la IDE, debe predefinirse el campo del conocimiento al que se aplica.
La descripción bibliográfica del tipo de documentos que integran la IDE está normalizada por los acuerdos y políticas propios de la conformación de este emprendimiento; la terminología que corresponde a la representación de esta información y sustituye a los documentos en la búsqueda (palabras – clave, descriptores), debe considerar la pre – comprensión de la colectividad de usuarios y con la dependencia de las IDE del entorno digital, permitir su procesamiento por máquinas, lo que nos lleva a la necesidad del desarrollo de una ontología común, en el sentido ontológico adoptado por la disciplina informática.
Desde la hermenéutica vemos el almacenamiento y recuperación de la información como la relación entre quien consulta, su pre – comprensión, compartida con su grupo de pertenencia y el sistema, en una fusión de horizontes como la descrita por Gadamer (1975).
Del artículo de Capurro citado anteriormente:
 “El proceso de búsqueda de información es básicamente un proceso de interpretación que tiene que ver con el contexto vital y el trasfondo del interrogador y el de aquellos que almacenan diferentes tipos de expresiones lingüísticas que tienen un significado dentro de contextos de comprensión fijos como son un thesauro, palabras claves y esquemas de clasificación”.
El diálogo dinámico de la fusión de horizontes de Gadamer, que se produce durante la búsqueda de información donde el interrogador compara sus preguntas y su horizonte de pre-comprensión con  los del sistema, constituye un círculo hermenéutico. La interpretación tiene sus raíces en el cuestionamiento. La pre-comprensión de quien interroga está relacionada con su comunidad, que es a su vez una red de relaciones de cosas y asuntos abiertos al mundo y finitos.
 Podríamos representarlo en el siguiente esquema:


En el mundo digital la hermenéutica tiene como tema principal la comunicación basada en el código digital, que se constituye en una pre – comprensión de los procesos de interpretación, construcción, almacenamiento y transmisión del mensaje.
Los sistemas digitales constituyen una de las formas, tal vez la más común y generalizada,  desde las cuales se interpreta la esencia de la realidad, tanto desde la óptica científica como desde la vida diaria. La técnica digital permite objetivar la comprensión humana con programas de interpretación y búsqueda fuera del ámbito semántico humano.
La sociedad globalizada incorpora el código digital, abarcando desde los procesos de la red digital a la robótica, con los sistemas de comprensión autónomos, la biónica y la nanotecnología. El foco de estos problemas de interpretación se centra en la web 2.0 o web social, y en este sentido el círculo hermenéutico es una imagen de la hermenéutica filosófica.
Según Capurro (2007), “la hermenéutica se inscribe en el proceso de objetivación de sentido que surge en el momento en que una comunidad humana es capaz de expresarse a nivel simbólico-digital. Los medios de objetivación de sentido, como la escritura, la imprenta y la computadora, posibilitan un alcance cada vez más universal de auto reflexión de los sistemas sociales”.
Al considerar los tres tipos de hermenéutica, respecto de los sistemas de información detallados por Capurro:
-              Hermenéutica de los usuarios
-              Hermenéutica de la colección
-              Hermenéutica del sistema
hay que prestar especial interés a la hermenéutica de la colección, que fundamenta el proceso de selección de los documentos y la forma en que éstos son indexados y catalogados.  El desarrollo de la ontología para la IDE, proporciona un medio por el cual optimizar esta recuperación, atendiendo a las características de su grupo particular de usuarios y su forma de interpretarse a sí mismos y al sistema.
Los sistemas de información se conciben para un grupo social determinado y con el fin de sustentar la producción, recolección, organización, interpretación, almacenamiento, recuperación, diseminación, transformación y uso de la información de interés para ese sector o grupo específico de usuarios.
El uso de redes, su control a nivel de políticas locales, regionales y globales, las técnicas desarrolladas para la web 2.0, el mundo digital, la cooperación en comunidades especializadas, son temas que trata la hermenéutica actual. Las IDE constituyen redes que se actúan ante una comunidad muy especial de usuarios y en el marco de la web 2.0, por lo que constituyen un tema más de los que debe tratar la hermenéutica.

Conclusiones:
La información geográfica, los datos geo – espaciales definidos como tal por los actores de la IDE, constituyen un modelado de la realidad cuyos símbolos, que representan objetos, fenómenos y características sobre la superficie terrestre, deben interpretarse y traducirse al código digital. A la interpretación de textos o símbolos digitales de la hermenéutica del siglo XXI, debe añadirse la interpretación de éstos modelos de la realidad, aumentando su desafío.
La fragmentación propia de la información en el mundo de hoy, el altísimo costo de la producción de la Información Geográfica y su indiscutible valor estratégico nos lleva a crear las mejores condiciones de recuperación de todos los fragmentos de información que puedan estar disponibles en las diferentes instituciones. Se necesita una pre - comprensión objetivada. La hermenéutica proporciona un marco que permitirá establecer la pertinencia y relevancia de la información recuperada.
El desarrollo de ontologías para los paquetes de información puestos a disposición de los usuarios a través de la IDE – Uruguay, los transformarán en paquetes de información semántica que permitan alcanzar nuevo conocimiento.
En pro de llegar a un GEOPORTAL eficaz y a una óptima recuperación de la Información Geo-espacial, debe resolverse la ambigüedad de algunos conceptos manejados por una comunidad de usuarios tan heterogénea como lo es la de los integrantes de la IDE – Uruguay.

Bibliografía:
BORST, P et al. (1997). Engineering ontologies. EN: International Journal of Human-Computer Studies, 46(2-3)
CAPURRO, Rafael. Epistemología y Ciencia de la Información, 1986. [Consultado el 20 de marzo de 2012]
CAPURRO, Rafael (2007). La hermenéutica frente al desafío de la técnica digital. [Consultado el 20 de marzo de 2012]
CAPURRO, Rafael (2000). La hermenéutica y el fenómeno de la información. [Consultado el 20 de marzo de 2012]
CAPURRO, Rafael. Pasado, presente y futuro de la noción de información. En: I Encuentro Internacional de Expertos en Teorías de la Información: Un enfoque interdisciplinar.
FERRATER MORA. Diccionario de filosofía. Buenos Aires : Editorial Sudamericana, 1965. 5ta. Edición.
FLORIDINI, Luciano. Degenerate Epistemology, editorial. En: Philosophy & Technology, 2.1, Marzo, 2012
[Consultado el 15 de abril de 2012]
SANZ, Ismael; JIMENEZ - RUIZ, Ernesto (2007). Ontologías en Informática. [Consultado el 3 de abril de 2012]