Analizo.info usa la inteligencia colectiva para analizar datos


euskadinnova.net

La iniciativa se basa en la colaboración ciudadana para realizar investigaciones utilizando grandes cantidades de datos. Está dirigida a proyectos sin ánimo de lucro que promuevan la transparencia en política, economía y medio ambiente.
El primer proyecto de investigación que incluye el espacio Analizo.info consiste en extraer las posiciones que defienden los partidos españoles en el Parlamento Europeo en temas relacionados con el Desarrollo Sostenible, a través del análisis de 1.288 proposiciones presentadas en las últimas elecciones europeas. La intención es mostrar más claramente las propuestas de cada partido y que la ciudadanía pueda ver si se cumplen o no.
Labores como esta resultarían lentas y tediosas si las realizan un pequeño grupo de personas, pero no tanto si se abre la participación a toda la comunidad interesada, y en eso se basa el proyecto Analizo.info, creado por un equipo de investigación de la Escuela Técnica Superior de Ingeniería Informática de la Universidad de Valencia. El espacio permite incluir iniciativas, siempre que sean sin ánimo de lucro y estén dirigidas a promover el cambio social o la transparencia democrática. Los resultados de las investigaciones se publicarán de forma abierta para que puedan ser reutilizados.
Según sus fundadores, Diego Álvarez y David Pardo, la idea se basa en proyectos ya existentes que utilizan el potencial del crowdsourcing y la colaboración ciudadana como Datakind,Globalpulse o Change.org. Se inspira también en el conocido caso de éxito del diario The Guardian, que en 2009 consiguió analizar cerca de 200 mil documentos en pdf sobre los gastos de los parlamentarios británicos en solo 80 horas, gracias a la colaboración ciudadana.

También puede interesarte: Una guía para avanzar hacia el gobierno abierto

Preservación de la información creada en formatos digitales


cubarte.cult.cu

Obsolescencia técnica y el deterioro físico sus dos principales enemigos

Preservar la información que ha sido creada mediante la implementación de tecnologías digitales resulta, hoy en día, un reto de gran magnitud para los que están responsabilizados con administrar sistemas informáticos.

Sin lugar a la más mínima duda, cada día son más los recursos culturales y educativos del mundo que se producen y distribuyen, y a los que a su vez se tiene acceso en forma digital y no en formatos de papel. El patrimonio de origen digital que puede consultarse en línea, por ejemplo, las publicaciones periódicas electrónicas, las páginas de la Red mundial o las bases de datos en línea, ya forman parte del patrimonio cultural del mundo. Ahora bien, sucede que la información digital está expuesta a la obsolescencia técnica y el deterioro físico.

Tal como afirma el documento de la UNESCO sobre la preservación de la información digital en su primer artículo:

Artículo 1 - Patrimonio digital
Cada vez más, los recursos que son fruto del saber o la expresión de los seres humanos, sean estos de carácter cultural, educativo, científico o administrativo o engloben información técnica, jurídica, médica y de otras clases, se generan directamente en formato digital o se convierten a este a partir de material analógico ya existente.

Los productos “de origen digital” no existen en otro formato que no sea el electrónico original.

Los objetos digitales pueden ser textos, bases de datos, imágenes fijas o en movimiento, grabaciones sonoras, material gráfico, programas informáticos o páginas Web, entre otros muchos formatos posibles dentro de un vasto repertorio de diversidad creciente.

A menudo son efímeros, y su conservación requiere un trabajo específico en este sentido en los procesos de producción, mantenimiento y gestión.

Muchos de esos recursos revisten valor e importancia duraderos, y constituyen por ello un patrimonio digno de protección y conservación en beneficio de las generaciones actuales y futuras. Este legado puede existir en cualquier lengua, cualquier lugar del mundo y cualquier campo de la expresión o el saber humanos. (1)

Antecedentes históricos

La llegada al mundo de la documentación, de la creación y almacenaje de la información utilizando formatos digitales comienza a partir de la Segunda Guerra Mundial, cuando se desarrollan las primeras máquinas computadoras. Hasta ese entonces la humanidad contó con el soporte de papel, los discos para grabar mecánicamente sonidos, posteriormente las cintas magnéticas, así como las películas fotosensibles.

Las primeras computadoras no contaron con otros sistemas de almacenaje que no fueran el enviar a equipos periféricos impulsos eléctricos destinados a perforar cintas de papel o escribir en equipos teleimpresores adaptados a este fin.

La llegada de los soportes de almacenaje magnético primero y los ópticos más tarde es lo que da lugar a la creación de un problema cuya solución definitiva está todavía por lograrse, si es que algún día se podrá encontrar una fórmula mágica de preservación digital a muy largo plazo.

La información más vulnerable en cuanto a su posible preservación a corto, mediano y sobre todo a largo plazo, es la que “nace” en formatos digitales de cualquier tipo, sin que sea precedida por su creación en otros soportes como papel, discos de acetato o películas en blanco y negro o en colores, por citar algunos ejemplos.

Es precisamente esa información tan extraordinariamente vulnerable la que requiere hoy en día de los mayores esfuerzos para evitar su total desaparición ante situaciones como son las alteraciones en los parámetros de funcionamiento de los equipos de cómputo y sus periféricos, el daño físico de los soportes magnéticos u ópticos y por supuesto no hay que descontar los intentos de destrucción intencional.

No hay una fórmula mágica para la preservación de la información digital... ni siquiera a muy corto plazo, y mucho menos si se pretende que los datos almacenados transciendan una o más generaciones.

Pero, no es menos cierto que a diario se pierde para siempre y en no pocas ocasiones a un costo muy grande tanto moral como material, una gran cantidad de información digital, debido a no tomarse las medidas imprescindibles para su preservación.

Aunque la denominada “Informática Forense”, nos asombra cada día con nuevos aportes al rescate de información digitalizada dañada de una u otra forma, el acudir a los recursos de esta rama especializada resulta no solo costoso, sino también difícil de acceder, pues el número de expertos y laboratorios dedicados a estas labores detectivescas no es suficiente para enfrentar los problemas de pérdida o de intentos de borrar información digital que ocurren a diario en todo el mundo.

La obsolescencia de los equipos de lectura y grabación
Un problema que se está presentando, cada vez con mayor frecuencia, es que se cuenta con la información grabada en un formato digital determinado, e incluso debido a un buen trabajo de almacenaje bajo condiciones óptimas, el sopote en que fue grabada se encuentra en buenas condiciones... pero, han pasado muchos años desde que se utilizaron los discos flexibles de 8 pulgadas de diámetro o los un poco más “modernos” de 5¼ pulgadas, y ahora hay que enfrentar la realidad de no disponer del correspondiente sistema de lectura para dichos discos.

¿Dónde está disponible una computadora que posea en perfecto estado de funcionamiento una “torre de floppy” de 8 o de 5¼ pulgadas?

Por supuesto que no se la va a encontrar en el inventario actual de la gran mayoría de los sistemas y redes de computación. Solo será posible localizar estos lectores en laboratorios dedicados a la llamada “arqueología digital”, donde con mucho cuidado y bajo condiciones ideales se preservan los equipos de cómputo “del legado” capaces de leer los datos guardados en formatos que hace varias décadas se utilizaron a diario, pero que hoy en día son incluso irreconocibles para los recién graduados.

El mismo problema de los discos flexibles de 8 y 5¼ pulgadas lo estamos viendo con los “floppy” de 3.5 pulgadas, pues el abandono total del soporte a ese formato de almacenaje es una realidad que se expresa en la ausencia del lector/grabador para los floppy de 3.5 pulgadas en las computadoras de escritorio y las portátiles actuales.

El problema que se plantea con la información almacenada en los llamados discos “duros” o “rígidos” es muy similar, ya que varios de los formatos empleados para grabar la información en ellos son ya cosas del pasado lejano si hablamos en el lenguaje de la informática.

Discos del sistema MFM (Modified Frequency Modulation), en los que se ha mantenido guardada valiosa información son hoy en día ilegibles, no porque estén borrados los datos en sus pistas, sino porque simplemente no hay computadoras equipadas con las interfases capaces de conectarse a esos discos.

Los discos IDE (Integrated Drive Electronics), aunque más recientes ya están en total obsolescencia, lo que dificulta actualmente la lectura de los datos almacenados en ellos, lo cual será un problema cada día más preocupante.

En cuanto a los sistemas de almacenaje ópticos, de los que originalmente se crearon grandes expectativas en cuanto a una durabilidad de decenas de años, e incluso pretensiones de preservación por siglos, se puede afirmar que sus vulnerabilidades se han ido “descubriendo” a medida que ha pasado el tiempo... desmintiendo las pretensiones de sus creadores acerca de haberse alcanzado el non plus ultra de la preservación digital.

Y tras esta introducción... he aquí nuestra recomendación para lograr preservar, al menos a mediano plazo, quizás de 5 a 10 años, la información almacenada en sistemas de cómputo digital.

Las recomendaciones están contenidas de manera muy detallada en un documento creado por la UNESCO en cuya redacción y revisiones tuvimos participación directa en nuestro carácter de Consultante de la Comisión Nacional Cubana de Cooperación con la UNESCO, conocida internacionalmente como CNCU Cuba.

Este documento titulado Carta de la UNESCO sobre la preservación del patrimonio digital trata en forma analítica y detallada sobre estas cuestiones y puede ser obtenido desde el sitio WEB de la UNESCO .

El estudio de sus 176 páginas brinda la oportunidad de conocer en detalles todos los problemas relacionados con la preservación del patrimonio digital, así como una gama de opciones disponibles para prolongar en lo posible la vitalidad de la información.