Friday, December 01, 2006

PERSPECTIVAS TECNICAS Y PRACTICAS PARA LA PRESERVACIÓN DEL PATRIMONIO DIGITAL

Definición del objetivo del proyecto de preservación digital:
Según recoge el artículo "El desarrollo de un programa de preservación ideal para documentos digitales" de Bárbara Muñoz de Solano y Palacios, facultativa de Bibliotecas del CINDOC de la Universidad Complutense de Madrid.
El Objetivo de un proyecto ideal es implementar un plan de preservación capaz de asegurar el acceso a los documentos digitales a largo plazo; de aplicación universal; caracterizado por la uniformidad, el automatismo y la sincronía, y adaptable a todo tipo de documentos y medios digitales con una intervención mínima por parte del hombre, capaz de facilitar la gestión de los documentos catalogación, adquisición , etc) mediante la asociación de etiquetas con información directamente decodificables por el hombre manteniendo a su vez la funcionalidad, formato y funcionamiento del documento original minimizando las posibilidades de perder información. Por último, y como condición indispensable todo el proceso será reversible en cualquier de sus fases.
Dificultades que presentan los materiales digitales

• En la mayoría de casos, hay que evaluar una gran cantidad de material.

• Los medios utilizados para producir y difundir los materiales digitales son muy
numerosos, por lo que su calidad es a menudo desigual.

• El tiempo de ejecución suele ser decisivo, pues los materiales digitales se eliminan
rápidamente por sí solos al volverse inutilizables. Puede ser imposible esperar a tener
certeza del valor permanente del material para tomar la decisión de seleccionarlo.

• Algunos objetos digitales pueden ser difíciles de definir. Los nuevos tipos de objetos
pueden no entrar en las clasificaciones existentes, pues algunos recursos digitales
están formados por elementos vinculados o superpuestos y muchos otros existen en
versiones paralelas. El proceso de selección debe abrirse camino entre estas
complicaciones para llegar a decisiones claras y sin ambigüedades acerca de lo que
hay que preservar.

• Aunque ya se hayan definido las fronteras exteriores, puede ser difícil decir qué
elementos tienen que conservarse para que el objeto digital cumpla su propósito
esencial.

• A veces, puede ser difícil incluso determinar la procedencia de los materiales digitales,
lo que representa un obstáculo para decidir quién es responsable de su preservación y
con quién hay que negociar los derechos necesarios para los programas de preservación.


-Los procesos de selección, que a menudo deben resolver incertidumbres, entrañan juicios
subjetivos y basados en conjeturas, pero es indispensable que sean informados, coherentes
y responsables.

• Las decisiones deben tomarse a partir de la necesaria información acerca del material,
de su contexto y de las necesidades de las partes interesadas que resultarán afectadas
por ellas.

• Las decisiones deben basarse siempre en una política de selección que tome en cuenta
los objetivos de la organización que asuma la responsabilidad de la preservación. En
las instituciones que acopian materiales, como bibliotecas, museos y archivos, la
política de desarrollo de los fondos ya existente puede constituir una buena
orientación.

• En lo relativo a la responsabilidad, los procesos de selección deben ser claros, estar
basados en una política públicamente conocida y establecer precisa y explícitamente lo
que debe preservarse y lo que debe excluirse.

Una base para los criterios de selección

• Las decisiones deben basarse principalmente en el valor del material y respaldar la
misión de la organización que asume la responsabilidad de la preservación.

• Este valor debe sopesarse en función de los costos y las dificultades probables de la
preservación y de la disponibilidad de recursos prevista.

• El proceso debe documentar las razones por las que el material fue elegido para que
los responsables de la preservación puedan comprender qué tienen que conservar.

Función de los productores y acuerdos de recolección

El concepto de “productor” es complejo, pues engloba a varios agentes encargados de funciones muy diversas, como diseñadores, creadores (amenudo varios), revisores y editores de programas informáticos, y proveedores de servicios.
Los productores de materiales digitales pueden desempeñar un papel significativo en la
selección de lo que se debe preservar, pues a menudo están bien situados para comprender
por qué se crearon los objetos digitales, cuál es su "mensaje" esencial y cuáles las relaciones entre los objetos y su contexto. Si no se recoge esta información directamente del productor, puede ser demasiado difícil reconstituirla más tarde.

Para minimizar el riesgo de perder materiales importantes y evitar duplicar esfuerzos
inútilmente, puede ser necesario establecer acuerdos con otras posibles entidades de
recolección y preservación sobre las respectivas funciones y responsabilidades.

Las cuestiones relativas a los derechos pueden influir en las decisiones de selección. Los
programas de preservación seleccionan a menudo materiales que todavía están sujetos a
derechos, pero, en general, no seleccionarán un material si los derechos son tan restrictivos
que pueden impedir negociar acuerdos sobre el acceso en el futuro.


Es difícil definir qué necesidades deben mantenerse, para hacer una selección de los elementos esenciales, pero puede ser más fácil considerar el impacto de un elemento que no se mantenga y determinar las funciones o los elementos que definitivamente no se necesitarán.

Guía de buenas prácticas

• La planificación del proyecto, subrayando el diseño del sistema como condición
previa a la creación de cualquier registro o publicación.

• La selección del soporte. Debe aconsejarse a los productores que utilicen productos de
"solidez industrial", capaces de subsistir hasta que los datos sean transferidos a otros
Soportes.

• La selección de formatos de ficheros y de estándares de datos apropiados. Es más fácil preservar datos de formatos sencillos que usan programas informáticos de fuentes abiertas y de dominio público.
Los materiales publicados en línea y libremente disponibles deben poder ser leídos por los navegadores más corrientes.
Debe tenerse en cuenta para la creación de materiales de valor permanente la
estructuración de documentos en formatos normalizados, fácilmente reconocibles y
duraderos, como el XML (lenguaje extensible de marcado).

• La validación de los formatos. No sirve de nada elegir un formato estándar y luego no
utilizarlo como corresponde.

• Los nombres de los ficheros, que deben ser coherentes y sin ambigüedades.

• La gestión de los ficheros en línea, que debe permitir el acceso en cualquier momento
a través de un servicio de identificación y resolución permanente, o mediante el
redireccionamiento de los mensajes si los ficheros se cambian de lugar.

• La producción por los creadores de metadatos de buena calidad para los recursos
creados, para lo cual deben utilizar un sistema ampliamente aceptado, como el MARC,
los elementos de metadatos de Dublin Core o una de las numerosas versiones
mejoradas de este proyecto según los sectores. Los metadatos, que ayudarán a los
usuarios a encontrar y utilizar los materiales, deben registrarse de modo que describan
la naturaleza técnica de los objetos digitales, los requisitos para tener acceso a ellos y
cualquier modificación de estos detalles durante su ciclo de vida, pues se trata de
informaciones indispensables para la gestión. Los metadatos pueden integrarse en los
recursos o almacenarse en un fichero específico vinculado a ellos.

• La gestión de ficheros. Los ficheros maestros de preservación deben almacenarse y
gestionarse por separado de sus copias de difusión.

• La seguridad del sistema.

• La autenticidad. Hay que identificar todos los ficheros y documentar su procedencia e
historia como prueba permanente de su autenticidad.

• La formación. El personal, los contratistas y demás personas en contacto con objetos
digitales deben disponer de procedimientos y manuales adecuados, y ser formados,
motivados y equipados convenientemente para utilizarlos.

• La protección de la propiedad intelectual. Si se considera necesar io instalar barreras
que impidan el acceso o la obtención de copias para proteger la propiedad intelectual,
dichas medidas pueden imposibilitar la preservación. Por lo tanto, habrá que prever
disposiciones que permitan efectuar ciertas operaciones de preservación, como la
realización de copias.

• El mantenimiento del acceso. Las medidas iniciales a este respecto pueden prever la
conservación de todos los programas informáticos, así como los equipos especializados necesarios para obtener el acceso. Aunque no sea una estrategia eficaz a largo plazo, puede ser necesaria a corto plazo.

• La evaluación. Puede ser necesario evaluar los objetos digitales y decidir durante
cuánto tiempo deben conservarse y a quién le corresponde hacerlo, en conformidad
con una política aprobada, como la aplicada para autorizar la destrucción de archivos.

• Una solución para los programas pequeños que trabajan en una misma región puede
ser formar un consorcio que negocie acuerdos con los productores en nombre de todos
ellos.

Transferir datos a un lugar seguro

Las presentes directrices recomiendan transferir los materiales del patrimonio digital de un
entorno operativo a un lugar seguro para evitar los riesgos de daño o pérdida que supone el
uso cotidiano de los ficheros digitales. En la mayoría de los casos, ello significa transferir los datos y ponerlos bajo la custodia de un organismo de preservación responsable.

Los productores tienen derechos sobre los materiales digitales que crean, la
transferencia plantea ciertos problemas de orden jurídico y moral.

Control del material mediante su identificación

Cada uno de los ficheros de un sistema de almacenamiento debe estar identificado con un nombre de fichero único para evitar confundirlo con otro.
Otro punto esencial es que los materiales preservados puedan ser localizados con absoluta seguridad.
Para solucionar este problema, se necesita algún tipo de identificación persistente, que consiste en un identificador y una forma de resolución o enlace con el fichero en su nueva localización.

Control del material mediante su descripción

Los programas de preservación utilizan metadatos (información estructurada sobre los datos) para describir los objetos digitales que tienen en custodia.
Los metadatos también son recursos de información que deben procesarse y preservarse junto con el material que describen.

La transferencia de datos

Cualesquiera que sean los medios de transferencia, los programas de preservación deben
controlar el material que reciban para verificar que contenga todos los ficheros requeridos,
que éstos funcionen como previsto, y que los metadatos y demás documentación sean correctos.
La organización de los metadatos en estructuras de documentos normalizadas, como el modelo XML, simplificará su preservación.
Aún no existen normas aceptadas para el uso universal de los sistemas de metadatos de
preservación y, por lo tanto, los programas pueden tener que optar entre aceptar (y
posiblemente adaptar) uno de los modelos que otros emplean, o diseñar el suyo propio (ya sea una solución completa o una solución mínima provisional hasta que surja una norma).
Muchos archivos nacionales han publicado especificaciones de metadatos para los sistemas de conservación de registros que toman en cuenta las necesidades de la preservación. En el
campo de la bibliotecología, un grupo de trabajo internacional convocado por la OCLC (Red mundial de bibliotecas cooperantes) y el RLG (Grupo internacional de bibliotecas de
investigación) publicó, a mediados de 2002, un marco de trabajo recomendado para los metadatos de preservación (disponible en línea en:
). Su informe constituye un buen
punto de partida para determinar qué metadatos pueden necesitarse.

Gestión de los derechos

Las diversas partes interesadas en el patrimonio digital gozan de varios derechos y tienen
determinadas expectativas que los programas de preservación deben tomar en cuenta y, de ser necesario, incluir en su plan de gestión. Muchos de esos derechos tienen consecuencias
legales, comprendidos los derechos de propiedad intelectual y los derechos en materia de
respeto de la privacidad. Teniendo en cuenta que los programas de preservación deben copiar objetos digitales para preservarlos, y que la mayoría de ellos buscan proporcionar algún tipo de acceso, se necesitan estrategias activas de gestión de los derechos.

• Es probable que los programas de preservación deban trabajar con grandes cantidades
de material, por lo que la aplicación de convenios de licencia estándar que cubran
diferentes clases de material evitará tener que negociar y gestionar los derechos caso por caso.

Protección de datos

La protección de los datos es fundamental en todos los programas de preservación. Otro
aspecto de crucial importancia es la autenticidad, que guarda relación con la integridad
permanente de los datos y con su identificación precisa y duradera. De las estrategias de
protección de datos forman parte la asignación de la responsabilidad, las infraestructuras
técnicas, el mantenimiento, las transferencia de datos, el almacenamiento adecuado de los
soportes, el sistema de copias de seguridad, la seguridad del sistema y la prevención de
catástrofes. La autenticidad también exige disponer de una documentación clara sobre los
orígenes y la historia de los materiales digitales.
Para los registros de archivos, los datos científicos y los diversos tipos de
material digital, la confianza en su autenticidad permanente es crucial, pues, sin ella, pierden prácticamente todo valor.
La autenticidad de un objeto resulta a la vez de la confianza en su identidad (es lo que dice ser y no se confunde con ningún otro) y en su integridad (no ha experimentado ninguna
modificación que cambie su significado).
Para mantener la identidad y la integridad se necesitan enlaces sostenidos y documentados
entre el objeto, tal como fue creado originalmente, y el objeto tal como se presenta ahora.

Estrategias de protección de datos
. Los objetos digitales requieren estrategias bien planificadas, bien administradas y sostenidas que protejan los datos como la base mínima de la continuidad. De manera general, las estrategias necesarias son:

• Una clara asignación de las responsabilidades.

• Una infraestructura técnica apropiada que abarque sistemas, dispositivos de
almacenamiento y soportes para realizar el trabajo.

• Mantenimiento, asistencia técnica y programas de reemplazo de activos para los
sistemas.

• Transferencia periódica y sistemática de los datos a soportes nuevos para evitar las
amenazas de deterioro de los medios o de cambio de los equipos de acceso.

• Condiciones adecuadas de almacenamiento y tratamiento de los soportes.

Sistemas de copia de seguridad apropiados.

• Alto nivel de seguridad del sistema, comprendidos los controles de acceso a los datos
Almacenados.

• Planes de prevención de catástrofes.

Aspectos prácticos de las estrategias de protección de datos

Para la gestión de datos almacenados a largo plazo, se puede utilizar una serie de estrategias
estándar razonables que, en su mayoría, asumen que sólo los datos necesitan ser preservados y no los soportes.
Capacidad para correlacionar los nombres de ficheros en un sistema de
denominación de ficheros adaptado a su arquitectura de almacenamiento. Los
sistemas de almacenamiento se forman en torno a objetos que llevan un nombre y,
según sus características, utilizan arquitecturas diferentes para organizar los
objetos, lo que puede imponer ciertas limitaciones a su denominación dentro del almacenamiento.
Control de errores.
el sistema debe ser capaz de detectar los cambios o pérdidas de datos y tomar las medidas apropiadas.
La infraestructura técnica también debe disponer de medios para almacenar metadatos
y enlazarlos de manera segura con los objetos digitales almacenados.

Los datos deben copiarse de un soporte a otro para evitar las consecuencias que conlleva su deterioro.

Los principales riesgos para los soportes de datos son la temperatura y la humedad
excesivas que pueden dañarlos; el polvo u otras partículas que pueden dificultar el
acceso a los datos, y la luz, en caso de materiales codificados con medios ópticos, que
puede dañar los datos grabados con esta tecnología.

El almacenamiento de las copias en lugares diferentes es un requisito
básico para evitar las consecuencias de catástrofes regionales, como inundaciones,
terremotos, propagación de incendios o guerras.


Mantener la accesibilidad

Los sucesivos cambios que sufren los programas y los equipos informáticos terminan
provocando la pérdida de los medios de acceso al patrimonio digital. Según creencia general, este problema será el principal que deberá afrontar la mayoría de los programas de
preservación. Basándose en los conocimientos de la relación entre los objetos digitales y sus medios de acceso, y teniendo en cuenta lo que hay que presentar a un usuario al
proporcionarle acceso, los responsables de programas deben decidir qué estrategias podrán
garantizar la accesibilidad cada vez que se necesite, pues todas ellas todavía están en
formación y probablemente cambiarán con el tiempo y según las necesidades. Las estrategias presentadas se han agrupado como sigue: las que se basan en la inversión de recursos desde el principio del ciclo de vida de los materiales digitales, las de vigencia a corto, mediano o largo plazo, y las alternativas “no digitales” y de “no preservación”.
la fidelidad absoluta a la presentación original de los materiales digitales puede
ser difícil de conseguir. A este respecto, muchas de las estrategias que actualmente están en
revisión, pueden conllevar ciertas pérdidas, como, por ejemplo, de contenido, del “aspecto y sensación” del original o de algunas funciones originales.
Para definir los niveles de pérdida aceptables e inaceptables, los programas de preservación
deben definir primero los elementos esenciales que deben mantener.
Muchas colecciones contienen varias versiones de los mismos materiales, como en el caso de las imágenes digitales de alta calidad y sus versiones derivadas de baja calidad suministradas para un acceso fácil en red. Los programas de preservación deben decidir qué versión o versiones deben conservarse y cuáles pueden generarse de nuevo en una fecha posterior.

Fijar objetivos de preservación en esta etapa requiere un detenido estudio del material para
comprender por qué existe, cómo funciona y qué debe poder ver y hacer un usuario con una
copia preservada.
Siempre hay una relación de dependencia entre los datos y los programas informáticos, pues todos los datos necesitan algún tipo de programa para ser presentados en una forma
comprensible al usuario. El grado de dependencia tiene consecuencias importantes,
puede limitar la variedad de estrategias utilizables, pues, por ejemplo, siguiendo una misma estrategia, los objetos de tipo “datos” o “documento” pueden ser perfectamente presentados por diversos programas informáticos, pero los objetos “programa” pueden tener menos posibilidades de permanecer accesibles al perderse su entorno operativo original.
Es importante tomar ya mismo medidas concretas que, aunque sean pequeñas, preserven el
acceso en un “futuro controlable”, pero también hay que ocuparse de planificar las estrategias a largo plazo que parezcan las más prácticas.


Las actuales estrategias a largo plazo de uso común son: el uso de normas para la
codificación, estructuración y descripción de datos, con la esperanza de que permanezcan
reconocibles durante largos periodos de tiempo; la emulación de programas o equipos
informáticos obsoletos, y la migración de datos de una tecnología operativa a otra.

En todas estas estrategias, una buena práctica es conservar y proteger el flujo de datos de los objetos originales al mismo tiempo que los de los datos modificados que la estrategia pueda producir. Esta conservación del flujo de datos original debe considerarse como un plan de emergencia que brinde la oportunidad de aplicar otras estrategias en caso de que fracase la inicialmente elegida.


Estrategias mas propuestas

Estrategias “de inversión” (basadas principalmente en un esfuerzo de inversión
inicial):
− Utilización de normas
− Extracción y estructuración de datos
− Encapsulación
− Restricción de la variedad de formatos que se han de gestionar
− Enfoque “UVC” (computadora virtual universal)

Estrategias a corto plazo (las que darán los mejores resultados a corto plazo
solamente):
− Preservación de la tecnología
− Compatibilidad “hacia atrás” y migración de versiones
− Migración (que también puede funcionar durante periodos más largos)

Estrategias a mediano y largo plazo (que pueden funcionar durante periodos más
largos):
− (Migración)
− Visualizadores
− Emulación
− (Enfoque UVC)
• Estrategias alternativas:
− Enfoques no digitales
− Recuperación de datos

Combinaciones de varias estrategias.
En caso de colecciones de contenido diverso, pueden ser
necesarias varias estrategias para abarcar toda la variedad de objetos y características que se
deben preservar.