Preservación

Resumen del Artículo 6.3. Preservación y conservación del patrimonio digital AutorJordi Serra Serra

 

Los conceptos archivísticos aplicables a la documentación electrónica

 

Se define documento como cualquier información fijada, de forma permanente, sobre un soporte y que tiene los siguientes valores

  • Administrativo: valor probatorio  de un documento creado o recibido por una organización en el cumplimiento de sus funciones
  • Histórico: En el futuro gente ajena a la organización y a sus actividades puede necesitar sus documentos para conocer cómo se realizaban esas actividades, quién las llevaba a cabo y cuándo

 

Los valores de un documento administrativo determinan, por su forma, contenido, formato ,su lugar de conservación, su período de vigencia o su destino que puede ser la conservación permanente, la eliminación o un muestreo estadístico dentro del conjunto de los documentos sobre un mismo tema o trámite.

 

La diplomática es la ciencia que estudia los documentos, en sus características externas e internas, con el fin de fijar su autenticidad.

 

 La preservación de la integridad

 

Los  elementos que componen un documento se pueden agrupar en tres partes básicas, que juntas convierten al documento en el testimonio de un hecho o de una transacción. Éstas son:

  1. Contenido
  2. Estructura
  3. Contexto

 

Dentro de este contexto, el documento informático no tiene existencia física propia, independiente de la máquina que lo recupera. El documento informático puede presentarse en dos estados: On-line: Off-line

 

En el documento informático se ha producido una disociación entre la información y el soporte. Es precisamente por este motivo que el soporte no tiene ningún significado, y aunque un documento se migre de un soporte a otro sigue considerándose exactamente el mismo documento. El soporte es necesario para que el documento exista, pero ya no forma parte su significado.

 

La copia y la modificación, cuando no se activan mecanismos de protección, son los principales atentados a la fiabilidad y la autenticidad,

 

Para conservar sus valores, y en función del tipo de información que contenga, el documento informático debe conservar tanto su apariencia como sus funcionalidades, y esto implica que debe ser conservado en formato electrónico y en una forma y contexto igual o equivalente a aquel en que fue creado. 

 

El objetivo de la preservación digital consiste en mantener la unidad lógica de los componentes de cada representación, y al mismo tiempo la correspondencia de cada representación con una determinada entidad intelectual (previa identificación de sus aspectos esenciales o propiedades significativas). En este caso, lo que se debería conservar es:

  1. La apariencia que permite a cualquier persona identificar que lo que se está reproduciendo en pantalla, sea en Open Office o mediante Adobe Reader.
  2. La funcionalidad que permite, tanto si el contenido está en formato .odt como en formato .pdf, verificar que el firmante es la persona que dice ser, y que el documento no se ha modificado con posterioridad a la firma.

 

La conservación permanente

 

La planificación de la preservación, consiste sobre todo en la gestión de la información relacionada con los formatos, sus características funcionales y tecnológicas, y su evolución a lo largo del tiempo. Los archivos nacionales del Reino Unido han formulado unos criterios para seleccionar los formatos de conservación a largo plazo, que son los siguientes:

 

  1. Que se trate de estándares abiertos.
  2. Que tengan una presencia amplia en el mercado, o un uso extendido.
  3. Que sean estables, interoperables, y garanticen la compatibilidad retroactiva.
  4. Que ofrezcan soporte a una metadescripción lo más completa posible.
  5. Que ofrezcan el máximo posible de funcionalidades sin una estructura compleja.
  6. Que sean robustos e incorporen métodos para la detección de errores.
  7. Que su código sea, como último recurso, humanamente legible.

 

La conservación física de los soportes y la legibilidad de su contenido es un problema, los archivos y las bibliotecas están trabajando en proyectos de conservación tanto de los soportes como de los documentos digitales. Es muy recomendable consultar los trabajos publicados por:

  1. Council on Library and Information Resources
  2. European Comission on Preservation and Access (ECPA)
  3. Digital Preservation Europe
  4. Digital Preservation Coalition

 

Problemas de cultura organizacional

 

No existe todavía una conciencia generalizada a nivel institucional de la necesidad de crear archivos digitales para almacenar los documentos informáticos una vez finalizada su utilización o su período de vigencia, y especialmente de asumir el coste que esto supone. Tampoco se presta suficiente atención a las posibles barreras al acceso y la disponibilidad que la utilización deja en los documentos, como pueden ser contraseñas o sistemas de cifrado fruto del uso de la firma electrónica.

 

El archivo digital: estrategias y soluciones

 

El primer paso es identificar cuáles son los documentos que deben ser conservados.

 

Los metadatos son un elemento esencial para la preservación digital  con ellos se puede recoger el contexto completo de creación y de utilización de los documentos informáticos, y esto incluye:

El contexto documental

Metadatos descriptivos para la identificación de cada unidad documental, orientados básicamente a su recuperación y uso

 

El contexto de utilización

Metadatos administrativos o de negocio, generados por el uso y vida del documento, tanto durante su etapa de formación como durante la ejecución de su ciclo de vida

 

El contexto tecnológico

metadatos sobre las características tecnológicas de los documentos, esenciales para evaluar una posible obsolescencia tecnológica y aplicar medidas paliativas

 

 Preservation Metadata: Implementation Strategies (PREMIS)

Un diccionario de datos que define los metadatos necesarios para conservar a largo plazo documentos electrónicos, y poder llevar a cabo las acciones de preservación propias de un archivo digital.

 

Metadata Encoding and Transmission Standard (METS),

Un modelo de metadatos orientado a la descripción de documentos electrónicos para su conservación en bibliotecas y archivos digitales. Se basa en un esquema XML que actúa como contenedor de objetos digitales

 

Con el fin de preservar sus valores primarios, el documento debe ser creado de forma controlada, de manera que el sistema garantice su fiabilidad y su autenticidad y debe ser creado en el formato que mejor responda a su futura disposición, sea esta la conservación o la destrucción.

 

La valoración documental permite, adelantar la transferencia a un entorno seguro de los documentos electrónicos de conservación a largo plazo, sobre todo en aquellos casos en que el órgano productor no puede asumir el coste de mantenimiento de un archivo digital.

 

Integridad y autenticidad

 

Cuando un documento electrónico está en su fase administrativa y son activos sus valores primarios, reside en un espacio de trabajo. El hecho de estar en un espacio de acceso compartido hace necesario un mecanismo que garantice que no se modifican ni adulteran su contenido ni su valor (integridad y autenticidad), y la forma de hacerlo es, o bien mediante sistemas de seguridad a nivel de documento, como la firma electrónica, o bien con sistemas de seguridad aplicables al conjunto del sistema de información donde reside el documento. La autenticación particular de cada documento se convierte en una autenticación general:

 

todos los documentos electrónicos, por el mero hecho de residir en el espacio de "archivo virtual", se consideran auténticos, y lo hacen en virtud de dos condiciones:

  1. Que el espacio de archivo es un espacio inmodificable, reservado al acceso del archivero.
  1. Que se tiene la certeza de que los documentos han ingresado auténticos en el archivo, puesto que lo han hecho mediante un proceso controlado: la transferencia documental (en terminología OAIS el ingest process).

La fiabilidad y el valor de los documentos contenidos en un sistema de información quedará en entredicho en los sistemas que no tengan un eficaz sistema de control de accesos y registros de modificaciones. En este sentido, la normativa técnica sobre seguridad es amplia y completa (véase la familia ISO 27000).

 

Estrategias de preservación

 

Una política de migraciones periódicas, bien de un formato propietario anterior a uno posterior, o bien manteniendo siempre los datos en formatos de bajo nivel, se evidencia como la solución más aceptada. Cuatro son las principales estrategias de migración:

Cambio de medio (reformatting o refreshing).

Esta estrategia pretende subsanar la obsolescencia física, y consiste en un recopiado periódico de los documentos digitales a soportes más estables (por ejemplo, de soporte magnético a óptico).

 

En su forma más extrema incluye la impresión en papel o la microfilmación de los documentos digitales, con tal de conservar la accesibilidad o legibilidad del contenido, aún a costa de perder todas las funcionalidades del documento digital original. La norma ISO 18492 vincula este tipo de conversión  a tres situaciones

 

  • Durante el proceso de transferencia al archivo digital (upon transfer)
  • Con motivo de la sustitución del sistema de archivo (upon upgrade)
  • De forma planificada y periódica, calculada a partir de la vida media de los soportes y dispositivos utilizados (scheduled)

 

Compatibilidad retroactiva (backward compatibility).

Los programas comerciales permiten a menudo leer documentos creados con versiones anteriores de una misma familia de programas, así como su migración a la versión actual.

La compatibilidad retroactiva, sin embargo, está sujeta a los cambios en la estrategia comercial de la empresa productora del software. Además, este tipo de migración puede realizar alteraciones en la estructura interna de los documentos digitales no deseables desde el punto de vista legal, o que atenten a la autenticidad del documento original.

 

Interoperabilidad 

Programas de distintas empresas pueden compartir los mismos formatos de documento digital.

Permite visualizar documentos de un formato propietario con el programa de otra empresa, y convertirlos a nuevos formatos propietarios. En este caso se reproducen los mismos problemas que en la compatibilidad retroactiva: la dependencia de las políticas de empresa, y el elevado porcentaje de pérdida de datos.

 

Conversión a formatos estándar

La existencia de formatos estándar es la principal garantía de la conservación de la funcionalidad de los documentos digitales. Sin embargo, los formatos estándar válidos como formato final para la conservación permanente, no siempre pueden ser un formato de trabajo. Esta estrategia, por lo tanto, debe contemplar la utilización de un formato seguro (fiable y auténtico) durante la utilización del documento, cuando tiene valores primarios, e incluir la posibilidad, cuando se quiera disponer el documento para su conservación a largo plazo, de congelar sus valores primarios en un formato estándar.

 

Sin embargo, las soluciones basadas en la migración no responden a las necesidades de los documentos compuestos, distribuidos y dinámicos, por el  riesgo de pérdida de datos 

 

Hay que añadir que el curso de la tecnología y su ritmo de obsolescencia son imprevisibles , por lo que cada nueva migración presenta una problemática distinta.

 

Existe un tercer método que consiste en eliminar las dependencias no esenciales que los documentos mantienen con los programas con que han sido creados. Estas dependencias pueden ser de dos tipos:

 

La propuesta más atrevida que se planteó para superar los problemas de obsolescencia lógica fue la emulación.

 

 

  1. Funcionalidades para editar o actualizar el documento electrónico (por ejemplo, el sistema gestor de una base de datos). Cuando se plantea la conservación a largo plazo de un documento digital auténtico se infiere que debe ser inmodificable. Por lo tanto, no es necesario conservar más que las funcionalidades de visualización y los datos contextuales.
  1. Vestigios de la tecnología original, como por ejemplo los formularios y listados de una base de datos.

 

Las recomendaciones generales para facilitar la conservación de los documentos electrónicos dentro de un archivo digital son:

 

 

  1. Utilizar preferentemente los formatos de fichero de uso más extendido, aunque sean formatos propietarios. La solución más recomendable actualmente para los documentos electrónicos administrativos, básicamente textuales, és utilizar PDF/A (ISO 19005. Electronic document file format for long-term preservation - Part 1: Use of PDF 1.4)

 

  1. Eliminar cualquier tipo de sistema de autentificación y de protección de la confidencialidad (contraseñas, cifrados de firma electrónica o marcas de agua) antes de transferir los documentos al archivo digital.

 

  1. Evitar en lo posible la utilización de estrategias de compresión, y cuando sea necesario utilizar formatos de compresión estándar. No utilizar formatos de compresión que impliquen una pérdida notable de información, sea en texto o en imagen, pues en el futuro podría ser necesario recuperar esa información

 

  1. Garantizar la trazabilidad de todas las modificaciones que se realicen sobre cada documento. Es necesario que todas las funciones de registro del sistema estén centralizadas para garantizar el control documental.

 

  1. En el momento de crear un documento, y durante cada utilización, recoger el máximo posible de metadatos, especialmente tecnológicos o de preservación. Esta es la clave para preservar el contexto y mantener la unidad del fondo documental digital.

 

 

 

La puesta en marcha del archivo digital

El modelo OAIS permite definir el funcionamiento y compromiso de servicio de un archivo digital a largo plazo, se define como una organización de personas y sistemas que ha aceptado la responsabilidad de preservar información y hacerla accesible para una determinada comunidad. De esta definición se deben destacar las dos obligaciones principales de cualquier archivo:

 

  1. CONSERVAR una determinada información a medio y largo plazo.

 

  1. PROPORCIONAR ACCESO a esta información de una forma coherente con las necesidades de sus usuarios principales.

 

Estas obligaciones incluyen:

 

  1. Negociar y aceptar la información apropiada de los productores de información.

 

  1. Obtener suficiente control sobre la información para poder garantizar su conservación a largo plazo.

 

  1. Determinar los límites de la comunidad de usuarios del archivo.

 

  1. Asegurar que la información conservada es inteligible por sus usuarios sin necesitar la participación de los productores de la información.

 

  1. Seguir políticas y procedimientos documentados para asegurar que la información es conservada a pesar de cualquier contingencia, y hacer posible la difusión de copias auténticas de la información conservada en su forma original, o bien en una forma equivalente al original.

 

Hacer accesible a la comunidad de usuarios la información conservada, mediante el conjunto de mecanismos y servicios que sean necesarios

 

Proyectos internacionales de preservación digital

 

Son numerosos los proyectos y foros internacionales que están estudiando los diferentes aspectos que condicionan la conservación de los documentos digitales y de su valor evidencial. Destacamos los siguientes:

 

1.       InterPARES - International research on permanent authentic records in electronic systems

2.       PLANETS Project

3.       CASPAR Project

4.       SCAPE Project

5.       NESTOR - Network of Expertise in Long-Term Storage of Digital Resources

6.       ERA - Electronic Records Archives

7.       The National Archives (UK)

8.       National Archives of Australia (AU)

9.       National Archives and Records Administration (US)

10.   iArxiu - Generalitat de Catalunya (SP)

 

 

 

.