Arquivo de longo prazo

O arquivamento de longo prazo ( LTA ) é definido como a aquisição, o armazenamento de longo prazo e a preservação da disponibilidade permanente de informações . Especialmente com o arquivamento de longo prazo de informações disponíveis digitalmente ( preservação digital ), surgem novos problemas. Para a preservação dos recursos digitais, “longo prazo” não significa a emissão de garantia de cinco ou cinquenta anos, mas sim o desenvolvimento responsável de estratégias que possam fazer face às constantes mudanças provocadas pelo mercado da informação.

definição

Uma definição geralmente válida do termo ainda não existe. Como os arquivos sempre guardam material de arquivo “para a eternidade”, o termo arquivo de longa duração também é um pleonasmo e, segundo a contribuição de Reinhard Altenhöner e Sabine Schrimpf, sugere um estado estático. Ambos, portanto, defendem o termo "disponibilidade de longo prazo" (LZV).

Como muitos dos problemas de arquivamento digital de longo prazo ocorrem somente após cerca de dez anos, como grandes saltos de versão no software usado, esse valor é usado como um limite para considerar o arquivamento de longo prazo. Além disso, o arquivamento de longo prazo pode ser diferenciado do backup de dados .

Problemas

Embora os objetos físicos tenham sido mantidos e preservados em arquivos , museus e bibliotecas por muito tempo, problemas completamente novos surgem com as publicações eletrônicas . Se os dados forem armazenados na forma analógica, a qualidade dos dados se deteriora com a degradação do meio, razão pela qual o foco está na preservação do meio. Os dados armazenados digitalmente, por outro lado, podem ser reconstruídos por formatação adequada no caso de pequenos erros no meio, pelo que uma qualidade de dados constante pode ser garantida apesar da deterioração do meio. Se esses erros no meio se tornarem muito grandes, os dados não podem mais ser completamente reconstruídos e, portanto, são irremediavelmente perdidos ("esquecimento digital"). Portanto, quando se trata de arquivamento de longo prazo de dados digitais, o foco não é mais preservar o meio, mas sim copiá-lo em tempo hábil, antes que os dados sejam perdidos. Uma vez que a mídia (por exemplo, fita magnética e DVD), formatos e dispositivos de leitura / gravação para armazenamento digital mudam rapidamente ao longo do tempo, o teste regular e a continuidade entre as mudanças requerem atenção constante e planejamento de longo prazo. Formatos proprietários e restrições de direitos autorais , entre outras coisas, causam problemas ao transferir para novos sistemas .

Prazo de validade da mídia transportadora

Por exemplo, embora pergaminhos e papéis velhos possam ser guardados por centenas de anos se armazenados adequadamente, isso não se aplica a novas mídias de armazenamento . A maioria das publicações da primeira metade do século 20 são impressas em papel degradado pela corrosão ácida . Em trabalhos impressos e manuscritos mais antigos, surgem outros problemas: se a tinta de galha de ferro for usada na fabricação, os ingredientes da tinta podem ser causados ​​por misturas desequilibradas de corrosão da tinta . Isso ocorre quando a tinta é um excedente de ácido gálico ou prevalece o excedente de vitríolo . A celulose é atacada de maneira semelhante à corrosão ácida, e o papel pode quebrar devido a diferentes níveis de umidade e mudanças ao longo das linhas das letras.

Filmes analógicos, fotos e fitas magnéticas também têm uma vida útil limitada. A vida útil da mídia de armazenamento digital, como disquetes, discos rígidos e CDs / DVDs gravados, é ainda mais curta. Portadores de dados digitais perdem seus dados estruturados específicos de mídia devido a influências ambientais (por exemplo, devido a campos magnéticos suficientemente fortes nas proximidades de disquetes e fitas magnéticas), ou uma estrutura de dados é alterada tanto por influências químicas ou físicas que não mais dados podem ser armazenados nele ou os dados que já foram gravados não podem mais ser lidos (por exemplo, se os CD-ROMs foram expostos à radiação ultravioleta por um período de tempo suficientemente longo). Muitas vezes, a legibilidade dos dados só falha porque os dispositivos e programas de leitura apropriados para torná-los legíveis não estão mais disponíveis posteriormente, ou porque os padrões de formatação de dados mais antigos não podem mais ser interpretados, ou porque as interfaces técnicas de leitura de dados muito antigos dispositivos não são mais suportados. A fim de evitar os problemas acima mencionados, pode fazer sentido (re) converter certos dados selecionados, armazenados eletronicamente (de volta) para a forma não eletrônica e esculpir dados importantes em pedra permanentemente - como um equivalente moderno do hábito cultural de nossos ancestrais, por assim dizer - gravam em uma placa de níquel quase indestrutível usando um feixe de íons.

Outro método de armazenamento permanente de imagens e textos em formato legível analógico é queimá-los em placas de grés usando pigmentos de cerâmica . O projeto Memória da Humanidade (MOM) armazena imagens de ativos culturais de museus e produtos culturais do dia-a-dia em placas de grés e os armazena em câmaras na montanha de sal de Hallstatt . A durabilidade teórica é dada em centenas de milhares de anos. A durabilidade de um suporte de dados de cerâmica foi comprovada por pelo menos 5000 anos ( comprimidos cuneiformes ).

Prazo de validade de alguns suportes de dados a 20 ° C e 50% rel. Umidade
médio Vida útil esperada Densidade de gravação (kbit / kg)
Painéis cerâmicos 5.000 anos (garantido), provavelmente vários 10.000 anos
Painéis de grés com impressão a cores de cerâmica queimada vários 100.000 anos, se protegido contra a erosão (presumido)
Tabletes e pinturas em pedra vários 1.000 anos (garantido) 1 × 10 −3 - 1
Placa de níquel vários 1.000 anos (presumido)
Livros e manuscritos feitos a partir de ácido livre de papel e
com livre de ácido e isento de ferro tintas
vários 100 anos (garantido) 3 × 10 3 - 3 × 10 4
Livros e manuscritos feitos de papel ácido
(especialmente trabalhos impressos do século 19 e início do século 20)
70 - 100 anos
Papel de jornal análogo ao papel tipográfico ácido / livre
Filmes em celulóide (nitrato de celulose) mais de 100 anos (garantido), provavelmente até 400 anos
Filmes sobre triacetato de celulose 44 anos (garantido)
Filmes em tereftalato de polietileno (PET) Filme colorido de até 150 anos (presumido)

Filme preto e branco até 700 anos (presumido)

Mídia de armazenamento óptico
(queimado) b
  • CD-R : 5 - 10 anos
  • CD-RW : pouco claro, menos do que o DVD-RAM suspeito
  • DVD-ROM : pouco claro, menos do que o DVD-RAM suspeito
  • DVD ± R : pouco claro, menos do que o DVD-RAM suspeito
  • DVD ± RW : pouco claro, menos do que o DVD-RAM suspeito
  • DVD-RAM : 30 anos (presumido)
  • DVD-R com camada reflexiva de ouro 24k: anunciado por até 100 anos
  • M-DISC (DVD modificado, BD ou BDXL): de acordo com o fabricante, até 1.000 anos
  • BD-R : até 50 anos (de acordo com testes de laboratório)
  • CD: 4 × 10 8
  • DVD: 2 - 4 × 10 9
  • BD: 2-4 × 10 10
Mídia de armazenamento óptico (pressionado)
  • CD : em condições ideais estimadas em 50 - 80 anos a
  • DVD : pelo menos 100 anos (presumido)
  • BD : 82 - 85 anos (presumido)
  • GlassMasterDisc (dados gravados em vidro): mais de 1.000 anos (informações do fabricante)
Disquetes como mídia de arquivo (armazenados) 10 - 30 anos (dependendo da densidade de dados?)
  • Disco HD de 5,25 ": 4,80 × 10 5
  • Disco DD de 3,5 ": 2,80 × 10 5
  • Disco HD de 3,5 ": 5,76 × 10 5
Unidades de disco rígido dinâmicas 2 - 10 anos, dependendo do tempo de operação diário, uma média de 5 anos
Unidades de disco rígido como mídia de arquivo (armazenada) 10-30 anos
Memória Flash (armazenada) 2 - 10 anos
Fitas magnéticas > 30 anos (garantido)
Disco magneto óptico (disco MO) 30 - 50 anos
Unidade removível Iomega REV até 30 anos (presumido)
uma No final da década de 1980, tintas plásticas com tendência a fungos ou permeáveis ​​ao oxigênio ou tintas agressivas às vezes eram usadas para impressão, o que reduzia a estabilidade dos dados.
b Como os DVD ± Rs de camada dupla podem causar problemas de leitura relacionados ao sistema, DVD ± Rs de camada única (4,7 GB) são recomendados.

Mídia rápida e mudança de sistema

No caso de informações armazenadas digitalmente em particular, existe o problema adicional de os dados não estarem mais acessíveis, embora o meio em si tenha sido preservado.

Legibilidade do meio de armazenamento

Para poder acessar as informações armazenadas, o respectivo meio portador deve ser capaz de ser lido (para fora). Com algumas mídias, como tábuas de pedra ou livros, isso também pode ser possível para uma pessoa sem ajuda. No caso de mídia armazenada digitalmente, um dispositivo de leitura apropriado, geralmente uma unidade, geralmente é necessário. Se os dispositivos de leitura não estiverem mais disponíveis, por exemplo, devido a uma mudança tecnológica, os dados não podem mais ser lidos, ou apenas com dificuldade. Um exemplo são os formatos de fita desatualizados .

Formatos de dados desatualizados

Mesmo que a mídia de armazenamento tenha sido preservada e ainda seja legível, pode ser impossível acessar os dados armazenados. Como os dados armazenados digitalmente não são imediatamente acessíveis, mas são codificados digitalmente e estruturados de maneira específica para a mídia, só é possível ler esses dados se um programa e um sistema operacional estiverem disponíveis que “entendam” o conteúdo de um arquivo. Como muitos sistemas operacionais e programas usam seus próprios processos (proprietários) para codificar os dados, a legibilidade dos dados não pode mais ser garantida assim que um sistema operacional ou programa não for mantido continuamente. Esse problema é agravado pela política de muitos fabricantes de software de publicar novas versões de programas com formatos de armazenamento de dados alterados, que formatos de armazenamento de dados mais antigos do mesmo programa não podem mais usar totalmente.

Outras restrições

Os sistemas proprietários e as restrições de direitos autorais tornam mais difícil copiar e migrar dados, o que é necessário para o arquivamento de longo prazo, porque as etapas necessárias não são conhecidas ou permitidas. A introdução da gestão de direitos digitais (DRM) em particular agravará o problema no futuro. Esse conjunto de regras para dados ou documentos digitais é necessário porque, assim como com os dados convencionais, as questões de direitos autorais devem ser esclarecidas antes que possam ser arquivados. A diferença entre dados convencionais e documentos eletrônicos resulta do fato de, neste último caso, a cópia e o original serem praticamente indistinguíveis. Ao migrar documentos em particular, é necessário fazer cópias e, se necessário, alterar os documentos originais. Portanto, o consentimento do autor para tais medidas deve ser obtido previamente. As demais cópias a serem entregues aos leitores dos documentos devem ser devidamente remuneradas e, se necessário, devem ser vinculadas a avisos de bloqueio, caso não possam ser transmitidas gratuitamente.

Encontrando informação

Não basta apenas copiar os dados originais: deve ser possível encontrá-los novamente no novo meio. Portanto, certos dados adicionais sobre a estrutura e o conteúdo dos dados originais, os chamados metadados , devem ser inseridos em catálogos, bancos de dados ou outros meios de pesquisa, a fim de estarem disponíveis para leitura ou pesquisa posterior de dados.

A consistência dos dados

Um problema frequentemente esquecido com o arquivamento de longo prazo, bem como com o arquivamento de curto prazo, é verificar se os dados estão livres de erros. Os dados podem ser modificados intencionalmente, mas também podem ser alterados despercebidos por erros do sistema.

Uma saída aqui poderia ser o armazenamento distribuído em diferentes locais em diferentes organizações e a proteção com somas de verificação criptográficas armazenadas distribuídas . Isso vai inter alia. praticado com a solução de código aberto LOCKSS . Na Alemanha também existe um projeto alemão ( LuKII ) que atende a esse requisito.

procedimento

Basicamente, os métodos de migração / conversão e emulação podem ser diferenciados no arquivamento eletrônico .

Através do uso de padrões abertos , como formatos gráficos ( TIFF , PNG , JFIF ) ou formatos de documentos livres ( XML , PDF / A , OpenDocument ), que são considerados relativamente longos e cuja estrutura é conhecida publicamente, os ciclos posteriores cujos dados salvos precisam ser reformatados por mais tempo. A probabilidade de que ainda existam sistemas e programas que podem ler esses dados em alguns anos é, portanto, significativamente maior.

Para evitar a perda de dados devido ao envelhecimento dos suportes de dados, os dados devem ser copiados regularmente para novos suportes de dados dentro do período de segurança de dados garantido de um meio. Isso significa que você também pode mudar para um novo formato de transportadora assim que o usado anteriormente se tornar obsoleto devido a novos desenvolvimentos técnicos .

No entanto, os altos custos que surgem desta manutenção dos estoques de dados significam que apenas os dados mais importantes podem ser preservados desta forma. A atual enxurrada de dados e metadados, causada principalmente pelo uso cada vez maior de sistemas de processamento digital de dados, agrava ainda mais o problema da melhor classificação possível de volumes de dados relevantes para o armazenamento. A proporção de dados armazenados de longo prazo será necessariamente relativamente pequena, o que gera altas demandas técnicas e de outras áreas específicas na seleção das informações a serem copiadas em termos de tecnologia de dados. Um problema adicional surge com o afastamento da relação entre o volume de dados e a largura de banda de dados. O volume cresce significativamente mais rápido do que a largura de banda disponível para transferir dados de um meio para outro. Isso não afeta apenas os dados governamentais e comerciais. Também no setor privado, as mídias convencionais, que muitas vezes podem ser armazenadas por muito tempo, estão sendo substituídas por mídias digitais mais gerenciáveis (fotografias e negativos por imagens digitais em um CD-ROM).

As bibliotecas e arquivos de cópias de depósito são responsáveis pelo arquivamento de longo prazo na Alemanha .

Veja também

literatura

Links da web

Wikilivros: arquivamento de longo prazo  - materiais de aprendizagem e ensino

Evidência individual

  1. Ute Schwens, Hans Liegmann: Arquivo de longo prazo de recursos digitais . In: Rainer Kuhlen, Thomas Seeger, Dietmar Strauch (eds.): Noções básicas de informação prática e documentação. 5ª edição, totalmente revisada. Munich: Saur, 2004, p. 567.
  2. Reinhard Altenhöner, Sabine Schrimpf: Conservação e disponibilidade de longo prazo dos recursos digitais: estratégia, organização e técnicas . In: Rolf Griebel, Hildegard Schäffler e Konstanze Söllner (eds.): Praxishandbuch library management . De Gruyter Saur, Berlin 2014, ISBN 978-3-11-030293-6 , pp. 850-872 .
  3. ^ Lothar Schmitz, Uwe M Borghoff, Peter Rödig, Jan Scheffczyk: Arquivo de longo prazo . In: Computer Science Spectrum . fita 28 , não. 6 , 1 de dezembro de 2005, ISSN  1432-122X , p. 489 , doi : 10.1007 / s00287-005-0039-7 .
  4. Arquivar DVDs no teste de longa duração -c't-Archiv, 16/2008, página 116. (Não mais disponível online.) In: heise.de. 16 de agosto de 2011, arquivado do original em 23 de julho de 2008 ; Recuperado em 20 de fevereiro de 2015 .
  5. mp: Um padrão uniforme para a inundação de dados digitais. 10 de março de 2008, acessado em 27 de outubro de 2012 .
  6. a b c Michael W. Gilbert: Expectativa e Cuidado de Vida da Mídia Digital. (Não mais disponível online.) University of Massachusetts Amherst, 1998, arquivado do original em 22 de dezembro de 2003 ; acessado em 4 de janeiro de 2011 .
  7. Bit Rot. Software Preservation Society, 7 de maio de 2009, acessado em 4 de janeiro de 2011 .
  8. Estudo do Google sobre a causa da falha dos discos rígidos. In: heise.de. 16 de fevereiro de 2007, acessado em 20 de fevereiro de 2015 .
  9. Estudo do Google sobre a durabilidade de discos rígidos em operação contínua ( Memento de 13 de fevereiro de 2009 no Internet Archive ) (PDF; 247 kB): Seção 3.1, Figura 2 (inglês)
  10. UNC: Discos rígidos e memória flash: diversão com potencial de risco. In: speicherguide.de. 29 de junho de 2006, arquivado do original em 24 de setembro de 2015 ; Recuperado em 17 de setembro de 2015 .
  11. ↑ Prazo de validade da mídia de armazenamento: onde os dados estão corretos. In: netzwelt.de. 22 de abril de 2007, acessado em 20 de fevereiro de 2015 .
  12. ^ Tom Coughlin: Mantendo dados por muito tempo. Acessado em 3 de janeiro de 2021 .
  13. Backup de dados ›Wiki› ubuntuusers.de. Recuperado em 3 de janeiro de 2021 .
  14. Henrik Stamm: tecnologia MO. Instituto de Ciência da Computação da Humboldt University Berlin, 26 de maio de 2001, acessado em 17 de setembro de 2015 .
  15. Hartmut Gieselmann: DVDs no teste de longo prazo - c't. In: heise.de. 21 de julho de 2008, acessado em 20 de fevereiro de 2015 .
  16. Uwe M. Borg Hoff u a..: Arquivo de longo prazo . Métodos de preservação de documentos digitais. dpunkt.-Verl., Heidelberg 2003, p. 21.
  17. Frank Dickmann: Arquivamento de longo prazo de dados de pesquisa: como você lida com peta e exabytes? In: Deutsches Ärzteblatt Supplement: Practice . fita 108 , não. 41 , 2011, p. 6–8 ( uni-goettingen.de [acessado em 24 de março de 2020]).
  18. Heike Neuroth, Stefan Strathmann, Achim Oßwald, Regine Scheffel, Jens Klump, Jens Ludwig (eds.): Arquivo de longo prazo de dados de pesquisa. Um inventário . Verlag Werner Hülsbusch, Universitätsverlag Göttingen, Boizenburg 2012, ISBN 978-3-86488-008-7 , p. 16 , urn : nbn: de: hbz: 79pbc-opus-4204 ( th-koeln.de [PDF]).
  19. Asko Lehmuskallio, Edgar Gómez Cruz: Por que práticas visuais materiais? In: Fotografia Digital e Cotidiano: Estudos Empíricos sobre Práticas Visuais Materiais . Routledge, 2016, ISBN 978-1-317-44778-8 , pp. 1 .
  20. Natascha Schumann: Introdução ao arquivamento digital de longo prazo . Scivero Verl., 2012, ISBN 978-3-944417-00-4 , pp. 46 ( ssoar.info [acessado em 24 de março de 2020]).