Arquivo de longo prazo
O arquivamento de longo prazo ( LTA ) é definido como a aquisição, o armazenamento de longo prazo e a preservação da disponibilidade permanente de informações . Especialmente com o arquivamento de longo prazo de informações disponíveis digitalmente ( preservação digital ), surgem novos problemas. Para a preservação dos recursos digitais, “longo prazo” não significa a emissão de garantia de cinco ou cinquenta anos, mas sim o desenvolvimento responsável de estratégias que possam fazer face às constantes mudanças provocadas pelo mercado da informação.
definição
Uma definição geralmente válida do termo ainda não existe. Como os arquivos sempre guardam material de arquivo “para a eternidade”, o termo arquivo de longa duração também é um pleonasmo e, segundo a contribuição de Reinhard Altenhöner e Sabine Schrimpf, sugere um estado estático. Ambos, portanto, defendem o termo "disponibilidade de longo prazo" (LZV).
Como muitos dos problemas de arquivamento digital de longo prazo ocorrem somente após cerca de dez anos, como grandes saltos de versão no software usado, esse valor é usado como um limite para considerar o arquivamento de longo prazo. Além disso, o arquivamento de longo prazo pode ser diferenciado do backup de dados .
Problemas
Embora os objetos físicos tenham sido mantidos e preservados em arquivos , museus e bibliotecas por muito tempo, problemas completamente novos surgem com as publicações eletrônicas . Se os dados forem armazenados na forma analógica, a qualidade dos dados se deteriora com a degradação do meio, razão pela qual o foco está na preservação do meio. Os dados armazenados digitalmente, por outro lado, podem ser reconstruídos por formatação adequada no caso de pequenos erros no meio, pelo que uma qualidade de dados constante pode ser garantida apesar da deterioração do meio. Se esses erros no meio se tornarem muito grandes, os dados não podem mais ser completamente reconstruídos e, portanto, são irremediavelmente perdidos ("esquecimento digital"). Portanto, quando se trata de arquivamento de longo prazo de dados digitais, o foco não é mais preservar o meio, mas sim copiá-lo em tempo hábil, antes que os dados sejam perdidos. Uma vez que a mídia (por exemplo, fita magnética e DVD), formatos e dispositivos de leitura / gravação para armazenamento digital mudam rapidamente ao longo do tempo, o teste regular e a continuidade entre as mudanças requerem atenção constante e planejamento de longo prazo. Formatos proprietários e restrições de direitos autorais , entre outras coisas, causam problemas ao transferir para novos sistemas .
Prazo de validade da mídia transportadora
Por exemplo, embora pergaminhos e papéis velhos possam ser guardados por centenas de anos se armazenados adequadamente, isso não se aplica a novas mídias de armazenamento . A maioria das publicações da primeira metade do século 20 são impressas em papel degradado pela corrosão ácida . Em trabalhos impressos e manuscritos mais antigos, surgem outros problemas: se a tinta de galha de ferro for usada na fabricação, os ingredientes da tinta podem ser causados por misturas desequilibradas de corrosão da tinta . Isso ocorre quando a tinta é um excedente de ácido gálico ou prevalece o excedente de vitríolo . A celulose é atacada de maneira semelhante à corrosão ácida, e o papel pode quebrar devido a diferentes níveis de umidade e mudanças ao longo das linhas das letras.
Filmes analógicos, fotos e fitas magnéticas também têm uma vida útil limitada. A vida útil da mídia de armazenamento digital, como disquetes, discos rígidos e CDs / DVDs gravados, é ainda mais curta. Portadores de dados digitais perdem seus dados estruturados específicos de mídia devido a influências ambientais (por exemplo, devido a campos magnéticos suficientemente fortes nas proximidades de disquetes e fitas magnéticas), ou uma estrutura de dados é alterada tanto por influências químicas ou físicas que não mais dados podem ser armazenados nele ou os dados que já foram gravados não podem mais ser lidos (por exemplo, se os CD-ROMs foram expostos à radiação ultravioleta por um período de tempo suficientemente longo). Muitas vezes, a legibilidade dos dados só falha porque os dispositivos e programas de leitura apropriados para torná-los legíveis não estão mais disponíveis posteriormente, ou porque os padrões de formatação de dados mais antigos não podem mais ser interpretados, ou porque as interfaces técnicas de leitura de dados muito antigos dispositivos não são mais suportados. A fim de evitar os problemas acima mencionados, pode fazer sentido (re) converter certos dados selecionados, armazenados eletronicamente (de volta) para a forma não eletrônica e esculpir dados importantes em pedra permanentemente - como um equivalente moderno do hábito cultural de nossos ancestrais, por assim dizer - gravam em uma placa de níquel quase indestrutível usando um feixe de íons.
Outro método de armazenamento permanente de imagens e textos em formato legível analógico é queimá-los em placas de grés usando pigmentos de cerâmica . O projeto Memória da Humanidade (MOM) armazena imagens de ativos culturais de museus e produtos culturais do dia-a-dia em placas de grés e os armazena em câmaras na montanha de sal de Hallstatt . A durabilidade teórica é dada em centenas de milhares de anos. A durabilidade de um suporte de dados de cerâmica foi comprovada por pelo menos 5000 anos ( comprimidos cuneiformes ).
médio | Vida útil esperada | Densidade de gravação (kbit / kg) |
---|---|---|
Painéis cerâmicos | 5.000 anos (garantido), provavelmente vários 10.000 anos | |
Painéis de grés com impressão a cores de cerâmica queimada | vários 100.000 anos, se protegido contra a erosão (presumido) | |
Tabletes e pinturas em pedra | vários 1.000 anos (garantido) | 1 × 10 −3 - 1 |
Placa de níquel | vários 1.000 anos (presumido) | |
Livros e manuscritos feitos a partir de ácido livre de papel e com livre de ácido e isento de ferro tintas |
vários 100 anos (garantido) | 3 × 10 3 - 3 × 10 4 |
Livros e manuscritos feitos de papel ácido (especialmente trabalhos impressos do século 19 e início do século 20) |
70 - 100 anos | |
Papel de jornal | análogo ao papel tipográfico ácido / livre | |
Filmes em celulóide (nitrato de celulose) | mais de 100 anos (garantido), provavelmente até 400 anos | |
Filmes sobre triacetato de celulose | 44 anos (garantido) | |
Filmes em tereftalato de polietileno (PET) | Filme colorido de até 150 anos (presumido)
Filme preto e branco até 700 anos (presumido) |
|
Mídia de armazenamento óptico (queimado) b |
|
|
Mídia de armazenamento óptico (pressionado) |
|
|
Disquetes como mídia de arquivo (armazenados) | 10 - 30 anos (dependendo da densidade de dados?) |
|
Unidades de disco rígido dinâmicas | 2 - 10 anos, dependendo do tempo de operação diário, uma média de 5 anos | |
Unidades de disco rígido como mídia de arquivo (armazenada) | 10-30 anos | |
Memória Flash (armazenada) | 2 - 10 anos | |
Fitas magnéticas | > 30 anos (garantido) | |
Disco magneto óptico (disco MO) | 30 - 50 anos | |
Unidade removível Iomega REV | até 30 anos (presumido) |
Mídia rápida e mudança de sistema
No caso de informações armazenadas digitalmente em particular, existe o problema adicional de os dados não estarem mais acessíveis, embora o meio em si tenha sido preservado.
Legibilidade do meio de armazenamento
Para poder acessar as informações armazenadas, o respectivo meio portador deve ser capaz de ser lido (para fora). Com algumas mídias, como tábuas de pedra ou livros, isso também pode ser possível para uma pessoa sem ajuda. No caso de mídia armazenada digitalmente, um dispositivo de leitura apropriado, geralmente uma unidade, geralmente é necessário. Se os dispositivos de leitura não estiverem mais disponíveis, por exemplo, devido a uma mudança tecnológica, os dados não podem mais ser lidos, ou apenas com dificuldade. Um exemplo são os formatos de fita desatualizados .
Formatos de dados desatualizados
Mesmo que a mídia de armazenamento tenha sido preservada e ainda seja legível, pode ser impossível acessar os dados armazenados. Como os dados armazenados digitalmente não são imediatamente acessíveis, mas são codificados digitalmente e estruturados de maneira específica para a mídia, só é possível ler esses dados se um programa e um sistema operacional estiverem disponíveis que “entendam” o conteúdo de um arquivo. Como muitos sistemas operacionais e programas usam seus próprios processos (proprietários) para codificar os dados, a legibilidade dos dados não pode mais ser garantida assim que um sistema operacional ou programa não for mantido continuamente. Esse problema é agravado pela política de muitos fabricantes de software de publicar novas versões de programas com formatos de armazenamento de dados alterados, que formatos de armazenamento de dados mais antigos do mesmo programa não podem mais usar totalmente.
Outras restrições
Os sistemas proprietários e as restrições de direitos autorais tornam mais difícil copiar e migrar dados, o que é necessário para o arquivamento de longo prazo, porque as etapas necessárias não são conhecidas ou permitidas. A introdução da gestão de direitos digitais (DRM) em particular agravará o problema no futuro. Esse conjunto de regras para dados ou documentos digitais é necessário porque, assim como com os dados convencionais, as questões de direitos autorais devem ser esclarecidas antes que possam ser arquivados. A diferença entre dados convencionais e documentos eletrônicos resulta do fato de, neste último caso, a cópia e o original serem praticamente indistinguíveis. Ao migrar documentos em particular, é necessário fazer cópias e, se necessário, alterar os documentos originais. Portanto, o consentimento do autor para tais medidas deve ser obtido previamente. As demais cópias a serem entregues aos leitores dos documentos devem ser devidamente remuneradas e, se necessário, devem ser vinculadas a avisos de bloqueio, caso não possam ser transmitidas gratuitamente.
Encontrando informação
Não basta apenas copiar os dados originais: deve ser possível encontrá-los novamente no novo meio. Portanto, certos dados adicionais sobre a estrutura e o conteúdo dos dados originais, os chamados metadados , devem ser inseridos em catálogos, bancos de dados ou outros meios de pesquisa, a fim de estarem disponíveis para leitura ou pesquisa posterior de dados.
A consistência dos dados
Um problema frequentemente esquecido com o arquivamento de longo prazo, bem como com o arquivamento de curto prazo, é verificar se os dados estão livres de erros. Os dados podem ser modificados intencionalmente, mas também podem ser alterados despercebidos por erros do sistema.
Uma saída aqui poderia ser o armazenamento distribuído em diferentes locais em diferentes organizações e a proteção com somas de verificação criptográficas armazenadas distribuídas . Isso vai inter alia. praticado com a solução de código aberto LOCKSS . Na Alemanha também existe um projeto alemão ( LuKII ) que atende a esse requisito.
procedimento
Basicamente, os métodos de migração / conversão e emulação podem ser diferenciados no arquivamento eletrônico .
Através do uso de padrões abertos , como formatos gráficos ( TIFF , PNG , JFIF ) ou formatos de documentos livres ( XML , PDF / A , OpenDocument ), que são considerados relativamente longos e cuja estrutura é conhecida publicamente, os ciclos posteriores cujos dados salvos precisam ser reformatados por mais tempo. A probabilidade de que ainda existam sistemas e programas que podem ler esses dados em alguns anos é, portanto, significativamente maior.
Para evitar a perda de dados devido ao envelhecimento dos suportes de dados, os dados devem ser copiados regularmente para novos suportes de dados dentro do período de segurança de dados garantido de um meio. Isso significa que você também pode mudar para um novo formato de transportadora assim que o usado anteriormente se tornar obsoleto devido a novos desenvolvimentos técnicos .
No entanto, os altos custos que surgem desta manutenção dos estoques de dados significam que apenas os dados mais importantes podem ser preservados desta forma. A atual enxurrada de dados e metadados, causada principalmente pelo uso cada vez maior de sistemas de processamento digital de dados, agrava ainda mais o problema da melhor classificação possível de volumes de dados relevantes para o armazenamento. A proporção de dados armazenados de longo prazo será necessariamente relativamente pequena, o que gera altas demandas técnicas e de outras áreas específicas na seleção das informações a serem copiadas em termos de tecnologia de dados. Um problema adicional surge com o afastamento da relação entre o volume de dados e a largura de banda de dados. O volume cresce significativamente mais rápido do que a largura de banda disponível para transferir dados de um meio para outro. Isso não afeta apenas os dados governamentais e comerciais. Também no setor privado, as mídias convencionais, que muitas vezes podem ser armazenadas por muito tempo, estão sendo substituídas por mídias digitais mais gerenciáveis (fotografias e negativos por imagens digitais em um CD-ROM).
As bibliotecas e arquivos de cópias de depósito são responsáveis pelo arquivamento de longo prazo na Alemanha .
Veja também
- ArchiSig e ArchiSafe - projetos do governo alemão para arquivamento de longo prazo
- Barbarastollen - O maior arquivo europeu para arquivamento de longo prazo
- Gestão do ciclo de vida da informação
- Arquivo da Internet , arquivo da web
- KEO - satélite como uma cápsula do tempo
- Microfilme - uma forma alternativa e mais antiga de arquivamento de longo prazo
- Memória da humanidade
- OPENARCHIVE - software de arquivo de longo prazo de código aberto
- Estudo de longo prazo
- Stein von Rosette - exemplo de arquivamento de longo prazo com séculos de idade, tentativa moderna de melhoria no projeto Rosetta
literatura
- Holger Schneider: Digital Amnesia: Arquivo de longo prazo de documentos digitais em um ambiente de negócios , Herne 2012, ISBN 978-3-8448-1144-5
- Reinhard Altenhöner, Sabine Schrimpf: Preservação e disponibilidade a longo prazo dos recursos digitais: estratégia, organização e técnicas . Em: Rolf Griebel, Hildegard Schäffler e Konstanze Söllner (eds.): De Gruyter Saur, Berlin 2014, ISBN 978-3-11-030293-6 , pp. 850-872.
- Ralf Blittkowsky: Arquivando as fórmulas de cálculo? . Em Telepolis. Heise-Verlag 14 de fevereiro de 2004.
- Uwe M. Borghoff , Peter Rödig, Jan Scheffczyk, Lothar Schmitz: Long-term archiving . Dpunkt Verlag, 2003 ISBN 3-89864-245-3 .
- Bernward Helfer, Karl-Ernst Lupprian (arr.): Formatos de arquivo. Propriedades e adequação para arquivamento de documentos eletrônicos. Uma apostila para arquivistas. Wiesbaden e Munique 2004.
- Georg Hohmann: Eternidade digital e museus virtuais . In: Telepolis. Heise-Verlag 30 de outubro de 2003.
- Ulrich Kampffmeyer , Jörg Rogalla: Princípios de arquivamento eletrônico . VOI Compendium Volume 3. VOI Association of Organizational and Information Systems e. V., Darmstadt 1997, ISBN 3-932898-03-6 .
- Heike Neuroth, Achim Oßwald, Regine Scheffel, Stefan Strathmann, Mathias Jehn: nestor handbook Uma pequena enciclopédia de arquivamento digital de longo prazo , Hülsbusch, maio de 2009, ISBN 3-940317-48-9 .
- Roy Rosenzweig: Escassez ou abundância? Preservando o passado em uma era digital . In: American Historical Review 108, 3 de junho de 2003, pp. 735-762.
- Sabine Schrimpf, Tobias Steinke: Política de Arquivo de Longo Prazo da Biblioteca Nacional Alemã , Versão 1.2, em 4 de maio de 2018.
- Katherine Skinner, Matt Schultz: A Guide to Distributed Digital Preservation (PDF, 156 S.; 3.1 MB), Educopia Institute Atlanta, 2010, Licença: CC-BY-NC-ND-3.0 , ISBN 978-0-9826653-0- 5 .
- Ute Schwens, Hans Liegmann: Arquivo de longo prazo de recursos digitais . In: Rainer Kuhlen, Thomas Seeger, Dietmar Strauch (eds.): Noções básicas de informação prática e documentação. 5ª edição, totalmente revisada. Munique: Saur, 2004.
- Thorsten Wetzenstein: Arquivo digital de longo prazo sob o aspecto de acesso. Tese. Universidade de Heidelberg. 2010.
- Federal Office for Information Security (Ed.), Manual de proteção de base de TI. (Aqui: Seção M 4.170: Seleção de formatos de dados adequados para arquivamento de documentos, status 2007).
- Diretriz técnica BSI 03125: Preservação do valor probatório de documentos assinados criptograficamente.
- Tutorial de preservação digital. Cornell.
- Arquivo digital de coleções fotográficas - um relatório básico da Universidade de Basel e da Agência Suíça de Proteção à Propriedade Cultural.
- Diretrizes para a Preservação do Patrimônio Digital. UNESCO, março de 2003.
Links da web
- Rede de competência NESTOR para arquivamento de longo prazo de fontes digitais na Alemanha
- kopal - Desenvolvimento cooperativo de um arquivo de longo prazo de informações digitais
- O escritório de coordenação para o arquivo permanente de documentos eletrônicos da Associação Suíça de Arquivos, entre outros. com detalhes sobre formatos de arquivo
- Regras de prática DFG "Digitalização"
Evidência individual
- ↑ Ute Schwens, Hans Liegmann: Arquivo de longo prazo de recursos digitais . In: Rainer Kuhlen, Thomas Seeger, Dietmar Strauch (eds.): Noções básicas de informação prática e documentação. 5ª edição, totalmente revisada. Munich: Saur, 2004, p. 567.
- ↑ Reinhard Altenhöner, Sabine Schrimpf: Conservação e disponibilidade de longo prazo dos recursos digitais: estratégia, organização e técnicas . In: Rolf Griebel, Hildegard Schäffler e Konstanze Söllner (eds.): Praxishandbuch library management . De Gruyter Saur, Berlin 2014, ISBN 978-3-11-030293-6 , pp. 850-872 .
- ^ Lothar Schmitz, Uwe M Borghoff, Peter Rödig, Jan Scheffczyk: Arquivo de longo prazo . In: Computer Science Spectrum . fita 28 , não. 6 , 1 de dezembro de 2005, ISSN 1432-122X , p. 489 , doi : 10.1007 / s00287-005-0039-7 .
- ↑ Arquivar DVDs no teste de longa duração -c't-Archiv, 16/2008, página 116. (Não mais disponível online.) In: heise.de. 16 de agosto de 2011, arquivado do original em 23 de julho de 2008 ; Recuperado em 20 de fevereiro de 2015 .
- ↑ mp: Um padrão uniforme para a inundação de dados digitais. 10 de março de 2008, acessado em 27 de outubro de 2012 .
- ↑ a b c Michael W. Gilbert: Expectativa e Cuidado de Vida da Mídia Digital. (Não mais disponível online.) University of Massachusetts Amherst, 1998, arquivado do original em 22 de dezembro de 2003 ; acessado em 4 de janeiro de 2011 .
- ↑ Bit Rot. Software Preservation Society, 7 de maio de 2009, acessado em 4 de janeiro de 2011 .
- ↑ Estudo do Google sobre a causa da falha dos discos rígidos. In: heise.de. 16 de fevereiro de 2007, acessado em 20 de fevereiro de 2015 .
- ↑ Estudo do Google sobre a durabilidade de discos rígidos em operação contínua ( Memento de 13 de fevereiro de 2009 no Internet Archive ) (PDF; 247 kB): Seção 3.1, Figura 2 (inglês)
- ↑ UNC: Discos rígidos e memória flash: diversão com potencial de risco. In: speicherguide.de. 29 de junho de 2006, arquivado do original em 24 de setembro de 2015 ; Recuperado em 17 de setembro de 2015 .
- ↑ Prazo de validade da mídia de armazenamento: onde os dados estão corretos. In: netzwelt.de. 22 de abril de 2007, acessado em 20 de fevereiro de 2015 .
- ^ Tom Coughlin: Mantendo dados por muito tempo. Acessado em 3 de janeiro de 2021 .
- ↑ Backup de dados ›Wiki› ubuntuusers.de. Recuperado em 3 de janeiro de 2021 .
- ↑ Henrik Stamm: tecnologia MO. Instituto de Ciência da Computação da Humboldt University Berlin, 26 de maio de 2001, acessado em 17 de setembro de 2015 .
- ↑ Hartmut Gieselmann: DVDs no teste de longo prazo - c't. In: heise.de. 21 de julho de 2008, acessado em 20 de fevereiro de 2015 .
- ↑ Uwe M. Borg Hoff u a..: Arquivo de longo prazo . Métodos de preservação de documentos digitais. dpunkt.-Verl., Heidelberg 2003, p. 21.
- ↑ Frank Dickmann: Arquivamento de longo prazo de dados de pesquisa: como você lida com peta e exabytes? In: Deutsches Ärzteblatt Supplement: Practice . fita 108 , não. 41 , 2011, p. 6–8 ( uni-goettingen.de [acessado em 24 de março de 2020]).
- ↑ Heike Neuroth, Stefan Strathmann, Achim Oßwald, Regine Scheffel, Jens Klump, Jens Ludwig (eds.): Arquivo de longo prazo de dados de pesquisa. Um inventário . Verlag Werner Hülsbusch, Universitätsverlag Göttingen, Boizenburg 2012, ISBN 978-3-86488-008-7 , p. 16 , urn : nbn: de: hbz: 79pbc-opus-4204 ( th-koeln.de [PDF]).
- ↑ Asko Lehmuskallio, Edgar Gómez Cruz: Por que práticas visuais materiais? In: Fotografia Digital e Cotidiano: Estudos Empíricos sobre Práticas Visuais Materiais . Routledge, 2016, ISBN 978-1-317-44778-8 , pp. 1 .
- ↑ Natascha Schumann: Introdução ao arquivamento digital de longo prazo . Scivero Verl., 2012, ISBN 978-3-944417-00-4 , pp. 46 ( ssoar.info [acessado em 24 de março de 2020]).