Saltar para o conteúdo principal

Arquivo.pt preservou dados online de projetos europeus do H2020

O Arquivo.pt, serviço gerido pela FCCN, a Unidade de Computação Científica da FCT, preservou recentemente 197 milhões de ficheiros da web que documentam projetos de investigação e desenvolvimento financiados pelo programa europeu Horizonte 2020. Esta preservação digital permite salvaguardar cerca de 17 Terabytes de informação e evitar que a informação seja perdida para sempre.

Depois de identificar e preservar websites de projetos de investigação e desenvolvimento, financiados pela União Europeia durante os programas FP4, FP5, FP6 e FP7 (de 1994 a 2013), o Arquivo.pt guardou agora informação online valiosa em risco de desaparecer no âmbito do programa Horizonte 2020 (2014 a 2021).

Nos recentes anos, o recurso a websites para a documentação de atividades de projetos de investigação tem vindo a aumentar. Estes sítios na web disponibilizam informação científica relevante que complementa a literatura publicada, como, por exemplo, a disponibilização de conjuntos de dados abertos, apresentações em eventos ou software desenvolvido. Com o final dos projetos, esta informação corria o risco de se perder irremediavelmente.

A tarefa de identificação dos projetos de investigação envolveu várias metodologias e o recurso ao portal de dados abertos da União Europeia. No entanto, este portal não disponibiliza toda a informação, e muitos projetos omitiam o website. Foi por isso necessário recorrer a ferramentas desenvolvidas pelo Arquivo.pt para complementar a informação em falta. Por exemplo, o site do projeto Extended Model of Organic Semiconductors (EXTMOS), que esteve disponível em extmos.eu, já estava inativo. No entanto, a informação está totalmente acessível via Arquivo.pt.

O Arquivo.pt disponibiliza mais informação sobre este trabalho e continua a convidar todos os utilizadores a sugerir sites que possam ser preservados.

O Arquivo.pt é um serviço público, gratuito e de acesso livre a todos os utilizadores da web. Todos os dias são publicadas milhões de páginas na web, mas 80% desta informação desaparece 1 ano após a sua publicação e fica inacessível. O Arquivo.pt tem como função contrariar esta tendência e permitir a pesquisa e recuperação de informação de sites antigos.