Pàgina d'inici > Setmana dels mitjans digitals > 2005. La memòria d’internet

2005. La memòria d’internet

3r Seminari Internacional de Periodisme Digital (22 d’octubre de 2005)
La memòria d’Internet

  • Julien Masanès, European Archive
  • Ciro Llueca, Biblioteca Nacional de Catalunya

Julien Masanès, European Archive

La Web és probablement el mitjà on es publica més informació avui dia. Tots els aspectes de la nostra societat tenen reflex a Internet, fins i tot més que en els mitjans tradicionals: hi ha informació personal que no es troba habitualment en els altres mitjans. Per als investigadors del futur els donarà més informació sobre la societat actual que qualsevol altre document.

Els webs són efímers. La majoria de pàgines no duren més de 2 anys sense desaparèixer o canviar. Si una cosa desapareix d’Internet normalment és impossible recuperar-ho si no se n’han fet còpies.
Els reptes per arxivar-ho es basen en el fet que no hi ha documents estables, sempre poden estar evolucionant sense avís, i no tenen uns límits clars. El nombre de productors s’ha multiplicat i no saps ben bé qui són. La tecnologia a Internet evoluciona constantment, però els continguts són molt accessibles i són fàcils d’indexar automàticament si els captures.

Des de 1996 ‘Archive.org’ fa captures aleatòries cada 2 mesos, però pot perdre detalls dels canvis. Els webs que tenen arxius interns són un ajut, igual que les notificacions RSS. Els arxius digitals intenten respectar l’estructura original dels webs, perquè puguis navegar per ells com si naveguessis per l’original. Des del 97 s’arxiven imatges sistemàticament, però com que la captura d’Archive.org és superficial de vegades no arriben al fons.

Estratègies d’arxivació:

  • Centrats en un domini nacional
  • Centrats en un tema: Archipol, Minerva, Dachs
  • Extensives (més webs, menys profundes)
  • Intensives (més a fons en els continguts, exhaustiva)

Volem construir una xarxa d’arxius: cada iniciativa pot concentrar-se en un aspecte, i estar enllaçades entre elles. Busquem estàndards per fer-ho possible, d’estructura, metadades…
European Archive es va crear al 2004 com un servei sense ànim de lucre. A europarchive.org (en 2 setmanes activa) volem ser molt més exhaustius dintre dels webs, per capturar les imatges i tot el contingut. Estan desenvolupant un crawler específic, que farà millor la feina que el d’Archive.org, que el prestat Alexa, un cercador, no dissenyat específicament per arxivar.

Ciro Llueca, Biblioteca Nacional de Catalunya

Hi ha moltes biblioteques nacionals que treballen des de fa més o menys temps en arxivar internet. El més rellevant és Kulturarw de Suècia, des de 1996. Fan 2 captures globals anuals i una captura diària cada dia dins dels dominis escandinaus.
Pandora (Austràlia, des de 1996, fan un arxiu selectiu, demanant als webs que els avisin quan fan canvis importants). A Dinamarca (netarchive.dk) tenen un model híbrid: captura global, dipòsit de webs amb acord i arxiu manual per temes o esdeveniments rellevants.

Patrimoni Digital de Catalunya s’encarrega a Catalunya de:

  • Recollida sistemàtica i automàtica de webs
  • Recollida selectiva per acords amb webs per arribar a més profunditat
  • Recollida per temes

El repte és fer-ho conservant tant el contingut com l’aspecte, i difondre-ho: fer que sigui accessible a la societat. Al 2005 s’està planificant el projecte. Al 2006 farem un pla pilot i una captura global. Al 2007 començarem l’arxivació sistemàtica. Volem indexar 100.000 webs, 50 milions d’arxius i tenir acords amb 300 institucions per fer una indexació més profunda. Caldrà negociar amb els diaris quina fórmula es pot fer si ja disposen d’una hemeroteca de pagament.

Anuncis
  1. Encara no hi ha cap comentari.
  1. No trackbacks yet.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out /  Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out /  Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out /  Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out /  Canvia )

S'està connectant a %s

%d bloggers like this: