Linkrot en meer

O P E N   B R I E F

Deze Open Brief is vorige week verzonden naar de Archieven e.a.. Ter uwer informatie onderstaand deze brief.

aan: de Archieven
ter informatie: Archiefinspecteurs, Inspectie, Leden Vaste Kamercommissie
betreft: Linkrot en andere zaken …

Geachte dames, mijne heren,

Niet alleen namens de leden van HCC!genealogie maar ook namens al die andere genealogen die op zoek zijn naar hun voorouders en daarbij regelmatig via internet uw websites daarvoor raadplegen, wil HCC!genealogie uw aandacht vragen voor de hieronder beschreven problematiek en er bij u op aandringen om tot een oplossing daarvan te komen.

De laatste jaren prijzen we ons gelukkig omdat de archieven steeds meer akten digitaliseren door ze te scannen, te indexeren en op het internet ter raadpleging en downloading beschikbaar te stellen. Met name sites als WieWasWie en Open Archieven zijn hierin van groot belang. Maar ook de rol hierin van de sites van de regionale en streekarchieven mag niet worden onderschat.

Toch is er een tweetal zaken die voor veel irritatie bij de amateurgenealogen zorgt. In de eerste plaats is dat Linkrot. Dit is het feit dat een Internetadres naar bijvoorbeeld een akte of scan, die ooit werkte, nu niet meer werkt en er ook geen informatie over het juiste Internetadres wordt gegeven (of automatisch wordt doorverwezen).
Het tweede irritatiepunt betreft het feit dat bij een gevonden omschrijving van een akte niet naar de akte wordt doorverwezen wanneer men op het plaatje klikt (waarmee wordt aangegeven dat er een scan voorhanden is), maar dat men dan uitkomt op de kaft van een soms uit honderden pagina’s bestaand boekwerk waarin je zelf moet gaan zoeken naar de door jou gewenste akte. Voor deze irritatiepunten zijn technische oplossingen te vinden.

Kortom, het is nog niet alles goud wat er blinkt. Nog niet zo lang geleden werden de genealogen geconfronteerd met het opheffen van de populaire site Genlias. Nu is het niet zo dat wij van HCC!genealogie tegen ontwikkelingen en vernieuwingen zijn. Zeker niet als het gaat om het opheffen van een website die technisch aan het einde van haar product life cycle zit en niet meer met de oude software is uit te breiden of te verbeteren. Nee, het gaat ons om wat er verloren dreigt te gaan, nog los van de financiële consequenties van een opvolger van Genlias zoals WieWasWie.

Het punt is dat veel genealogen een link naar een akte noteren, zeker wanneer ze op dat moment nog geen tijd hebben de betreffende akte te downloaden. Als je later terug komt om dat alsnog te doen dan blijkt vaak dat de akte niet meer te vinden is en de link een zogenoemde http 404 (staat voor niet gevonden) of http 410 (staat voor was er ooit maar nu niet meer) code afgeeft. In het digitale tijdperk hoort een link naar de akte ook bij een goede bronvermelding, zodat ook anderen de bron kunnen controleren.

De site Open Archieven controleert steekproefsgewijs bij de bron de website van de archiefinstelling of de akten zoals die op de site worden getoond nog bestaan. Het idee is simpel. Open Archieven vraagt de akte op bij het archief (technisch: een z.g. HEAD request) en controleert het antwoord: http 200 code staat daarbij voor oké. Deze http codes zijn niet alleen van belang voor de vragende software (browser, script, Google, spider, et cetera), maar ook voor de eindgebruiker, de genealoog. Die moet informatie krijgen over wat er fout is gegaan en wat er aan gedaan kan worden.

In de metadata van de akte’s komt vaak ook een link voor naar de akte op de website van het archief en ook een link naar een scan van de akte. Maar uit controle blijkt dat de website van het archief vaak niet thuis geeft. Er wordt ook geen uitleg gegeven, dus als gebruiker heb je geen idee wat er aan de hand is. In enkele gevallen zegt de website van een archief :“geen resultaat gevonden”, logisch want er werd immers een niet meer bestaande pagina opgevraagd. Dit is niet goed! De websites zouden in deze gevallen een http 404 code moeten hebben opgeleverd (of beter: een http 301 naar het nieuwe adres van de akte als die bekend is). Door het nalaten van het geven van een duidelijke foutmelding aan de gebruiker en het eveneens nalaten van een volgens standaard geven van de juiste http code wordt er gedaan alsof er niets fout is, maar linkrot – zoals we dit noemen – kun je niet verbloemen.

Dat akten worden verwijderd of op een andere wijze toegankelijk gemaakt, gebeurt maar als akten andere namen krijgen wordt het een ander verhaal, erger soms ontbreekt er informatie zoals een folionummer. Maar het ergste is dus als het Internetadres hierdoor verandert. Een automatische verwijzing van de oude naar de nieuwe is er niet en wanneer je de oude pagina opvraagt wordt je niets wijzer.

HCC!genealogie vraagt daarom aan het archiefwezen om linkrot niet alleen te voorkomen maar ook gesignaleerde gevallen te herstellen iets wat technisch tot de mogelijkheden behoort. Ook vraagt zij in het geval er een scan van een bepaalde akte aanwezig is die scan ook te koppelen aan de omschrijving om zo te voorkomen dat er tientallen scans bekeken moeten worden voordat de gevraagde scan wordt gevonden. Wij verzoeken de archieven het mogelijk te maken dat scans direct kunnen worden opgevraagd waardoor de huidige doorverwijzing naar een boek met akten vervalt.

Het spreekt voor zich dat wij over de oplossing graag met u in overleg willen treden.

Met vriendelijke groet,
Mr. W. van Winterswijk, secretaris HCC!genealogie
Leiderdorp, februari 2018