Het probleem van digitale vindbaarheid in archieven

Als informatie op internet niet via Google vindbaar is, bestaat het voor een grote groep mensen niet. Daar ligt precies het pijnpunt van archieven. De archieven zijn zo in elkaar gezet dat er aanwijzingen in inventarissen staan waarmee je meer informatie kan vinden. Veel van die inventarissen staan online, maar daarmee is het grootste deel van de informatie nog niet digitaal doorzoekbaar. En de inventarissen zelf geven de beginnende onderzoeker te weinig houvast om zonder veel tijd, geduld, en/of enige uitleg makkelijk de weg te vinden. Veel archiefinstellingen spelen daar tegenwoordig op in. Aan de ene kant zijn zij hard bezig met het digitaliseren van de archieven, en aan de andere kant transformeren zij naar een digitale dienstverlening met chatfuncties en aanwezigheid op sociale media en communities. Dat het onderwerp onder de aandacht is, blijkt uit het feit dat het derde archiefatelier in 2015-2016 dit als onderwerp van onderzoek had.

Met digitaliseren ben je er nog niet

Digitaliseren van archieven alleen is namelijk niet genoeg. Het betekent namelijk nog niet dat je tekst daarmee doorzoekbaar is geworden. Optical character recognition (OCR) werd al ontwikkeld in de jaren 70 van de vorige eeuw. De programma’s, algoritmes en herkenning worden steeds beter. Sinds een aantal jaar is met OCR gedrukte tekst goed doorzoekbaar. Een mooi voorbeeld hiervan is de website Delpher. Op deze website kun je sinds 2014 oude kranten, boeken en tijdschriften doorzoeken.

Maar de techniek om geschreven teksten om te zetten moet nog meer ontwikkeld worden. Er zijn een aantal verschillende veelbelovende initiatieven. Zo wordt er aan de Rijksuniversiteit in Groningen gewerkt aan patroonherkenning van woorden (keyword spotting). En op Europees niveau wordt er door READ gewerkt aan een manier om artificiële intelligentie, patroonherkenning, taalmodellen en machine learning te combineren voor het ‘transcriberen’ van archiefdocumenten. Voorlopig nadeel is dat er nu nog mensen nodig zijn die de programma’s in eerste instantie leren hoe de informatie moet worden geïnterpreteerd. Na genoeg training kan een tekst automatisch omgezet worden. Toch is dit voor organisaties te prefereren boven handmatig overtikken van de teksten. Dit kost namelijk veel tijd en is zonder vrijwilligers niet te betalen.

Via de crowd

In Nederland is sinds 2010 het initiatief Vele Handen. Op deze website kan iedereen met een computer en vrije tijd helpen met het toegankelijk maken van archieven. Je kunt eerst wat oefenen, aanmelden en een project uitkiezen die jou aanspreekt. Zo kun je helpen met het beschrijven van foto’s uit het Ajax archief of akten uit het Amsterdams notariële archief toegankelijk maken.

Het leuke van deze site is dat je kan zien met hoeveel mensen je aan een project bezig bent, hoe lang het project loopt, hoeveel scans er in het totaal zijn en hoeveel procent van de scans al zijn gedaan. Een document wordt door 3 verschillende mensen behandeld. Twee vrijwilligers vullen in wat zij denken dat er staat en een derde vrijwilliger controleert of de informatie juist is. Dat sommige handschriften moeilijk leesbaar zijn heeft in de provincie Noord-Brabant geleid tot het maken van de website Wat staat daer. Hiermee kan je oefenen met het ontcijferen van oude handschriften op een leuke en interactieve manier.

compilatie.png
linkerzijde screenshot website Vele Handen – rechterzijde screenshot website Wat staat daer

 

De site van Vele handen is goed opgebouwd en je ziet diverse digitale marketingtechnieken terug. Er is goed nagedacht over hoe potentiële vrijwilligers over de streep gehaald kunnen worden om mee te doen. Bijvoorbeeld de eerdergenoemde mogelijkheid om te kiezen welk project het beste bij jou past en de informatie over de voortgang van de projecten. Er wordt daarnaast ingespeeld op het gemak; de webpagina is zeer overzichtelijk en je kunt waar en wanneer het jou uitkomt aan werken. Je hoeft geen minimale uren mee te doen aan een project en er is geen tijdsdruk maar wel een beloning in de vorm van punten. Met behulp van testimonials wordt er verteld hoe leuk en verslavend het is om te helpen. De leden kunnen elkaar onderling vinden in een forum op de site waar vele tips en tricks worden gedeeld zodat er ook een community is ontstaan. Natuurlijk wordt er gelinkt naar sociale media. Zo vind je berichten op Facebook en Twitter van enthousiaste vrijwilligers of vind je informatie over nieuwe projecten.

Initiatiefnemers van het eerste uur; het stadsarchief van Amsterdam, plaatst regelmatig foto’s op Facebook onder de hashtag “velehanden zoekplaatje”. Dit met het doel om adressen van de gebouwen te vinden. Hier wordt ingespeeld op gamification. Het is een sport om zo snel mogelijk het goede adres te vinden en deze met behulp van Google maps te bewijzen. Dat de samenwerking met geïnteresseerde burgers goed bevalt kun je zien aan het feit dat vele archiefinstellingen op hun eigen site net als het Stadsarchief oproepen om zoekplaatjes op te lossen.

Digitale dienstverlening

Zo lang informatie niet goed doorzoekbaar is, is het zaak voor archiefinstellingen om mensen zo veel mogelijk online te helpen met het zoeken naar informatie. Want we willen graag van huis uit onderzoeken. Daarom is het van belang dat bij behoefte vragen snel digitaal beantwoord kunnen worden. Tijdens openingsuren zijn er veelal mogelijkheden tot contact via een chatoptie of sociale media. Maar misschien wordt het ook wel tijd dat archieven zich langer beperken tot de openingstijden en zorgen dat het online langer mogelijk is om ondersteuning te krijgen. Gelukkig zijn er veel onderzoekers (en daaronder archivarissen) die hun kennis willen delen. Er zijn verschillende actieve fora waar, vooral over genealogisch onderzoek, vragen en antwoorden worden besproken. De community lost het zelf op en misschien is dat zo gek nog niet.

Vond je mijn artikel interessant? Of wil je meer weten over archieven? Laat een reactie achter, dat vind ik sowieso leuk en ik zal zo snel mogelijk proberen te antwoorden. Ik heb ook nog een vlog gemaakt met tips over gebroken links, die vind je hier!

Advertenties

3 reacties Voeg uw reactie toe

  1. Ruben Coelho schreef:

    Interessant! Ik had geen idee dat er zulke tools (zoals Wat staat daer) bestonden.

    Like

    1. karinkuilboer schreef:

      Leuk dat je het artikel hebt gelezen Ruben!

      De website is dit jaar gelanceerd en is erg verslavend om te doen. Tenminste als je van puzzelen houdt. Het is bijzonder om te zien hoe sommige letters zijn veranderd over de tijd heen. Als je vaker met oude teksten te maken krijg is het echt aan te bevelen om een paar keer deze website te bezoeken.

      Like

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s