Linked Open Data in Memorix Nexus

In 2024 hebben verschillende Noord-Hollandse archiefinstellingen waaronder het Regionaal Archief Alkmaar meegewerkt aan Proof of Contexts, een project van het Stadsarchief Amsterdam en het Noord-Hollands Archief in Haarlem. Hierin onderzochten de initiatiefnemers in hoeverre het mogelijk is om een bestaand archief met een klassieke hiërarchische rubriekenstructuur om te zetten naar een archief zonder rubrieken, met metadata die in een netwerkstructuur op bestanddeelniveau aan elkaar gekoppeld zijn. Deze pilot heeft uitgewezen dat het mogelijk is om een bestaand archief naar een Linked Open Data (LOD)-netwerkstructuur om te zetten, mits er eenduidige keuzes worden gemaakt over de vast te leggen metadata op het bestanddeelniveau.  

Het Regionaal Archief Alkmaar (RAA) heeft vervolgens een pilot uitgevoerd om te onderzoeken in hoeverre het mogelijk is om een nieuw archief direct te inventariseren en beschrijven binnen zo'n netwerkstructuur, gebruikmakend van Memorix Nexus. Daarnaast is gekeken naar het omzetten van een bestaande inventaris naar linked open data.  Dit had als doel om te kijken of de onderzochte conclusies van de Proof of Contexts pilot blijven staan bij een groter archief met een uitgebreidere rubriekenstructuur.

Als basis zijn de recordtypes Archiefblok, Bestanddeel en Groep van het Stadsarchief Amsterdam gebruikt. Om de metadata op bestanddeelniveau vast te leggen heeft het RAA in navolging van Proof of Contexts 2 metadatavelden toegevoegd aan het recordtype Bestanddeel: categorie en documenttype. 

Twee archieven: De Duinranders en Gemeentepolitie Alkmaar

Het werken met Memorix Nexus biedt veel kansen voor het beter toegankelijk maken van archieven met Linked Open Data. De interface is voor de archiefmedewerker overzichtelijk en er zijn bovendien meer opties om bestanddelen en archiefblokken te bewerken.

Om de mogelijkheden van het vervallen van de rubriekenstructuur en verzamelbeschrijvingen te testen, is het archief van sportvereniging ‘De Duinranders’ gebruikt als pilot om een nieuwe inventaris te maken. Het archief van ‘De Duinranders’ bestaat uit meerdere archiefvormers en is een redelijk klein en overzichtelijk archief. Dit archief biedt derhalve veel mogelijkheden om Linked Open Data toe te voegen. In Nexus is hiervoor een archiefblok aangemaakt met een fictief bloknummer.

Voor het omzetten van een bestaande inventaris is gekozen voor het archief van de 'Gemeentepolitie Alkmaar'. Het archief van de 'Gemeentepolitie Alkmaar' is relatief groot en heeft een klassieke rubriekenstructuur, waardoor het zich goed leent voor een test om een bestaand archief om te zetten naar LOD. Geïnteresseerden kunnen de export van beide archiefblokken en de bestanddelen zelf downloaden en importeren in de eigen versie van Nexus.

De bevindingen in deze tekst zijn voorlopig, omdat de test met het archief van de ‘Gemeentepolitie Alkmaar’ nog in volle gang is. We willen een voorlopig resultaat echter alvast delen.

Exterieur politiebureau voor stadhuis waaronder twee politieagenten in uniform, circa 1915. Collectie Regionaal Archief Alkmaar / NL-AmrRAA_1467_0002_0021.

Rubrieken en verzamelbeschrijvingen

Bij de test met Linked Open Data is er onder meer gekeken naar de kansen en mogelijkheden van verzamelbeschrijvingen en rubrieken. Zijn die nog steeds nodig om de structuur of hiërarchie van een archief duidelijk te maken, of wordt dit vervangen door Linked Open Data? Bij deze test is gebruik gemaakt van Memorix Nexus waarbij verzamelbeschrijvingen en rubrieken zijn samengevoegd tot ‘series’. Er bestaat formeel gezien dus geen onderscheid meer tussen een rubriek en een verzamelbeschrijving. Een verzamelbeschrijving zou in Nexus gezien kunnen worden als een subrubriek.

Uit de test met ‘De Duinranders’ bleek dat LOD veel mogelijkheden biedt om goede metadata toe te voegen. Bij dit overzichtelijke archief waren duidelijke archiefvormers en actoren aanwezig en waren de beleidsstukken bovendien duidelijk geordend. Het archief viel daardoor eenvoudig te ordenen met simpele LOD-toevoegingen. Zo werd er een ‘actor’ en ‘rol actor’ toegevoegd. In dit geval was dit bijvoorbeeld ‘V.V. Schoorl’ (actor) en ‘sportvereniging’ (rol actor). De LOD categorieën waren ook relatief simpel, zoals ‘oprichting’, ‘leden’ of ‘bestuur’, en documenttypes, zoals ‘ledenlijsten’ of ‘correspondentie’. Waar een categorie ingewikkelder bleek, is gekozen voor ‘verzamelde documenten’. Volgens de theorie natuurlijk geen wenselijke categorie, maar in de praktijk zijn sommige archieven nu eenmaal zo geordend dat het niet anders is te omschrijven als een ‘verzameling’.

Doordat het bij dit archief relatief eenvoudig was om goede LOD toe te voegen, leek het alsof rubrieken en verzamelbeschrijvingen niet meer nodig waren. In de praktijk bleek dit toch anders. In LOD is alle informatie te vatten, maar deze toont zich pas wanneer doorgeklikt wordt op beschrijvingen en linkjes. In het geval van ‘De Duinranders’ wil je als gebruiker bijvoorbeeld meteen weten waar in het archief je je bevindt.

Neem inventarisnummer 8 als voorbeeld. Dit stuk bevat diverse bestuursstukken en correspondentie. Met behulp van de toegevoegde LOD ontvouwt zich stap voor stap de informatie. Het zijn bijvoorbeeld de stukken van de hockeyvereniging ‘S.H.C. De Heerlijkheid’, te zien door de link met de actor. Wanneer de gebruiker doorklikt op ‘actor’ zal hij daarna ontdekken dat die hockeyvereniging onderdeel is van V.V. Schoorl. In de praktijk zal de gebruiker dit echter in één oogopslag willen zien.

Hoe groter het archief, hoe meer zo'n structuur onmisbaar bleek. Bij het archief van ‘De Duinranders’ zijn rubrieken en verzamelbeschrijvingen daarom toch toegevoegd. Bij het archief van de Gemeentepolitie Alkmaar zijn de rubrieken en verzamelbeschrijvingen niet toegevoegd. Hier valt meteen op dat het archief minder overzichtelijk is dan ‘De Duinranders’.

Een archief heeft een bepaalde structuur of ordening die je wilt tonen aan de gebruiker. Daarvoor is een rubriekenschema (of series, zoals Nexus het noemt) onmisbaar. Verzamelbeschrijvingen zijn nuttig wanneer ze bijdragen aan het overzicht van de gebruiker die graag in één keer alle notulen van een vereniging bij elkaar wil zien. Daarvoor is het wel essentieel dat de beschrijving van een deelbeschrijving volledig is. In een klassieke inventaris werd vaak alleen in de titel van de verzamelbeschrijving duidelijk gemaakt dat het ging om de notulen, en werd in de deelbeschrijvingen alleen een jaartal genoemd. In een LOD-inventaris is het van belang dat de volledige titel van de verzamelbeschrijving in elke deelbeschrijving herhaald wordt.

LOD in de praktijk

Het toevoegen van LOD aan een relatief klein en overzichtelijk archief zoals ‘De Duinranders’ bleek niet al te complex. Dit veranderde met de herinventarisatie van het archief van de ‘Gemeentepolitie Alkmaar’. De politie is bij uitstek een hiërarchische organisatie en de klassieke inventaris bevatte veel beschrijvingen waarbij meerdere actoren in het spel waren, er meerdere activiteiten werden ondernomen op diverse locaties, et cetera. Hoe kun je dit soort uitgebreide omschrijvingen vatten in de relatief bondige verwoording van LOD?

De oplossing werd gevonden in het toevoegen van meerdere LOD activiteiten. Waar bij ‘De Duinranders’ alleen ‘actor’ en ‘rol actor’, ‘categorie’ en ‘documenttype’ noodzakelijk waren, bleek bij het archief van de gemeentepolitie dat er ook velden nodig waren voor ‘activiteit’ en ‘actor subject’ en ‘actor object’. Ook de ‘locatie’ bleek een belangrijk metadata-veld.

Neem inventarisnummer 133 als voorbeeld: ‘Stukken betreffende de organisatie en ontwikkeling van de gemeentepolitie Alkmaar: Verordening op de inrichting van de gemeentepolitie Alkmaar, vastgesteld door de gemeenteraad van Alkmaar, met wijzigingen en bijlagen, 1931-1942’. De actor (subject) is hier de ‘gemeenteraad Alkmaar’ en niet de politie. De politie is hier het object. Het documenttype is een ‘verordening’ en de locatie is het ‘stadhuis’. Waar die verordening precies over gaat, is te lezen in de beschrijving van het bestanddeel zelf en hoeft dus niet te worden verwoord in LOD. Het mooie van LOD is dat de locatie in dit geval ook nog informatie geeft. Het stadhuis van Alkmaar zat in 1931 immers op een andere locatie dan tegenwoordig het geval is.

LOD biedt dus veel kansen voor verrijking, maar daarin schuilt ook een gevaar. In het bovenstaande voorbeeld is ‘gemeentepolitie Alkmaar’ als ‘object’ aangeduid, maar doet dat er eigenlijk wel toe? Het is immers het archief van de gemeentepolitie, het spreekt dus voor zich dat de gemeentepolitie Alkmaar altijd ofwel het object, ofwel het subject is. Uiteindelijk is het veld ‘object’ in dit archief dus toch niet ingevuld.

Ook als je kijkt naar andere beschrijvingen zoals inventarisnummer 137: ‘Stukken betreffende de overdracht van bevoegdheden van burgemeester en wethouders aan de commissaris van de politie’. Deze kan je heel letterlijk beschrijven in LOD door ‘overdracht van bevoegdheden’ als ‘activiteit’ op te nemen. Zo’n letterlijke interpretatie is mogelijk, maar zorgt ervoor dat er veel verschillende trefwoorden in een thesaurus komen te staan. Een ‘overdracht van bevoegdheden’ zou je echter ook kunnen zien als een ‘reorganisatie’.

Op deze wijze zijn er meer LOD toevoegingen te vinden die op het eerste gezicht nuttig lijken, maar later overbodig bleken. In het begin is overal bijvoorbeeld de categorie ‘bestuur’ toegevoegd aan de bestanddelen. In een latere fase is dit weer weggehaald. Immers, het is een gemeentelijk archief, in de praktijk valt dan bijna elk bestanddeel in de categorie ‘bestuur’.

Tot slot blijkt dat omschrijvingen in klassieke inventarissen onduidelijker zijn dan vaak wordt gedacht. LOD dwingt je daarentegen juist om goed na te denken over vragen als wie de actor is. In de inventaris van de gemeentepolitie is er bijvoorbeeld veel correspondentie bewaard gebleven, inclusief kopieboeken. Wie die boeken geschreven heeft, is echter niet duidelijk. Is dat de hoofdinspecteur van de politie, de recherche, etc.? Bij een onbekende actor, moest daardoor soms simpelweg ‘onbekend’ worden ingevuld.

Thesauri

Zoals het bij LOD belangrijk bleek om de meta-data niet te veel te willen verrijken, bleek dit bij thesauri ook het geval. Memorix biedt de optie om te verwijzen naar interne en externe thesauri. Het voordeel van externe thesauri is dat ze archieven op grote schaal met elkaar verbinden en voor de gebruiker zorgen ze voor uniformiteit in beschrijvingen. Algemene termen en organisatiestructuren zijn op nationaal niveau vaak hetzelfde, dat is zeker het geval bij een organisatie als de politie. Als elk archief een eigen interne of externe thesaurus maakt voor politie-termen, is dat niet praktisch. Doordat bij deze test nog nauwelijks externe thesauri beschikbaar waren, is voor deze test wel gebruik gemaakt van een interne thesaurus.

Bij het maken van thesauri zijn een aantal vuistregels van belang:

  • Zorg ervoor dat de termen altijd in het enkelvoud geschreven zijn (anders krijg je zowel termen als ‘agenda’ en ‘agenda’s’.
  • Koppel meerdere documenttypes aan één beschrijving, in plaats van proberen de twee types samen te voegen. Dus koppel ‘agenda’ en ‘notulen’ als twee documenttypes, en maak er geen ‘agenda’s en notulen van’.
  • Zorg ervoor dat je zoveel mogelijk verwijst naar externe thesauri. Voor algemene termen, zoals ‘sport’, ‘voetbal’, ‘kunst’ etc. is wikidata een goede thesaurus.
  • Maak alleen een interne thesaurus of een aparte externe thesaurus wanneer het echt niet anders kan. Voor historische straatnamen is het bijvoorbeeld goed te begrijpen wanneer een eigen thesaurus wordt gemaakt. Voor moderne straatnamen is de BAG echter het meest geschikt.
  • Voorbeelden voor externe thesauri die nu al ontwikkeld kunnen worden en ook direct noodzakelijk zijn voor het goed kunnen implementeren van LOD zijn: categorie, documenttype en activiteit. Verder zijn er specifieke thesauri nodig voor overheidsfuncties en belangrijke overheidspersonen uit de kop van Noord-Holland (of nog beter, nationaal!).

Conclusie

LOD is een verrijking voor de archiefsector. Archieven zijn beter te doorzoeken door middel van filteropties, het is mogelijk om meer informatie toe te voegen dan een simpele beschrijving of rubriek ooit kon en maakt archieven voor de gebruiker bovendien overzichtelijker. LOD vervangt echter de rubrieken niet volledig. Ze zullen naast elkaar blijven bestaan. Het is hierbij belangrijk dat de twee vormen van weergave goed met elkaar worden geïntegreerd en voor de gebruiker naast elkaar zichtbaar zijn.

De mogelijkheden die LOD biedt, vormen tegelijkertijd ook een valkuil. Niet alles wat kan, moet of is noodzakelijk. Er zijn veel LOD velden die je als inventarisator zou kunnen invullen. Het toevoegen van LOD maakt een archief voor de gebruiker echter niet altijd toegankelijker. Zorg ervoor dat de data echt van toegevoegde waarde is en de informatie niet al ergens anders impliciet is vermeld. Hetzelfde geldt voor de thesauri. Externe thesauri vergroten de vindbaarheid van de informatie, maar ze moeten niet verstopt raken met allerlei verschillende trefwoorden die eigenlijk op hetzelfde neerkomen. Externe thesauri genieten bovendien de voorkeur boven interne thesauri en het zou mooi zijn als de archiefsector samen aan deze externe thesauri werkt.

Kortom, LOD biedt volop kansen en zal de vindbaarheid en doorzoekbaarheid van de archieven alleen maar vergroten, maar het is goed om hier de tijd voor te nemen - net als bij een klassieke inventaris.

Mirjam Vriend, 27 mei 2025
Regionaal Archief Alkmaar

Met dank aan Jeltsje en Frederiek voor het brainstormen over Linked Open Data en het puzzelen met Memorix Nexus. Met dank aan Ramon voor het maken van een overzicht van de diverse Thesauri met de voor- en nadelen van elke thesaurus.

NB Er is een korte memo beschikbaar met bevindingen over LOD in relatie tot Memorix Nexus. Gebruikers van dit systeem met interesse in deze memo kunnen contact opnemen met het Regionaal Archief Alkmaar via Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.

test