Direct naar artikelinhoud
InterviewDigitalisering

De uitdagingen van het moderne archief. ‘Al die data zijn vluchtig’

Archiefstukken in het Nationaal Archief.Beeld ANP

De digitalisering van informatie zal voorgoed veranderen wat wij onder een archief verstaan. De gevolgen daarvan dringen nog niet overal door.

In George Orwells roman 1984 heeft de hoofdpersoon er een dagtaak aan om de geschiedenis te vervalsen. Wanneer de machthebbers een standpunt herzien, moeten alle archieven in lijn worden gebracht met die nieuwe visie. Geregeld moet een krant van jaren terug worden herschreven, geantedateerd, opnieuw gedrukt en gedistribueerd onder de archieven in het land, waarbij alle oude kopieën worden opgespoord en vernietigd. Dat is dag- en nachtwerk voor duizenden mensen in het ‘ministerie van waarheid’.

Behalve een beklemmende waarschuwing voor het gevaar van een totalitaire staat, is 1984 ook een rake observatie van hoe wij ons verleden reconstrueren. Althans, hoe we dat altijd deden. Want in 2022 zou de taak van het ministerie van waarheid er heel anders uitzien. 

In Orwells wereld was een archief iets fysieks, dat was het immers altijd geweest. Niet zozeer een geheugen van de samenleving, zoals een archief metaforisch wel wordt genoemd, maar juist een spoor van bewijs. Een archiefstuk had twee kenmerken waarvan we dachten dat die vanzelfsprekend waren: het was een momentopname die vastlag, en het was gedistribueerd; het bevond zich ergens.

De digitalisering van informatie heeft die kenmerken ondergraven, en dat zorgt voor heel nieuwe uitdagingen. Niet dat we ons acuut zorgen moeten maken om de komst van een ministerie van waarheid, maar zo’n departement zou vandaag de dag een makkelijker taak hebben dan Orwell kon vermoeden. De redenen waarom, zijn dezelfde als de uitdagingen waar de moderne archivaris voor staat.

Een geheugen vol gaten

Een digitaal archief lijkt namelijk juist wel op een geheugen, in ieder geval meer dan een archief dat uit fysieke stukken bestaat. Een digitaal archief kan, net als een geheugen, steeds worden aangepast. En er kunnen verbazend gemakkelijk gaten in vallen. Digitale informatie is vluchtig. 

“Papier kun je simpelweg bewaren”, zegt Charles Jeurgens,  hoogleraar archiefwetenschap aan de Universiteit van Amsterdam. “Als temperatuur en vochtigheid een beetje op orde zijn, kom je al een heel eind. Voor digitaal materiaal is dat anders. Als je dat niet bijhoudt, ben je heel snel heel veel kwijt.”

Dat zal iedereen bekend voorkomen die wel eens een e-mail van twintig jaar terug heeft gezocht. De programma’s die het opzoeken destijds een fluitje van een cent maakten, werken niet meer op de nieuwe computer. Een andere belangrijke factor is dat veel van deze data, zoals een e-mail of een appbericht, geen echte documenten zijn. Het zijn gegevens in een database die alleen in samenhang begrijpelijk zijn, en die kunnen daardoor snel ontoegankelijk worden. Goede kans dat als u die twintig jaar oude e-mail uiteindelijk vindt, de samenhang zoek is en de tekst is doorspekt met een berg code waar uw nieuwe computer geen chocola van kan maken. 

Spanning in digitalisering

Dat is waar de nieuwe lichting historici voortdurend mee te maken zal krijgen, denkt Pim Huijnen, docent digitale geschiedenis aan de Universiteit Utrecht: “Er zit een spanning in digitalisering. Enerzijds is er veel meer, en veel rijker materiaal. Dat biedt toekomstige historici mogelijkheden waar wij alleen van kunnen dromen. Mentaliteitshistorici zouden bijvoorbeeld een moord doen voor een negentiende-eeuws Twitter. Maar tegelijkertijd zijn al die data vluchtig, informatie is continu in beweging. Dat geeft vraagstukken over de toegankelijkheid.”

Om bij het voorbeeld van Twitter te blijven; het bleek niet te doen om alleen al dit ene prominente sociale medium voor toekomstige generaties compleet vast te leggen. De bibliotheek van het Amerikaanse Congres, wellicht het machtigste archief ter wereld, probeerde het jarenlang en faalde. De dynamiek van het medium, waarbij steeds nieuwe reacties in samenhang moeten worden opgeslagen en de gigantische toename van het gebruik, groeide ook deze geharde archivarissen boven het hoofd.

Archiveert eer ge begint

Over de hoek waar de oplossing gezocht moet worden is brede consensus: archiveren moet voortaan aan de voorkant gebeuren. Het toekomstig gebruik van data – jaren, decennia of zelfs eeuwen na nu – moet een overweging zijn in het ontwerp van een IT-systeem en deel worden van de routine van de gebruikers die de data invoeren.

Tom de Smet van het Nationaal Archief ziet dat al volop gebeuren. Het cliché dat een dossier twintig jaar in een la ligt en dan naar het archief wordt gestuurd is achterhaald. “Onze rol is echt aan het veranderen. De archivaris verliest zijn stoffige imago en schuift naar de voorkant van de informatieketen.”

Dat is een wezenlijke verandering. Charles Jeurgens wijst erop dat het gebruik van data door ambtenaren en het archiveringsproces steeds meer verstrengeld raken. “Een onderscheid tussen de korte en de lange termijn is niet eens meer zo relevant. Het draait allemaal om verantwoording afleggen. Organisaties moeten bedenken waar ze voor zijn en ze moeten vervolgens hun data zo inrichten dat die transparant weergeven hoe ze die taak vervullen.”

Bij het Nationaal Archief zien ze dezelfde trend, al is het een gesprek dat nog op gang moet komen, benadrukt De Smet. “Archivarissen hebben de expertise om informatie toegankelijk te maken. Niet alleen na tien of twintig jaar, maar ook al eerder. De moderne archivaris zal daardoor een grote rol krijgen in de transparantie van de overheid. Niet als de informatiemanager zelf, maar wel als adviseur van de informatiemanager.”

Weet wat je niet vindt

De volgende uitdaging zit vooral in het hoofd van de nieuwe generaties historici. Bronnenonderzoek gaat steeds meer op googlen lijken. En dat heeft behalve geweldige voordelen ook risico’s. Pim Huijnen ziet het om zich heen gebeuren: “De neiging is om te denken dat wat niet digitaal vindbaar is, ook niet bestaat.” 

Een treffend voorbeeld is Delpher, het veelgeprezen digitale krantenarchief van de Koninklijke Bibliotheek. Met een extreem gebruikersgemak kan iedereen hier honderdduizenden kranten doorzoeken.

Nog altijd wordt er met man en macht gewerkt aan aanvullingen, en daar zit ’m de kneep. “Als je bijvoorbeeld wilt opzoeken wanneer een woord voor het eerst in een Nederlandse krant is gebruikt, ligt het voor de hand om in Delpher te zoeken. Alleen is het heel goed mogelijk dat na je onderzoek een oude krant wordt toegevoegd waarin dat woord eerder wordt gebruikt dan jouw oudste vondst. Als je je dat realiseert is er weinig aan de hand en kun je er transparant over zijn door de datum van je onderzoek te noemen, maar heel wat mensen hebben geen idee van zulke problemen.

“Dit is een simpel voorbeeld, maar op termijn gaat dit echt een probleem worden. We moeten nadenken over nieuwe methoden van bronnenkritiek die rekening houden met deze omstandigheden.” 

Hoogleraar Jeurgens weet ook nog wel een blinde vlek te noemen. “Wat als het archief wordt bestempeld is vaak specifiek het documentmanagementsysteem van de organisatie, maar er is ongelooflijk veel dat nooit in die systemen terechtkomt, zoals e-mail.” Er is weleens onderzocht welk percentage  van de informatie in zo’n documentmanagementsysteem zit. Conclusie: in de regel is dat hooguit 20 procent.

Iedereen zijn eigen versie van de geschiedenis

Verschillende versies, blinde vlekken en manipulatie, dat zijn grote uitdagingen. Toch is er ook een tegenwicht voor al die ongemakken: het gemak waarmee eenieder een kopie kan maken van digitale data. Neem de screenshots van oude twitterberichten waarmee voortdurend wordt geschermd. Wissen na publicatie helpt niet meer, want er is altijd wel iemand die een kopietje in een digitale la heeft liggen.

Digitale data zijn zogezegd een stuk democratischer dan papier. Wellicht is dat uiteindelijk de beste waarborg tegen de praktijken van een toekomstig ministerie van waarheid, denkt Jeurgens. Al kunnen eigen kopieën natuurlijk net zo hard vervalst zijn als de officiële versie, zie het aantal valse screenshots op Twitter. 

“Het wordt steeds moeilijker om te zien wie welk materiaal heeft en in welke versie”, voorspelt ook Huijnen. Dat is uiteraard geen nieuw probleem, de geschiedenis is bezaaid met valse documenten op papier, leer of linnen. En historici zijn experts in het ontmaskeren van vervalsingen, dus er is geen dwingende reden waarom ze dat met digitale archieven niet zouden kunnen.

Digitale geletterdheid

Maar daar is wel een digitale geletterdheid voor nodig die nog in de kinderschoenen staat, zo merken de digitale voorlopers. ‘Digitale geschiedenis’ lijkt, tot ongenoegen van Huijnen, soms een beetje op een specialisme in plaats van een integraal onderdeel van het vak. “Veel historici beschouwen het als een hobby van mij en sommige collega’s, die de echte geschiedenis niet zou raken.”

Gebrek aan expertise en verkokering is ook waar Jeurgens zich uiteindelijk de meeste zorgen over maakt. “Er loopt een directe lijn van documenteren naar archiveren naar verantwoorden. Daarvoor moeten heel veel disciplines samenkomen en dat is op dit moment onvoldoende goed geborgd.”

Hoe maak ik een duurzaam archief?

Om lijn te brengen in de digitale archieven heeft het Nationaal Archief, in opdracht van het kabinet, een reeks eisen opgesteld voor duurzame toegankelijkheid, de DuTo-eisen in jargon. Het is een reeks uitgangspunten waaraan overheidsinformatie moet voldoen. Hierin is bijvoorbeeld vastgelegd dat er een zoekfunctie moet zijn, en dat informatie altijd uit het systeem moet kunnen worden geëxporteerd, en wel in een formaat dat voldoet aan open standaarden. Dat maakt het aanzienlijk gemakkelijker om, als een systeem is verouderd, de informatie leesbaar te houden.

Dat zijn technische zaken, maar de eisenlijst zet ook stappen die echt raken aan de manier van werken in een overheidsorganisatie. DuTo schrijft bijvoorbeeld ook voor dat als informatie slechts gedeeltelijk openbaar is, die openbare delen toegankelijk moeten zijn. Dat moet voorkomen dat informatie geheel wordt afgeschermd, terwijl slechts een deel ervan vertrouwelijk is.

De DuTo-eisen zijn daarmee een goede basis, vindt hoogleraar archiefwetenschap Charles Jeurgens. “Maar het betekent niet dat hiermee alles geregeld is.” 

Dat is iets dat het Nationaal Archief zelf ook nadrukkelijk onderstreept. Om te beginnen kunnen de eisen niet worden afgedwongen, al worden de uitgangspunten steeds meer overgenomen. Maar bovenal moet DuTo een manier van werken worden. “En dat is nooit klaar”, zegt Tom de Smet van het Nationaal Archief.

Lees ook:

In data gaat kennis verloren

Meten is weten. Dus hoe meer we meten hoe meer we weten, nietwaar? Niet waar. ‘Er zijn problemen met big data die we onder ogen moeten zien’, zegt hoogleraar Sally Wyatt.