5 miljoen scans VOC-archief doorzoekbaar
Koloniale geschiedenis met één klik binnen handbereik
Amsterdam, 2 oktober 2023 – Woensdag 4 oktober maakte het GLOBALISE-project van het Huygens Instituut en verschillende partners de automatische tekstherkenning van vijf miljoen scans uit het archief van de Verenigde Oost-Indische Compagnie digitaal beschikbaar. Dat maakt de informatie in deze archieven over bijvoorbeeld beladen onderwerpen als slavernij en koloniaal geweld vele malen makkelijker doorzoekbaar en leesbaar. En dat zal leiden tot nieuwe perspectieven op het koloniale verleden.
De VOC-archieven zijn sinds 2003 erkend als UNESCO Memory of the World. Het deel van het archief dat hiermee toegankelijk is geworden, bekend als de Overgekomen Brieven en Papieren, bevat gedetailleerde informatie over het optreden van de VOC in de zeventiende en achttiende eeuw. De documenten getuigen van de Nederlandse koloniale geschiedenis in Azië. Ook zijn ze belangrijk voor de lokale geschiedschrijving van samenlevingen waarmee de VOC in contact kwam.
Nieuwe licht op de geschiedenis van kolonialisme en Azië
De tekstherkenning zal leiden tot nieuwe perspectieven op het koloniale verleden. Matthias van Rossum, projectleider (IISG): ‘De doorzoekbaarheid maakt dat informatie in de archieven veel completer en sneller gevonden kan worden. Zo zijn de gevolgen van de verschrikkelijke ontvolking van het eilandje Liuqiu nabij Taiwan door de VOC in 1636 met één klik op de knop te vinden. We weten dat de VOC niet alleen een handelsonderneming was, maar ook optrad als koloniale overheid. Maar daar is nog veel te weinig onderzoek naar gedaan. Deze archieven laten zien hoe de VOC optrad tegen gekoloniseerde en niet-Europese samenlevingen.’
De archieven bevatten informatie over heel veel personen, plaatsen en gebeurtenissen in een enorm groot gebied. Dat biedt mogelijkheden voor allerlei onderzoek. En niet alleen in Nederland, maar juist ook wereldwijd. Manjusha Kuruppath, onderzoeker (Huygens Instituut): ’Je kan genealogisch onderzoek doen en zoeken naar verwijzingen naar personen. Of naar lokale geschiedenissen, bijvoorbeeld in Indonesië of India, door te zoeken naar informatie over gebeurtenissen, plaatsen of gemeenschappen. Je vindt zelfs informatie over fenomenen als ziekte en klimaat, die weer van groot belang kunnen zijn voor wereldgeschiedschrijving.’
Dit is pas de eerste versie van de transcripties in een eenvoudige zoekomgeving. Er komt nog veel meer aan. Lodewijk Petram, projectmanager (Huygens Instituut): ‘We vinden het erg belangrijk dat deze data zo snel mogelijk beschikbaar is voor zoveel mogelijk mensen. We verwachten aan het einde van het jaar met een verbeterde versie te komen. Wij beperken ons werk niet alleen tot tekstherkenning. We brengen ook gegevens bijeen die contextuele informatie geven bij bepaalde termen. En we werken aan een zoekinterface die nieuwe onderzoeksmethoden ondersteunt. Daarmee worden de VOC-archieven ook toegankelijker voor een internationaal publiek.’
Tekstherkenning voor werelderfgoed
De tekstherkenning is gemaakt met de open-source Loghi transcriptiesoftware van het KNAW Humanities Cluster. Recent zijn de VOC-archieven in onder meer Nederland, Indonesië en Sri Lanka grotendeels gedigitaliseerd. Het GLOBALISE-project kreeg in 2021 subsidie toegekend van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) om een digitale onderzoeksinfrastructuur te ontwikkelen voor een deel van dit archief.
GLOBALISE is een project van het Huygens Instituut in samenwerking met het Internationaal Instituut voor Sociale Geschiedenis, het Nationaal Archief, de afdeling Digitale Infrastructuur van het KNAW Humanities Cluster, de Vrije Universiteit Amsterdam en de Universiteit van Amsterdam.