Historische transcripties

...en locaties toegankelijk dankzij AI

Welkom. Op deze prototype zoekomgeving doorzoek je met behulp van Artificial Intelligence (AI) ruim tweehonderdduizend scans, metadata, transcripties en historisch beeldmateriaal van historische teksten en locaties uit het Nationaal Archief, het Noord-Hollands Archief en het Stadsarchief Amsterdam. Dit prototype is samen met de archieven ontwikkeld door Picturae, Aincient, Sioux Technologies en Islands of Meaning en mogelijk gemaakt door de Rijksdienst voor Ondernemend Nederland (RVO).

Naar de transcripties

Colofon en credits

Deelnemende archieven

Het Stadsarchief Amsterdam
Het Noord-Hollands Archief
Het Nationaal Archief, ook namens de volgende Regionaal Historische Centra: Tresoar, het Gelders Archief, de Groninger Archieven, het Brabants Historisch Informatie Centrum, het Zeeuws Archief, het Historisch Centrum Limburg, Het Utrechts Archief en de Collectie Overijssel

Ontwikkeld door

Picturae
Aincient
Sioux Technologies
Islands of Meaning

Dank aan

Dank aan velen die deze prototype zoekomgeving mogelijk hebben gemaakt:

  • De deelnemende archieven voor het samen ontwikkelen van deze prototype zoekomgeving en het bronmateriaal dat gebruikt wordt voor dit prototype. Dit bestaat onder andere uit de ground truth (transcripties) voor ‘Tag de tekst’, de scans, de gegevens van de beeldbanken van de archieven en de automatisch gegenereerde transcripties (Handwritten Text Recognition, HTR) en de locatiegegevens van de archieven.
  • Voor de locatiegegevens die ter beschikking zijn gesteld door het Nationaal Archief voor dit prototype, gaat onze dank ook uit naar de volgende partijen die hebben bijgedragen aan de totstandkoming van deze locatiegegevens. Dat zijn naast het Nationaal Archief: het Huygens ING, de Sonttolregisters, de herkomstdatabase van het Stadsarchief Amsterdam, ErfGeo en Ton van Velzen
  • Atlas of Mutual Heritage
  • Wikidata
  • Adamlink
  • Transkribus
  • De ruim 150 vrijwilligers en drie super users van crowdsourcingsproject ‘Tag de tekst’ op Velehanden.nl.
  • De Rijksdienst voor Ondernemend Nederland (RVO). Deze prototype zoekomgeving is mogelijk gemaakt dankzij SBIR funding vanuit de RVO, fase 1 en 2 van de call ‘Artificiële intelligentie voor publieke diensten’.

Open data

De AI-dataset Tag de tekst voor Named Entity Recognition is beschikbaar op de website Taalmaterialen van het instituut voor de Nederlandse taal (INT):
http://hdl.handle.net/10032/tm-a2-v2

Open source AI-pipeline

De ontwikkelende AI-pipeline is open source beschikbaar:

Deze pipeline is ontwikkeld i.h.k.v. deze prototype zoekomgeving (archieveninbeeld.nl) en het project De IJsberg zichtbaar maken (zoekintranscripties.nl).