CBS vernieuwt historische volkstellingen met nieuwe scans

Deel dit artikel

,

Toen het CBS (Centraal Bureau voor de Statistiek) en het NIWI (Het Nederlands Instituut voor Wetenschappelijke Informatiediensten) eind jaren negentig begonnen met het digitaliseren van historische Volkstellingen, gold dit als een ambitieus en groot project. Destijds was de software niet goed genoeg om automatisch tekst op een pagina te herkennen, ook wel optical character recognition genoemd, of tabellen om te zetten in spreadsheets. Dat betekende dat een groot deel van de 42.000 pagina(s) met tabellen uit de jaren tussen 1795 en 1971 handmatig moest worden ingevoerd.

Dat ging als volgt: eerst werden de boeken met Volkstellingen gescand en in 1999 op CD-ROM uitgebracht. Vervolgens werden deze bestanden op de website volkstellingen.nl gepubliceerd en konden gebruikers erin zoeken en bladeren. Excel-tabellen en pdf’s werden later toegevoegd. In 2006 was dit project klaar, maar de datasets bevatten toen nog veel fouten. Nog altijd zijn medewerkers van DANS (Data Archiving and Networked Services) bezig met het corrigeren van deze tabellen.

De originele scans zijn zwart-wit en ogen dus korrelig. Daarom besloot het CBS twee jaar geleden de papieren tellingen opnieuw te scannen, dit keer in kleur. Omdat de software inmiddels ook in staat is tot geautomatiseerde tekstherkenning, gaat dit een stuk sneller dan 25 jaar geleden. De nieuwe scans zijn opgenomen in Atlantis en te vinden op historisch.cbs.nl.

Bekijk hier de Volkstellingen.

'Meld je aan voor de nieuwsbrief' van HCC!genealogie

'Abonneer je nu op de nieuwsbrief en blijf op de hoogte van onze activiteiten!'

Aanmelden