Project MinE verzamelt de DNA-profielen van 15.000 ALS-patiënten en 7.500 gezonde controlepersonen. Het ALS Centrum op het UMC Utrecht zorgt dat deze enorme hoeveelheid data beveiligd wordt opgeslagen en geanalyseerd om zo de genetische oorzaken van ALS te vinden.
“We weten dat ALS erfelijk is”, verklaart Jan Veldink, hoogleraar Human Genetics, van ALS Centrum Nederland. “Maar ALS is niet zó erfelijk dat je genoeg hebt aan familieonderzoek. Dus gaat het bij project MinE om een grootschalige DNA-studie, waarbij je patiënten vergelijkt met gezonde mensen.”
Het volledig aflezen van deze DNA-profielen (whole genome seqencing) geeft zo’n 2 miljoen gigabyte aan data. Dat is een stapel harde schijven zo hoog als de Utrechtse Domtoren!
Het werven van fondsen en deelnemers was slechts het begin van de uitdagingen. Na het sequencen van 1 DNA-sample heb je namelijk een bestand van 75 à 100 gigabyte. Vermenigvuldig dat met 22.500 en je komt op zo’n 2 miljoen gigabyte: zeg maar een stapel hardeschijven zo hoog als de Utrechtse Domtoren.Waar laat je al die data? En, nog veel belangrijker: waar vind je de computerkracht om de cruciale informatie op te sporen? Hoe kun je zoveel data opslaan en hiermee rekenen? Hiervoor wordt gebruik gemaakt van de supercomputer en andere faciliteiten van SURFsara, een non-profit organisatie die high performance computing & data-infra-structuur verzorgt voor wetenschap.
Lees wat Prof. Jan Veldink hierover vertelt in onderstaand artikel in SURF magazine.

Lees meer over de data opslag voor Project Mine in het webartikel over het project ‘Beyond project MinE-NL‘.