Het DNA van E. colibacteriën kan dienen voor het opslaan van data. Wetenschappers en studenten van de Chinese University of Hong Kong hebben hiervoor een coderingstechniek ontworpen.

Wetenschappers kijken al enige jaren met interesse naar bacteriën voor dataopslag. Vooral de eigenschap dat sommige eencelligen veel beter dan elektronische geheugens bestand zijn tegen bepaalde zware omstandigheden, waaronder vocht, ietwat verhoogde temperaturen of zelfs grote doses ioniserende straling, maakt ze interessant voor deze toepassing. Het DNA in een cel kan dienen als opslagmedium. De informatiedichtheid is enorm: met 1 g E. colibacteriën, ofwel zo’n biljard cellen, valt in theorie zo’n 900 TB aan data op te slaan.

De celdeling – bij E. coli gemiddeld elk halfuur – zorgt ervoor dat er vele identieke kopieën ontstaan, die het behoud van gegevens nagenoeg zeker stellen. Gaan er een paar bacteriën dood, dan zijn er nog altijd genoeg andere, genetisch identieke organismen over. ‘Voor een nog hogere betrouwbaarheid kunnen we de bacteriën, nadat ze zich voldoende hebben vermenigvuldigd, invriezen’, aldus prof. Tingfung Chan van de Chinese University of Hong Kong. ‘We kunnen zelfs het DNA uit de cellen halen en alleen het relatief stabiele genetische materiaal opslaan.’

‘Er is heel lang verkeerd naar een alzheimermedicijn gezocht’
LEES OOK
‘Er is heel lang verkeerd naar een alzheimermedicijn gezocht’

Quartair stelsel

DNA is opgebouwd uit vier verschillende basen: adenine (A), cytosine (C), guanine (G), and thymine (T). Dit dwingt de onderzoekers om een tekst die ze willen opslaan, eerst om te zetten naar het zogeheten quartaire getalstelsel. Door daarvan elke 0, 1, 2 en 3 te vervangen door respectievelijk A, T, C en G is de omzetting compleet. Een voorbeeld: de letter i heeft ASCII-waarde 105. In het quartaire stelsel is dat 1221, wat in basen uitgedrukt TCCT is. Zo ontstaan lange ketens van de vier basen, die de oorspronkelijke data weergeven.

Grote bestanden met beeld of video passen niet in één DNA-streng. Daarom hakken de onderzoekers deze data in stukjes en verspreiden die over meerdere bacteriën, vergelijkbaar met datapakketjes die over internetverbindingen reizen. Om deze stukjes later weer in de juiste volgorde te kunnen terugzetten krijgt elk datablokje bovenaan ter identificatie een header. Die legt ondubbelzinnig vast waar in het grotere bestand het datablokje thuishoort. Onderaan het datablok staat een zogeheten checksum, een controlesom die ervoor zorgt dat mutaties, die altijd optreden in DNA, als fouten worden herkend. Alleen de kopie die een correcte checksum bevat, zal worden gebruikt bij het reconstrueren van de oorspronkelijke boodschap. ‘Omdat mutatie een willekeurig proces is, is het zeer onwaarschijnlijk dat mutaties bij alle cellen op dezelfde positie op het DNA plaatsvinden’, aldus Chan.

Net als bij computerdata vindt bij de opslag in bacterieel DNA ook een compressiestap plaats. Komt in een datablok vele malen dezelfde base na elkaar voor, bijvoorbeeld AAAAAA, dan wordt dit vervangen door 6xA. Dat bespaart opslagruimte en een bijkomend voordeel is dat het gecomprimeerde DNA biologisch gezien veel gezonder is.

Om het databestand uit te lezen moet de ontvanger het DNA uit de bacteriën halen. Voor het sequencen, het ontcijferen van DNA, bestaan al apparaten, maar wetenschappers werken aan technieken om dat nog veel sneller te doen. Door de compressiealgoritmes omgekeerd toe te passen komen bij het lezen de oorspronkelijke datablokken tevoorschijn. Om deze in de juiste volgorde aan elkaar te kunnen plakken heeft de ontvanger een bepaalde formule nodig, de decryptiesleutel.

Doos in de diepvries

Bacteriën zullen nooit computergeheugens gaan vervangen; daarvoor is de lees- en schrijfsnelheid veel te laag. Wel verwachten de onderzoekers dat bacteriën ooit zullen dienen voor het lange tijd opslaan van grote hoeveelheden data. ‘Alle gegevens van de bevolking van een land over een periode van honderd jaar passen dan in een doos die in de diepvries is op te slaan’, aldus Chan.

Er bestaat geen gevaar dat databacteriën mensen ziek zullen maken. De gebruikte organismen zijn van een ongevaarlijke stam van de E. colibacterie. De Hongkongse onderzoeksgroep gaat nu op zoek naar micro-organismen die nog beter geschikt zijn voor dataopslag.