• Schalter wissen.de
  • Schalter wissenschaft
  • Schalter scinexx
  • Schalter scienceblogs
  • Schalter damals
  • Schalter natur
Scinexx-Logo
Logo Fachmedien und Mittelstand
Scinexx-Claim
Facebook-Claim
Google+ Logo
Twitter-Logo
YouTube-Logo
Feedburner Logo
Freitag, 26.05.2017
Hintergrund Farbverlauf Facebook-Leiste Facebook-Leiste Facebook-Leiste
Scinexx-Logo Facebook-Leiste

DNA als robuster Datenspeicher

Biomoleküle speichern digitale Informationen zuverlässig

Statt Festplatte: Forscher haben große Mengen digitaler Daten in DNA gespeichert. Zwei Megabyte an komprimierten Informationen kodierten sie dabei in Form der Biomoleküle – und lasen sie anschließend fehlerfrei wieder aus. Das Besondere: Das von dem Team verwendete Verfahren ist nicht nur effizient, sondern auch äußerst robust. Denn selbst aus mehrfach kopierter DNA ließen sich die ursprünglichen Daten noch einwandfrei wiedergewinnen.
Der Basencode der DNA eignet sich bestens als Datenspeicher

Der Basencode der DNA eignet sich bestens als Datenspeicher

Die Menschheit produziert immer mehr Daten. Gleichzeitig aber droht das digitale Vergessen, weil die heutigen Speichermedien eher kurzlebig sind. Durch den steten Wandel der Technologien und die mangelnde Haltbarkeit der Datenträger müssen Archive digitaler Daten heute regelmäßig umkopiert werden. Was auf einer normalen Festplatte liegt, könnte sonst in wenigen Jahrzehnten unlesbar sein.

Langlebig und niemals veraltet


Um diese Problematik künftig zu vermeiden, wenden sich Wissenschaftler inzwischen einem uralten Speichermedium der Natur zu: der DNA. Ihr Basencode speichert nicht nur die Erbinformation von Lebewesen hervorragend. Er taugt auch als Speicher für digitale Daten. Denn die Codesprache der Natur ist der binären Sprache von Computern sehr ähnlich. Der einzige Unterschied: Auf der Festplatte repräsentieren Nullen und Einsen die Daten, in der DNA sind es die Basen A, C, T und G.

Im Vergleich zum Festspeicher hat das Biomolekül jedoch einen entscheidenden Vorteil: Es kann tausende von Jahren unbeschadet überdauern, wenn es unter den richtigen Bedingungen gelagert wird. "Anders als Kassetten und CDs wird dieses Speichermedium außerdem niemals veraltet sein - und falls doch, haben wir dann ganz andere Probleme", sagt Yaniv Erlich vom New York Genome Center.


Zwei Megabyte als Buchstabencode


Wie sich die enormen Datenmengen unserer heutigen Gesellschaft verlässlich in DNA speichern lassen, haben Erlich und seine Kollegin Dina Zielinski nun eindrucksvoll bewiesen. Dafür kodierten sie sechs Dateien als DNA - unter anderem einen Text des Informationstheoretikers Claude Shannon, einen französischen Film, einen Computer-Virus und ein vollständiges Computer-Betriebssystem.

Um diese in komprimierter Form insgesamt zwei Megabyte große Datenmenge umzuwandeln, nutzten die Forscher einen speziellen Algorithmus – genannt Fountain Code – der Informationen nach dem Zufallsprinzip in kleine Pakete schnürt und anschließend in der richtigen Reihenfolge wieder zusammensetzen kann. Das System kodiert die Informationen dabei mehrfach. Auf diese Weise gehen keine Daten verloren, auch wenn einige DNA-Nukleotide des späteren Speichers beschädigt sein sollten. Das Besondere: Trotz des Einfügens redundanter Informationen ist das Kodierverfahren sehr effizient.

Fehlerfrei – trotz mehrfachen Kopierens


Insgesamt generierten Erlich und Zielinski auf diese Weise einen 72.000 DNA-Stränge langen Code, bei dem jeder Strang aus 200 Basen besteht. Diese Buchstabenfolge schickten sie an ein Labor, das anhand dieser Vorlage DNA-Moleküle synthetisierte. Dann folgte der spannende Moment: Würde sich aus diesen Molekülen die originale Information wiedergewinnen lassen?

Tatsächlich konnten die Forscher ihre Daten mithilfe einer Software fehlerfrei dekodieren. Viel Erstaunlicher aber: Der gleiche Erfolg ließ sich mit Kopien der DNA erzielen. Die Wissenschaftler vervielfältigten die Biomoleküle mithilfe der Polymerase-Kettenreaktion wieder und wieder. Diese Kopien und auch Kopien dieser Kopien und so weiter konnten fehlerfrei dekodiert werden. Das zeige, dass das Kodierverfahren mittels Fountain-Code äußerst robust sei, so das Team.

Teures Verfahren


Die Forscher zeigten zudem, dass sie mit ihre Methode Informationen nicht nur sicher, sondern auch effizient in großen Mengen speichern können. Demnach reicht ein einziges Gramm DNA aus, um 215 Petabyte an Daten aufzubewahren. Der einzige Haken an dem Speicherverfahren: die Kosten. 7.000 US-Dollar kostete allein das Synthetisieren der Biomoleküle. Noch einmal 2.000 Dollar gaben die Forscher aus, um ihre Daten anschließend auszulesen. (Science, 2017; doi: 10.1126/science.aaj2038)
(Columbia University School of Engineering and Applied Science, 06.03.2017 - DAL)
 
Printer IconShare Icon