DNAにデータを保存するのは現実的ではないかもしれないが、それは可能であり、確かにクールに聞こえる。 DNAにデータを保存するのは現実的ではないかもしれないが、それは可能であり、確かにクールに聞こえる。

DNAにデータを保存するのは現実的ではないかもしれないが、それは可能であり、確かにクールに聞こえる。

DNAにデータを保存するのは現実的ではないかもしれないが、それは可能であり、確かにクールに聞こえる。
CD
DNAは次世代の情報保存媒体となるのか? Pixabay

私たちのDNAは、私たちのすべてをプログラムするコードです。現在、動画やオペレーティングシステムのエンコードに利用されています。密度が高く耐久性に優れたDNAは、1グラムで200ペタバイト(200,000,000,000,000,000バイト、つまりノートパソコン約20万台分)の情報を保存できることが、今週のScience誌に掲載された研究で示されました。専門家は、DNAは情報爆発の時代に有望なストレージソリューションになる可能性があると述べています。コストさえ問題にならなければの話ですが。

ハーバード大学の研究者たちは2012年に5万語の書籍を保存しました。また、ほぼ同時期に欧州バイオインフォマティクス研究所はシェイクスピアのソネットや「私には夢がある」の演説の音声クリップなどを保存しました。しかし、今回の研究の特別な点は、保存効率を60%向上させるだけでなく、エラーに対する堅牢性も高めるコーディング技術を使用している点だと、コロンビア大学のコンピュータサイエンス教授であり、ニューヨークゲノムセンターのコアメンバーでもあるヤニフ・エルリッヒ氏は述べています。

エルリッヒ氏によると、コーディング方法、つまりどのDNAを合成し、データを書き込むかが分かれば、あとは簡単だ。企業が実際のDNAを製造すればいいのだ。「データは0と1の羅列に過ぎません。DNAは基本的に4つのヌクレオチドの配列です。これらのヌクレオチドをビットのペアにマッピングする必要があるのです」とエルリッヒ氏は言う。

しかし、DNA合成は容易ではありません。2012年のハーバード大学論文の筆頭著者で、現在はカリフォルニア大学ロサンゼルス校(UCLA)の生化学教授であるスリ・コスリ氏(今回の研究には関与していない)は、「重要なのは、DNAの断片が5%以下の確率で失われてしまうことです」と述べています。

「合成が難しく、何らかの理由で読み出すのも難しいのです」とコスリ氏は言う。「ですから、そのような損失に対して堅牢なコードを使用できれば、DNAの保管ははるかに容易かつクリーンになるでしょう。」

エルリッヒの論文が示しているのはまさにそれだとコスリは言う。つまり、この手法はDNA合成過程における不完全性を許容していたのだ。研究者たちは、スマートフォンでストリーミング再生されるYouTube動画など、接続が途切れやすいチャネルで送信されるデジタル情報を変換する特殊なコーディング技術を適用することで、これを実現した。エルリッヒによると、今回の結果は、このコーディング技術が、今回の研究で使用したDNAよりもはるかに品質の低いDNAにも対応できることを示唆しているという。「それでも必要な結果を得て、正しく情報を取得できるのです」

研究チームはDNAにオペレーティングシステムを保存し、復元することに成功しました。これは「素晴らしいこと」だと、ETHチューリッヒの化学エンジニアで、今回の研究には関わっていないロバート・グラス氏は言います。「日常的に使う人間として、エラーがないことは分かっています」とグラス氏は言います。

エルリッヒ氏は、意図的にオペレーティング システムを導入したと語ります。「ファイルを完全に復元できなければ完全に台無しになってしまうようなものを導入することを恐れていないことを示したかったのです。」

コスリ氏も、論文の手法が効果的であることに同意している。「彼らはアルゴリズムをテストするために適切な一連の実験を行ったと思います。適切なアルゴリズムを選択し、それがうまく機能しているように見えました。」

しかし、5年前に初めてDNAにデータを保存した時と同じように、いまだに途方もなく高額だとコスリ氏は言う。「費用はおそらく、何事にも競争力を持つには100万倍も高すぎるでしょう」とコスリ氏は言う。

この研究では、研究者たちはわずか2メガバイトのデータをエンコードするのに約1万ドルを費やしました。これは、古い3.5インチフロッピーディスク1枚分のデータ容量に相当し、MacBook Air約10台分の費用に相当します。

この新しい方法では「本当に粗悪なDNA」を使用できるようになるため合成コストをいくらか削減できる可能性があるが、それでもコストはとんでもなく非現実的だとコスリ氏は言う。

コストに関して、グラス氏はDNA合成のコストがシーケンシングのコストよりも大きな欠点だと指摘する。「シーケンシングのコストは実用化するにはまだ高すぎるが、コンピューターに接続してDNAをシーケンシングできるナノポアなどの登場により、コストは下がり続けている」とグラス氏は言う。「合成コストはさらに低い」

グラス氏によると、DNAに情報を数百年保存したいのであれば、DNAを安定化させるための追加的な対策が必要だという。骨や化石に閉じ込められた遺伝物質とは異なり、遊離DNAは安定していないとグラス氏は説明する。研究室にそのまま置いておくと、わずか1年で情報が失われ始める。

コストは高いものの、密度と実現可能性の高さから、DNAストレージは同様の機能を持つ他の新技術よりもはるかに魅力的です。「ここで得られる情報ストレージの密度は、個々の原子を表面に配置する技術と同等です」とコスリ氏は述べ、IBMが35個のキセノン原子で記述された1989年の研究に言及しました。

「そういうことは可能ですが、絶対零度に近い真空中で、しかも(優れた)画像撮影技術が必要です」とコスリ氏は言う。「それが競争力のある技術です。(DNAストレージは)それよりもはるかに実用的ですが、フロッピーディスクやメモリースティックといった、私たちが(通常)考えている他のものと比べると、はるかに実用的ではありません」

DNAは3次元での保存も可能にします。ホログラフィーやレーストラックメモリもこの方法の一つです。しかし、コスリ氏によると、DNAは「密度がはるかに高い」とのことです。

コスリ氏は、 Science誌に掲載されたこの論文を受けて、DNAストレージの大規模運用を阻んでいる唯一の要因はコストだと述べています。「コードについては他にも様々な疑問がありました。本当に機能するのか、信頼できるのか、といった疑問です。これらの疑問はすべて、この論文によって解決されたようです。私の心に残る唯一の疑問は、コストの問題です。」

コスリ自身はもはやDNAストレージの研究はしていないが、この技術の将来的な発展については楽観的な見方を崩していない。「100万分の1というとかなり大きな数字に聞こえるかもしれないが、過去15年間で既にコストは約100万分の1にまで削減されている。シーケンシングだけでなく、合成の部分もかなり削減されている」とコスリは言う。

エルリッヒ氏のビジョンは、将来的には「DNA合成を迅速かつ簡単に行えるDNAストレージ専用のプロセス」を開発し、コストをさらに削減できるというものだ。

「コーディング戦略に従えば、こうした半端なケーキでもちゃんとデータにアクセスできます」とエルリッヒは言う。「将来的には、まさにそれを実験してみたいと考えています。」

今回の研究は幸先の良いスタートを切った。研究者たちが保存・復元したものは、いずれもエラーに敏感なものばかりだった。オペレーティングシステム、コンピューターウイルス、50ドルのAmazonギフトカード、1895年のフランス映画(「ラ・シオタへの列車の到着」)、パイオニアの銘板、そして情報理論家クロード・シャノンによる1948年の研究論文だ。

「『DNAに動画をどう保存できるんだ?』って言われました」とエルリッヒは言う。「6歳の息子に説明しなければなりませんでした」

「人々の想像力を掻き立てる。これが私たちのやりたいことですよね? 科学の楽しい側面を一般の人々に知ってもらいたいんです。」