DNA Storage Pipeline

Le Stockage sur ADN : Une Révolution

Le Processus Physique en 4 Étapes Clés

1. Synthèse (Écriture)

C'est le processus d'écriture. Les données binaires (0 et 1) sont converties en une séquence de bases d'ADN (A, C, G, T). Une machine, tel un "imprimeur d'ADN", assemble chimiquement des brins d'ADN synthétique, base par base, pour correspondre à cette séquence.

2. Stockage (Archivage)

Pour une conservation à très long terme, les molécules d'ADN synthétisées sont déshydratées et encapsulées dans des petites billes de silice. Cet "archivage moléculaire" les protège de la dégradation et permet de conserver les données durant des millénaires sans apport d'énergie.

3. Séquençage (Lecture)

C'est le processus de lecture. Les capsules d'ADN sont réhydratées et insérées dans un séquenceur. Cette machine lit l'ordre des bases (A, C, G, T) sur des millions de brins en parallèle, générant de multiples copies ("lectures") de la séquence originale, souvent avec quelques erreurs.

4. Décodage (Interprétation)

C'est l'étape logicielle finale. Les multiples lectures bruitées sont analysées par des algorithmes (comme notre consensus et la correction LDPC) pour reconstruire la séquence d'ADN parfaite. Celle-ci est ensuite reconvertie en données binaires pour restaurer le fichier original à l'identique.

Avantages et Défis

Densité Extrême

Un gramme d'ADN peut théoriquement stocker plus de 200 exaoctets d'information, soit l'équivalent de millions de disques durs. C'est le support de stockage le plus dense connu.

Durabilité Millénaire

Contrairement aux supports magnétiques qui se dégradent en quelques décennies, l'ADN peut préserver l'information pendant des milliers d'années s'il est conservé à l'abri de la lumière et de l'humidité.

Défis Actuels

Les principaux obstacles restent le coût élevé et la lenteur des processus de synthèse (écriture) et de séquençage (lecture), bien que la recherche progresse rapidement pour surmonter ces défis.

Voir le Projet sur GitHub

Simulateur de Pipeline ADN