Assay of Transposase Accessible Chromatin sequencing (ATAC-seq)
Objectifs
La méthode de «Assay for Transposase-Accessible Chromatin using sequencing» (ATAC-seq) est utilisée afin de cartographier l’accessibilité de la chromatine, c’est à dire de détecter les régions ouvertes au sein du génome, au niveau d'une seule cellule. Cela permet notamment d’identifier la position des nucléosomes au sein des régions régulatrices et de mieux comprendre la fixation détaillée des facteurs de transcription dans ces régions (Buenrostro et al., 2015).
Principe
La méthode consiste dans un premier temps à lyser les cellules afin d'accéder au contenu de leurs noyaux. L’euchromatine (part non condensée de l’ADN) est ensuite fragmentée par digestion enzymatique, via une transposase de synthèse hyperactive : la Tn5. Cette dernière, de manière simultanée, fragmente l'ADN accessible et tague ces framents (tagmentation). Une fois purifiés, ces fragments peuvent alors être amplifiés et séquencés (Stevant, 2019).
Mode opératoire
D’abord, entre 500 et 50 000 cellules cultivées sont récoltées, puis préparées par une succession de trois centrifugations intercalées d’un rinçage et d’une lyse. Le culot obtenu contient l’ADN purifié. Ce dernier est alors incubé 30 min à 37°C en présence un mélange réactionnel de transposition contenant la transposase Tn5, à l’origine de la tagmentation. Le tout est alors purifié et peut être stocké à -20°C si nécessaire.
Une fois amplifiés par PCR, les fragments sont séquencés afin d’être identifiés, permettant de savoir quels fragments d’ADN sont sous forme d’hétérochromatine ou d’euchromatine (Buenrostro et al., 2015).
Figure 1 : (A) Schéma de la préparation de la bibliothèque. (B) La transposition entraîne la fragmentation de l'ADN. Avant l'amplification, les adaptateurs doivent être complétés par une étape d'extension à 72°C. Au cours de la PCR suivante, une séquence supplémentaire est incorporée dans les adaptateurs, qui comprennent des extrémités de séquençage communes et un code-barres de séquençage (Buesnrostro et al., 2015).
Présentation des résultats
Les données obtenues correspondent à des pics de “reads” (fragments de séquences), dans les régions ouvertes de l’ADN. Il est en effet possible de traiter les données avec un algorithme d'analyse standard tel que proposé par ENCODE project (https://www.encodeproject.org/atac-seq/). Ce dernier s’assure de la qualité du séquençage, supprime les adaptateurs d’amplification des fragments de séquence et analyse les correspondances avec un génome de référence. Les correspondances fréquentes sont matérialisées par des pics (Stevant, 2019).
Figure 2 : Identification d’un enhancer dans le tissu primodium de l’oeil chez la drosophile avec l’ATAC-seq (Davie et al., 2015)
Interprétation des résultats
Pré-analyse
Un contrôle de la qualité est effectué, une étape habituelle avec les méthodes de séquençage haut-débit. Un alignement avec les génomes connus, puis une vérification de cet alignement sont ensuite effectués.
Analyse de base
La deuxième grande étape de l'analyse des données ATAC-seq consiste à identifier les régions accessibles (également appelées pics de chromatine ouverte) et constitue la base d'une analyse avancée.
Analyse avancée
Cette dernière étape consiste en l’analyse différentielle et annotation des pics, l’analyse de l’enrichissement des motifs, l’analyse de l’empreinte, pour conduire à l’analyse de la position des nucléosomes. (Baek et Lee, 2020)
Figure 3 : Feuille de route d’une analyse typique de données ATAC-seq (Yan et al., 2020)
Intérêts et limites
Un intérêt de cette méthode est le faible nombre de cellules nécessaire à la mise en place de la méthode par rapport à d’autres méthodes telles que MNase-seq, ChIP-seq ou DNase-seq (10 à 100 fois moins). Le protocole nécessite 3 h de travail pour obtenir des résultats (contre 4 jours pour les autres). De plus, la PCR peut être réalisée plus tard à partir des échantillons congelés.
Un problème lié à cette méthode est l’analyse informatique des données, qui peut s’avérer fastidieuse. De plus, il y a de nombreux éléments potentiellement fonctionnels dans les régions accessibles du génome. Cela complexifie l’interprétation des données si ces éléments sont mal connus (Höllbacher et al., 2020).
Références bibliographiques
Buenrostro, J.D., Wu, B., Chang, H.Y., and Greenleaf, W.J. (2015). ATAC-seq: A Method for Assaying Chromatin Accessibility Genome-Wide. Curr. Protoc. Mol. Biol. 109:21.29.1-21.29.9.
Baek S, Lee I (2020) Single-cell ATAC sequencing analysis: From data preprocessing to hypothesis generation. Computational and Structural Biotechnology Journal 18: 1429–1439
Davie K, Jacobs J, Atkins M, Potier D, Christiaens V, Halder G, Aerts S. (2015) Discovery of transcription factors and regulatory regions driving in vivo tumor development by ATAC-seq and FAIRE-seq open chromatin profiling. PLoS Genetics. 4,5
Höllbacher B, Balázs K, Heinig M, Uhlenhaut NH (2020) Seq-ing answers: Current data integration approaches to uncover mechanisms of transcriptional regulation. Computational and Structural Biotechnology Journal 18: 1330–1341