Le
séquençage Illumina est une méthode qui permet le séquençage de plusieurs
centaines de millions de fragments d'ADN. L’application de cette « Next
generation sequencing » (NGS) permet d’étudier la diversité microbienne dans
l’environnement, de séquencer des génomes entiers, ou d’analyser les
interactions entre ADN et protéines. Les domaines d’applications sont les
suivants : la recherche sur le cancer, l’agrigénomique, les analyses
criminalistiques, la FIV (Fécondation In Vitro), le DPI (Diagnostic
Préimplantatoire), la découverte de virus ou la caractérisation de
micro-organismes non cultivables 3.
II.
Principe
Cette technologie se
base d’abord sur l’acquisition d’une librairie1.
Les brins d’ADN sont fragmentés
en segments de 100 à 500 pb et sont couplés à leurs extrémités à des séquences
particulières (une séquence permettant la liaison, des séquences index et une
région complémentaire aux oligonucléotides de la plaque). Ces fragments sont
amplifiés en PCR « bridge » en phase solide. Le séquençage est réalisé grâce à
un émetteur fluorescent fixé aux nucléotides (un type de nucléotide est associé
à un type de longueur d’onde qui lui est propre)3.
La technologie Illumina s’appuie
sur différentes techniques qui dont le SBS (sequencing
by synthesis), la patterned flow cell
technology et l’acquisition de données de plusieurs téraoctets.
Figure 1: Brins
d'ADN fragmentés
III. Mode opératoire
Les fragments d’ADN sont déposés
sur une plaque recouverte de deux types d’oligonucléotides chacun identiques à
l’une des extrémités des brins d’ADN. L’ADN complémentaire à ces fragments est
synthétisé en se servant des oligonucléotides de la plaque comme support
initiateur (Figure 2). Les fragments
primaires d’ADN sont dénaturés puis lavés grâce à un tampon spécifique2.
Le brin se plie et s’hybride au second type d’oligonucléotides présent sur la
plaque 3.
Il y a synthèse du brin antisens
formant ainsi un pont double brin. Le pont est dénaturé donnant ainsi un brin
linéaire sens et un brin linéaire antisens identique au brin d’origine (Figure
3). Cette étape est répétée de nombreuses fois. Après l’amplification, les
ponts sont coupés et la partie reverse est lavée grâce à un tampon2.
Pour assurer la synthèse du brin
dans le bon sens, les trois premiers nucléotides attachés aux oligonucléotides
du tapis sont « bloqués ».
L’ajout de l'amorce de séquençage
permet de guider la polymérisation réalisée avec des nucléotides marqués avec
une sonde fluorescente (Figure 4). Les clusters sont excités à une longueur
d’onde donnée entrainant ainsi l’émission d’un signal lumineux (ce type de
séquençage est appelé « séquençage par synthèse »). Le nombre de cycle
détermine la longueur du fragment. La
longueur d’onde et l’intensité du signal émis déterminent le nucléotide
associé. Tous les brins identiques sont lus en même temps.
Une fois que la
première lecture est terminée le brin dernièrement synthétisé est éliminé.
L’index 1 est introduit et
hybridé au brin puis « complété » par synthèse jusqu’à atteindre les
oligonucléotides. Une fois complété, l’index 1 est lavé et les trois derniers
nucléotides sont déprotégés1 (Figure 5).
Le brin se plie alors et se lie
au deuxième type d'oligo. L'index 2 est synthétisé de la même manière pour
permettre la fixation de l'ADN polymérase qui élongue l'oligonucléotide formant
ainsi un pont double-brin qui sera dénaturé, engendrant deux brins linéaires
(Figure 6). Les extrémités 3’ sont bloquées et le brin sens est éliminé
laissant seulement le brin antisens.
La deuxième lecture est initiée
par la fixation de l'amorce de séquence 2 permettant ainsi la synthèse du brin
d'intérêt avec les nucléotides excitables. Ce brin nouvellement synthétisé est
ensuite éliminé à son tour.
IV.
Présentation des résultats
La
synthèse des brins complémentaires aux brins fixés sur les oligonucléotides de
la plaque entraîne pour chaque nucléotide qui se fixe, l’émission d’une
longueur d’onde qui lui est particulière. Les fragments dont la synthèse a été
enregistrée sont ensuite triés selon la séquence index qui leur a été attribué
lors de la préparation des échantillons (séquence qui a elle aussi été
synthétisée, une séquence est propre à un fragment d’ADN). Pour chaque
échantillon, les séquences possédant des schémas de nucléotides similaires sont
regroupées. Les brins sens et anti sens sont appariés permettant ainsi la
construction de séquences continues. Ces séquences continues sont ensuite
alignées par rapport au génome de référence 5. Tout ceci est réalisé
grâce à un logiciel interne à l'entreprise : BaseSpace 6.
V.
Interprétation des résultats
L’interprétation des résultats
dépend de l’objectif du chercheur. Selon l'absence ou la présence de la
séquence identifiée on peut déterminer l'implication d'un gène dans une
maladie. Grâce aux transcrits obtenus (dans le cas d'une rétro-transcription
d'ARN), on peut aussi identifier des gènes et, par la même occasion, estimer
l'abondance des transcrits afin de quantifier la transcription d'un gène.
Les séquences obtenues peuvent
ensuite être utilisées pour réaliser les différents tests bioinformatiques dont
le chercheur a besoin.
VI.
Intérêts et limites
L’avantage de cette
méthode est une amélioration dans la vitesse du séquençage en comparaison à une
méthode de séquençage « Sanger ». De plus, l’exactitude du séquençage
est estimée à 99.9%. L’équipement peut
être coûteux (Hiseq1000 : 560k$), mais en comparaison à d’autres méthodes
comme la méthode Sanger, le prix de réalisation du séquençage n’est en lui-même
pas cher (10k$) 3.
De plus, contrairement
une nouvelle fois à la méthode Sanger, il n’est pas nécessaire de réaliser un
clonage bactérien pour assurer l’efficacité du séquençage.
Cependant, les séquences obtenues sont plus
courtes du fait de la fragmentation de l’ADN. De plus, un génome de référence
doit être établi au préalable, ce qui demande un temps de travail
supplémentaire. La quantité de données obtenue (de l’ordre du téraoctet) est
non négligeable 4. Il faut prévoir une grande capacité de stockage
et faire un choix dans ce que l’on garde ou pas. La transmission des résultats
en sera impactée.
VII.
Références bibliographiques
(1) Meyer M. and Kircher M. (2010). Illumina Sequencing Library Preparation for Highly Multiplexed
Target Capture and sequencing. Cold
spring Harb Protoc.
(2) Hodges E., Rooks M., Xuan Z.,
Bhattacharjee A., Gordon BG., Brizuela L., McCombie WR., and Hannon GJ. (2009). Nat protoc. 4(6):
960-974.