Séquençage NGS : Principe, Utilisations et Technologies | BIOEDUC
Séquençage NGS : Principe, applications et comparaison des technologies
📖 Qu'est-ce que le séquençage de nouvelle génération (NGS) ?
Le séquençage de nouvelle génération (NGS) désigne un ensemble de technologies permettant de séquencer des millions à des milliards de fragments d'ADN ou d'ARN en parallèle. Contrairement à la méthode de Sanger (capillaire), le NGS offre un débit massif, une rapidité incomparable et un coût par base réduit de plusieurs ordres de grandeur. Cette révolution a démocratisé l'accès au génome complet, au transcriptome et à l'épigénome, ouvrant la voie à la médecine personnalisée, à la métagénomique environnementale et à la biologie évolutive.
Le flux de travail typique d'une analyse NGS comprend : la fragmentation de l'ADN, la ligation d'adaptateurs (préparation de librairie), l'amplification (clusters ou polony) et le séquençage par synthèse, par liaison ou par détection de changements physico-chimiques (pH, courant ionique). La bioinformatique intervient ensuite pour le contrôle qualité, l'alignement des reads et l'analyse variante.
🧬 Protocole détaillé d'une analyse NGS (métagénomique 16S)
- Collecte et stabilisation : prélèvement de l'échantillon (sol, microbiote, tissu) et conservation à -80°C ou dans des solutions stabilisatrices.
- Extraction d'ADN total : lyse mécanique et chimique, purification sur colonne ou billes magnétiques.
- Contrôle qualité : quantification (Qubit, NanoDrop) et vérification de l'intégrité (gel ou Bioanalyzer).
- Amplification ciblée : PCR des régions variables V3-V4 du gène de l'ARNr 16S (ou ITS pour les champignons).
- Préparation de librairie : ajout d'index (barcodes) et d'adaptateurs Illumina/PacBio.
- Séquençage haut débit : sur plateforme choisie (Illumina MiSeq, NovaSeq, etc.).
- Traitement bioinformatique : filtrage des reads, regroupement en OTU ou ASV, assignation taxonomique (SILVA, Greengenes) et analyses de diversité alpha/bêta.
Cette approche permet de caractériser la composition bactérienne d'un échantillon sans culture préalable, avec une résolution allant jusqu'au genre, voire l'espèce selon les régions amplifiées.
🔬 Les principales applications du NGS
- Diagnostic clinique & maladies rares : Séquençage d'exome (WES) ou génome complet (WGS) pour identifier des mutations causales.
- Oncologie de précision : Détection de mutations somatiques, fusions de gènes et charges mutationnelles tumorales (TMB) guidant les immunothérapies.
- Pharmacogénomique : Prédiction de la réponse aux médicaments via l'analyse des variants CYP450 et autres gènes métaboliques.
- Microbiologie et infectiologie : Séquençage shotgun métagénomique pour identifier directement les pathogènes à partir d'échantillons cliniques (sang, LCR).
- Écologie et biodiversité : Metabarcoding d'échantillons environnementaux (eau, sol, air) pour le suivi des espèces menacées ou invasives.
- Épigénétique : Séquençage au bisulfite (BS-seq) pour la cartographie des méthylations.
⚙️ Technologies leaders : Illumina, Oxford Nanopore, PacBio
- Illumina (SBS) : Utilise la synthèse avec terminieurs réversibles fluorescents. Précision élevée (>99,9%), débit massif (jusqu'à 20 Gb par run pour MiSeq, 6 Tb pour NovaSeq). Lectures courtes (2x300 pb). Référence pour RNA-Seq et exome.
- Oxford Nanopore (ONT) : Technologie de pores protéiques mesurant les variations de courant lors du passage d'un brin d'ADN. Lectures ultra-longues (>100 kb), temps réel, appareils portables (MinION). Erreur initiale ~5-10% améliorée par les modèles de correction (Q20+). Idéal pour assemblages de novo et détection de modifications épigénétiques directes.
- PacBio (SMRT Sequencing) : Séquençage en temps réel d'une polymérase immobilisée. Mode HiFi génère des reads de 15-25 kb avec une exactitude >99,9% grâce à la lecture circulaire. Parfait pour les génomes complexes (régions répétées, GC riches).
Chaque technologie présente des compromis entre longueur de lecture, précision, débit et coût. En pratique, on combine souvent Illumina pour la haute précision et Nanopore/PacBio pour la résolution des réarrangements structuraux.
📊 Panels ciblés et stratégies d'application
- Panel exome complet (WES) : Analyse des ~20 000 gènes codants. Très utilisé en recherche et diagnostic.
- Panels de gènes spécifiques : Focus sur un groupe de gènes (ex: panel cardiogénétique de 50 gènes) – économiquement efficace.
- Panels oncologiques : Criblage de centaines de gènes impliqués dans le cancer (TP53, EGFR, KRAS, BRCA1/2).
- Panels de fusion ARN : Détection de transcrits de fusion pour le diagnostic de sarcomes et leucémies.