Informations

Extraction de l'ADN acellulaire


Quelqu'un a-t-il réussi à extraire de l'ADN sans cellules du plasma sans utiliser de kits coûteux ? J'ai déjà dépensé beaucoup de mon propre sang à essayer d'utiliser des méthodes standard au phénol/chloroforme avec un rendement très minime. Je sais qu'il est possible que, puisque je ne suis pas enceinte et que je n'ai pas de cancer (j'espère), mon sang n'a peut-être pas une grande quantité d'ADN libre de cellules pour commencer, mais j'ai peur de commencer à utiliser de précieux échantillons expérimentaux jusqu'à ce que je sois confiant que j'ai une technique qui fonctionnera.

Pour certains antécédents, l'ADN acellulaire est l'ADN qui circule dans le plasma (par opposition à la majorité de l'ADN qui est cellulaire). C'est devenu une nouvelle façon passionnante d'analyser l'ADN fœtal à partir du sang d'une mère sans faire une amniocentèse dangereuse. Il existe également des preuves solides que l'ADN tumoral peut également être trouvé en abondance de cette façon (la plupart des études semblent porter sur le cancer de la prostate).

Qiagen a un kit à vendre pour extraire cet ADN mais c'est assez cher et je pense toujours que le phénol/chloroforme me donnerait un rendement élevé (si moins pur). Il y a un article dans Cancer Biomarkers 2013 par Mazurek et al qui prétend comparer les méthodes et montrer un rendement raisonnable avec cette méthode mais je ne l'ai pas reproduit. Quelqu'un ici a-t-il réussi et si oui quelles modifications avez-vous utilisées ? Est-il juste temps de passer à l'utilisation d'échantillons plus susceptibles de contenir de plus grandes quantités d'ADN acellulaire ?


À noter: Je n'ai aucune expérience personnelle avec ce protocole. Je vous transmets ce document, qui m'a été transmis par un collègue

Il existe de nombreux kits et méthodes disponibles qui ne reposent pas sur Qiagen. Ou alternativement, si vous leur demandez gentiment, ils font des remises importantes sur leur premier kit que vous leur achetez comme une sorte d'essai (car ils ne font pas d'échantillons).

Cependant, pour répondre à votre question principale, ajoutez-vous un détergent et dénaturez-vous à la chaleur vos échantillons avant le phénol-chloroforme (Triton/Heat/Phénol) ?

Les échantillons de sang pour l'analyse CFDNA sont collectés dans des tubes EDTA et maintenus à/ou en dessous de la température ambiante (18 °C-22 °C) pendant pas plus de 2 h avant la séparation du plasma. Le plasma doit être séparé des échantillons de sang total par double centrifugation (800 g et 1600 g pendant 10 min, séparément), en évitant la lyse des leucocytes. Nous préférons isoler le CFDNA immédiatement après la séparation du plasma pour minimiser l'effet d'un stockage prolongé. Sinon, les échantillons doivent être aliquotés en petites portions et conservés à -70 °C avant l'extraction, car la fragmentation du CFDNA peut être causée par des cycles de gel-dégel répétés.

Pour la méthode THP, 500 l de plasma/sérum ont été mélangés avec 5 l de Triton X-100 (Sigma-Aldrich, UK) et dénaturés à la chaleur à 98 °C pendant 5 min. Les échantillons ont été placés sur de la glace pendant 5 min, puis extraits avec un volume égal de phénol-chloroforme-alcool isoamylique (25:24:1, v:v:v) (Sigma-Aldrich, UK) et centrifugés pendant 10 min à 14 000 g . La phase aqueuse a été précipitée pendant une nuit avec 1/10 de volume de NaOAc 3 M et 2,5 volumes d'éthanol à 100 % à -20°C. Le culot d'ADN a été lavé à l'éthanol, séché à l'air et remis en suspension dans 50 µl de ddH20.

Dans le protocole THP, une incubation à 98 °C a été utilisée pour inactiver les inhibiteurs de PCR et dénaturer les protéines dans les échantillons de plasma/sérum. Différentes durées et températures ont été testées avant de choisir celle-ci. Comme nous avions remarqué une contamination substantielle de l'ADN dans le SDS, Triton X-100 a été utilisé dans l'étape de solubilisation des protéines. La PCR conventionnelle directe a été réalisée avec succès sur des échantillons dénaturés par la chaleur et capable de détecter 25 ng/ml d'ADN, indiquant que cette procédure simple offrait une digestion des protéines et une élimination des inhibiteurs suffisantes pour l'analyse PCR. Le protocole THP a donné un rendement significativement plus élevé de solution d'ADN pur pour l'analyse qPCR que le kit QIAamp. Le protocole THP a montré une efficacité élevée même avec de petits fragments d'ADN aussi bas que 100 pb.

Vous voudrez peut-être lire ceci : Xue, Xiaoyan et al. "Optimiser le rendement et l'utilité de l'ADN acellulaire circulant à partir du plasma et du sérum." Clinica Chimica Acta 404.2 (2009) : 100-104.

Une recherche rapide sur Google Scholar a également révélé quelques autres articles susceptibles de vous intéresser :

Fleischhacker, Michael, et al. "Les méthodes d'isolement de l'ADN plasmatique acellulaire affectent fortement le rendement en ADN." Clinica Chimica Acta 412.23 (2011) : 2085-2088.

METTRE À JOUR:

Après avoir lu ceci (Fong, Siew Lee, et al. "Comparaison de 7 méthodes d'extraction d'ADN acellulaire à partir d'échantillons de sérum de patients atteints de cancer colorectal." Chimie clinique 55,3 (2009) : 587-589.) qui donne environ 7 protocoles (malheureusement sans aucune référence pour une raison quelconque) que je suis allé chercher est venu avec ceci:

L'ADN a été extrait de 1,0 ml de plasma par la méthode au phénol-chloroforme avec de légères modifications. Un ml de plasma a été traité avec 1x solution de SDS/protéinase K (0,5 mg/ml) (1:1), incubé une nuit à 56 °C suivi d'un traitement au phénol-chloroforme (4:1) et centrifugé à 7 000 tr/min. La couche supérieure a été transférée dans des tubes à centrifuger frais de 15 ml et la même étape a été répétée à nouveau ; L'ADN a été précipité en ajoutant du glycogène (0,1 ug/ul), de l'acétate d'ammonium (7,5 M) et de l'alcool absolu. Le culot d'ADN a été obtenu par centrifugation à 7 000 rpm ; a été lavé avec de l'alcool à 70 % à 10 000 tr/min, séché et finalement dissous dans du tampon TE à 56 °C et conservé à -20 °C jusqu'à utilisation ultérieure.

Vous pouvez lire sur la méthode ci-dessus ici : Singh, Deepika Misra1 Renu et Monisha Banerjee. "Une méthode simple et fiable pour obtenir de l'ADN fœtal à partir de la circulation maternelle ; sa précision et sa sensibilité."

Aussi, si c'est à votre disposition, cela peut valoir le coup :

Gahan, Peter B., éd. Acides nucléiques circulants dans le diagnostic précoce, le pronostic et la surveillance du traitement : une introduction. Vol. 5. Springer, 2014.


Extraire l'ADN acellulaire du plasma

  • Kit d'acide nucléique circulant QIAamp : le kit utilisé par de nombreuses études cfDNA.
  • Kit ZR Serum DNA : le protocole utilise des ZymoBeads mais avec un tampon de lyse génomique, ce n'est peut-être pas une bonne idée si cela lyse les globules blancs restants dans votre échantillon ?
  • Enrichissement à médiation par polymère (PME) d'AnalytikJena : pour traiter jusqu'à 5 ml de plasma en moins d'une heure.
  • Kit d'ADN circulant sans cellules plasma/sérum Norgen® : traitement sur colonne de centrifugation de 10 L à 400 μL de plasma ou de sérum.
  • NucleoSpin plasma XS : traitement sur colonne de centrifugation jusqu'à 240μL de plasma ou de sérum.
  • Kit FitAmp d'EpiGenTek : traitement sur colonne de centrifugation du plasma ou du sérum à l'aide de leur tampon d'isolement d'ADN exclusif en 12 minutes.
  • Kit Circulating NA de Chemagen : traitement sur colonne de centrifugation de 1 à 4 ml de plasma ou de sérum.

Un article de 2003 [1] a proposé l'utilisation de billes magnétiques pour l'extraction d'ADN acellulaire et les a comparées à l'extraction Qiagen. Les deux méthodes ont donné des résultats reproductibles similaires (j'y reviendrai à la fin de cet article).

Un article de 2009 du Singapore General Hospital [2] a comparé 7 méthodes d'extraction. Ils ont rapporté des caractéristiques de performance très différentes et leur propre méthode à l'iodure de sodium (protocole disponible sur demande), une méthode au phénol/choloforme et les méthodes Qiagen QIAamp étaient les plus performantes.

Barret et al 2011 [3] ont évalué différents tubes de prélèvement (tubes K(3) EDTA et STREK) et les conditions de stockage sur le rendement en cfDNA du sang maternel. Ils ont utilisé la PCR numérique d'un test PCR court (cfDNA) et long (maternel gDNA) pour démontrer que la proportion de cfDNA diminue avec le temps en raison de l'augmentation de l'ADN maternel due à la lyse cellulaire, mais que cela "peut être largement évité" par la collecte. dans les tubes STRECK. Ils ont également montré que le stockage à 4°C n'est pas nécessaire, mais que la centrifugation immédiate après le prélèvement sanguin est particulièrement importante lorsque les échantillons ne peuvent pas être traités immédiatement.

Extraction d'ADN sans cellules à base de billes : La suppression de l'étape de centrifugation rendrait les protocoles beaucoup plus faciles à utiliser, mais nécessitera probablement des protocoles de collecte, de stockage et de traitement très définis pour minimiser la contamination de l'ADNg par les globules blancs.

LGC a publié un article [6] décrivant une méthode qu'ils ont commercialisée pour extraire l'ADNg des taches de sang séché. Cela commence par une étape de lyse cellulaire et ne convient donc pas à la circulation de l'ADN, mais la liaison aux billes magnétiques est un processus si facile à exécuter en laboratoire que je me demande si nous pourrions l'utiliser pour une extraction directe à base de billes de sang total ( ou urine), sans centrifugation ?

Dans les diapositives « Boot Camp » de Broad (une excellente introduction à NGS datant d'environ 2010), ils présentent la figure ci-dessous d'un double SPRI pour la sélection de la taille. Mon idée est de modifier ce principe pour capturer tout l'ADN dans un tube de sang immédiatement sur le couvercle en étant fermé avec un réactif qui ferait un cocktail SPRI à haute concentration (2,5x). Cela conduirait tous ADN sur les billes, y compris tout l'ADN acellulaire et de poids moléculaire élevé provenant des globules blancs. Le tube serait ensuite placé sur un aimant capturant tout l'ADN en solution et permettant à tout le reste, cellules, plasma, etc., d'être déversé. Après un lavage rapide, l'ADN acellulaire serait élué préférentiellement avec un mélange SPRI à faible concentration (0,5x), laissant un ADN de poids moléculaire élevé lié aux billes. La reformulation dans le cadre d'un tube de prélèvement sanguin, similaire aux tubes de prélèvement de salive DNA Genoteks, pourrait en faire un échantillon très facile à collecter et à traiter. Et la suppression de toutes les étapes de centrifugation et la capacité de collecter l'ADN acellulaire de l'ensemble de l'échantillon augmenteraient, espérons-le, la sensibilité en maximisant la récupération d'ADN acellulaire.


Enzymes Marines et Métabolisme Spécialisé - Partie B

Soo Y. Ro , Amy C. Rosenzweig , dans Methods in Enzymology , 2018

6.1 Extraction d'ADN à partir de Mme trichosporium Cellules OB3b sur plaques de gélose

extraction d'ADN de Mme trichosporium OB3b est moins efficace que l'extraction d'ADN de nombreuses bactéries méthanotrophes de type I ou II. Les méthodes existantes utilisent la méthode de lyse neutre/CsCl ou un kit DNeasy Blood Tissue (Qiagen) pour les extractions d'ADN à partir de cultures liquides ( Gu et al., 2016 Smith & Murrell, 2011 ). Cependant, la croissance de cultures liquides pour génotyper plusieurs colonies prend du temps. Au lieu de cela, une méthode améliorée a été développée pour extraire l'ADN des cellules se développant sur des plaques de gélose à l'aide du kit MasterPure Complete DNA Purification (Epicentre, Cat. No. MC85200). Cette méthode permet un débit plus élevé de criblage de génotypes et fournit des rendements accrus d'ADN à partir de plus petites quantités de cellules. Le protocole du kit de purification d'ADN complet MasterPure a été modifié pour Mme trichosporium OB3b :

Ajouter 20 L de protéinase K (NEB, 800 U/mL) dans 300 L de solution de lyse tissulaire et cellulaire 2 × pour chaque échantillon.

Faites glisser une boucle d'inoculation stérile à travers la culture sur plaque de gélose jusqu'à ce que la boucle soit recouverte de cellules (Fig. 5).

5 . Quantité de Mme trichosporium Cellules OB3b requises pour l'extraction d'ADN montrées sur une boucle d'inoculation de 1 L.

Agiter la boucle d'ensemencement dans la solution de lyse et remettre en suspension complètement par pipetage.

Incuber l'échantillon à 65°C pendant une nuit à 500 rpm.

Ajouter 5 L de RNase A (Epicentre, 5 g/μL). Incuber 1 h à 37°C sans agitation.

Placer les échantillons sur la glace pendant 5 min.

Ajouter 150 L de réactif de précipitation des protéines MPC et vortexer.

Centrifuger l'échantillon à 10 000 × g à 4°C pendant 10 min pour sédimenter les débris cellulaires.

Transférer le surnageant dans un nouveau tube et ajouter 500 L d'isopropanol à 100 % sur de la glace. Inversez manuellement l'échantillon 30 fois.

Centrifuger l'échantillon à 4°C pendant 30 min à 20 000 × g pour culotter l'ADN.

Laver le culot d'ADN avec 750 L d'éthanol à 70 % sur de la glace. Centrifuger à 20 000 × g à 4°C pendant 5 min, éliminer l'éthanol et répéter l'étape de lavage une fois de plus.

Laisser sécher le culot à 37°C jusqu'à disparition de l'éthanol résiduel.

Remettre en suspension le culot avec 50 L de tampon TE et incuber une nuit à 4°C.

Le rendement en ADN peut varier de 10 à 60 g. Des étapes de nettoyage supplémentaires utilisant des colonnes de centrifugation en silice (Zymo) peuvent être nécessaires pour des utilisations autres que le simple séquençage de Sanger.


Une nouvelle méthode pour améliorer l'efficacité d'extraction et la pureté de l'urine et de l'ADN acellulaire

Cette étude a évalué trois kits d'extraction d'ADN sans cellule (cfDNA) disponibles dans le commerce et l'impact d'une procédure de nettoyage d'ADN à base de PEG (DNApure) sur la qualité et le rendement de cfDNA. Six échantillons d'urine et de plasma de donneurs normaux et des échantillons de quatre femmes enceintes (PG) portant des fœtus mâles ont subi des extractions avec le kit d'extraction JBS cfDNA (kit J), le kit d'extraction d'ADN sans cellules MagMAX (kit M) et l'acide nucléique circulant QIAamp Trousse (trousse Q). Récupération d'un pic de produit PCR, endogène TP53, et l'ADN du chromosome Y a été utilisé pour évaluer les performances du kit. Les profils d'ADN de taille nucléosomique variaient d'un kit à l'autre, avec des pics de taille multinucléosomique importants présents dans l'ADN de l'urine et du plasma isolés par les kits J et M uniquement. Le kit J a récupéré significativement plus d'ADN de pointe par rapport au kit M ou Q (p<0.001) de l'urine, et des quantités similaires de plasma (p= 0,12). L'application de DNApure à l'ADN isolé des kits M et Q a considérablement amélioré l'efficacité d'amplification de l'ADN de pointe de l'urine (p<0.001) et plasma (p0,013). De plus, le kit J a isolé significativement plus d'ADN du chromosome Y de l'urine PG par rapport au kit Q (p=0,05). Nous concluons que DNApure fournit un moyen efficace d'améliorer le rendement et la pureté du cfDNA et de minimiser les effets de la variabilité des échantillons biologiques pré-analytiques sur les performances du test de biopsie liquide.

Déclaration d'intérêts concurrents

Selena Lin, Matthew Marshall et Barbara Johnson sont des employés de JBS Science, Inc. Selena Lin est actionnaire de JBS Science, Inc. Ying-Hsiu Su a reçu un financement de JBS Science, Inc. Tous les autres auteurs n'ont aucun conflit avec déclarer.


Si la fragmentation du cfDNA a le potentiel d'être traduite en applications cliniques, quelle est l'application la plus susceptible d'émerger en premier ?

Florent Moulière : Plus qu'une application clinique spécifique, la fragmentomique du cfDNA pourrait d'abord être combinée avec d'autres « omiques » pour augmenter leur potentiel d'analyse du cfDNA. Les fragments de cfDNA provenant d'une variété de cellules et de tissus ont tendance à être plus courts que le cfDNA dérivé de cellules hématopoïétiques d'environ 25 pb. Cela a été démontré dans le cfDNA dérivé du placenta pendant la grossesse, le cfDNA dérivé d'une greffe et le cfDNA dérivé de la tumeur. Ce changement de petite taille a déjà permis de nouvelles stratégies analytiques. Par exemple, en sélectionnant des fragments courts par des méthodes in vitro et in silico, nous pouvons observer un enrichissement relatif pour un signal cellulaire spécifique (par exemple, un signal tumoral dans le plasma d'un patient atteint de cancer). Pour la biopsie liquide, le filtrage du bruit biologique lié à l'hématopoïèse clonale de potentiel indéterminable enrichi dans des plages de tailles spécifiques améliore l'appel de mutation lorsque la fraction tumorale est faible (et réduit ainsi le signal faussement positif). Fait intéressant, étant donné que ces approches reposent sur la propriété intrinsèque de la fragmentation du cfDNA, elles pourraient être mises en œuvre quelle que soit la technologie utilisée (par exemple, le séquençage ciblé ou la capture hybride).

Dennis Lo : Je pense que de nombreux aspects de la fragmentation du cfDNA sont liés au tissu d'origine des molécules de cfDNA concernées. Par exemple, les taux et les types de mort cellulaire sont différents pour différents tissus. De plus, les principaux acteurs de la fragmentation du cfDNA (par exemple, les types et les concentrations de nucléases, la structure de la chromatine, les molécules qui se lieraient aux facteurs de transcription de l'ADN) varieraient également d'un tissu à l'autre. D'un point de vue diagnostique, la capacité de discerner le tissu d'origine serait très précieuse dans la détection du cancer (pour la localisation du cancer et la détection des métastases), les tests prénatals non invasifs (où l'ADN « fœtal » provient principalement du placenta), la post-transplantation surveillance (pour détecter l'ADN provenant de l'organe transplanté).

Ellen Heitzer : L'avantage d'inclure la présence de fragments d'ADN dérivés du placenta plus courts pour établir la fraction d'ADN fœtal dans les tests prénatals non invasifs (DPNI) est déjà bien documenté. Étant donné qu'il existe de plus en plus de preuves provenant de nombreuses applications cfDNA chez les patients cancéreux que la précision et la résolution peuvent être augmentées si les analyses sont limitées à des fragments d'ADN plutôt plus courts, l'inclusion de telles informations basées sur la fragmentomique a également un grand potentiel clinique. En raison de la grande pertinence des analyses de mutations chez les patients atteints de cancer et de l'impact confusionnel des variantes liées à l'hématopoïèse clonale, l'analyse fragmentomique pourrait permettre de distinguer ces types de mutations. Enfin, la perspective d'utiliser la fragmentomique pour la détection précoce du cancer est très excitante et prometteuse. Cependant, de telles applications nécessiteront des études bien conçues avec un grand nombre de proposants pour établir une sensibilité et une spécificité précises et ne seront donc pas réalisées en tant qu'applications cliniques dans les années à venir. .

Dana Tsui : L'application clinique la plus immédiate serait d'augmenter la sensibilité et la spécificité de la détection du cancer et d'éviter potentiellement le besoin de tests répétés. La capacité d'informer le tissu d'origine peut être utilisée dans un test de dépistage précoce du cancer pour identifier l'emplacement d'une tumeur après la détection du cancer. La connaissance du contexte de séquence du cfDNA peut également permettre le développement d'une nouvelle stratégie de détection qui peut améliorer les performances diagnostiques d'un test basé sur le cfDNA.


Extraction d'ADN acellulaire - Biologie

myTXTL ® est une plate-forme d'expression sans cellule polyvalente et facile à utiliser pour la synthèse des protéines, l'ingénierie enzymatique et la biologie synthétique dans les applications industrielles et académiques. Développée à l'origine par le professeur Vincent Noireaux de l'Université du Minnesota, cette technologie TX-TL révolutionnaire et puissante a été perfectionnée chez Daicel Arbor Biosciences pour offrir une plus grande robustesse et des performances fiables et cohérentes. Cette technique bien caractérisée a été utilisée dans les laboratoires de biologie synthétique du monde entier pour une grande variété d'applications, notamment la synthèse de protéines toxiques, l'ingénierie enzymatique rapide et la production de bactériophages.

myTXTL Sigma 70 Master Mix est le choix parfait pour la production à haut rendement de protéines solubles et membranaires, le prototypage rapide de réseaux de gènes à l'aide d'ADN plasmidique, la construction de cellules minimales synthétiques et pour étudier la synthèse chimique. Le kit d'expression d'ADN linéaire myTXTL est conçu pour une synthèse efficace à l'aide de matrices d'ADN linéaires sans avoir besoin de clonage ni de stabilisants supplémentaires. Ajoutez simplement une matrice d'ADN linéaire au master mix optimisé pour commencer la synthèse des protéines. Le kit d'expression myTXTL T7 a été conçu pour une robustesse maximale et des performances fiables lors de l'utilisation de constructions pilotées par le promoteur T7. Co-expression continue de l'ARN polymérase T7 dans le E. coliLe mélange maître basé sur la production de protéines pour n'importe quel modèle avec un promoteur T7. Toutes les options se marient bien avec les systèmes automatisés de manipulation de liquides, ce qui en fait une plate-forme idéale pour des cycles de test de conception-construction rapides lors du criblage de bibliothèques ou de l'analyse de pièces génétiques et de circuits génétiques.

myTXTL allie une manipulation sans OGM extrêmement conviviale et sûre à une efficacité de synthèse protéique exceptionnelle et à une grande polyvalence, ce qui le rend tout aussi bien adapté à la recherche de pointe et à la formation des étudiants. Découvrez notre gamme complète de produits myTXTL ci-dessous, ou contactez nos scientifiques experts dès aujourd'hui pour déterminer quel produit myTXTL est le mieux adapté à votre application spécifique.


Extraction d'ADN acellulaire - Biologie

Tous les articles publiés par MDPI sont rendus immédiatement disponibles dans le monde entier sous une licence en libre accès. Aucune autorisation particulière n'est requise pour réutiliser tout ou partie de l'article publié par MDPI, y compris les figures et les tableaux. Pour les articles publiés sous licence Creative Common CC BY en accès libre, toute partie de l'article peut être réutilisée sans autorisation à condition que l'article original soit clairement cité.

Les articles de fond représentent la recherche la plus avancée avec un potentiel important d'impact élevé dans le domaine. Les articles de fond sont soumis sur invitation individuelle ou sur recommandation des éditeurs scientifiques et font l'objet d'un examen par les pairs avant leur publication.

L'article de fond peut être soit un article de recherche original, une nouvelle étude de recherche substantielle qui implique souvent plusieurs techniques ou approches, ou un article de synthèse complet avec des mises à jour concises et précises sur les derniers progrès dans le domaine qui passe systématiquement en revue les avancées les plus passionnantes dans le domaine scientifique. Littérature. Ce type d'article donne un aperçu des orientations futures de la recherche ou des applications possibles.

Les articles du Choix de l'éditeur sont basés sur les recommandations des éditeurs scientifiques des revues MDPI du monde entier. Les rédacteurs en chef sélectionnent un petit nombre d'articles récemment publiés dans la revue qui, selon eux, seront particulièrement intéressants pour les auteurs ou importants dans ce domaine. L'objectif est de fournir un aperçu de certains des travaux les plus passionnants publiés dans les différents domaines de recherche de la revue.


Extraction d'ADN sans cellules urinaires à l'aide de particules de silice modifiées à la triamine pour la biopsie liquide

La présence d'ADN acellulaire d'environ 200 pb (cfDNA) dans l'urine a attiré l'attention en tant que biomarqueur pour la biopsie liquide. Cependant, il n'est actuellement utile que pour les diagnostics de cancers dans lesquels une grande quantité de cfDNA est excrétée dans l'urine. Par conséquent, le développement d'une méthode efficace pour extraire le cfDNA existant en petites quantités dans l'urine est essentiel pour le diagnostic de nombreuses autres maladies. Nous avons examiné l'effet de la taille des particules, de la petite taille des pores (surface spécifique) et de la modification de la surface des particules de silice poreuse sur l'efficacité de l'extraction de l'ADN. Nos observations suggèrent que le cfDNA pourrait être capturé par des particules modifiées par une amine tertiaire, puis retiré des particules par lavage répété avec du bicarbonate de sodium (pH 11). En utilisant cette méthode avec 30 mg de particules modifiées par la triamine, nous avons réussi à extraire quelques centaines de nanogrammes de cfDNA à partir de 15 ml d'urine. De plus, nous avons pu détecter

67 fg/mL d'ADN carieux (211 pb) dans un échantillon d'urine de 15 mL, ce qui suggère que cette méthode peut convenir à l'extraction de biomarqueurs génétiques pour la biopsie liquide à base de cfDNA.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.


Résultats

Extraits cellulaires bruts préparés par traitement au lysozyme et congélation-décongélation (extrait cellulaire LoFT)

E. coli les cellules traitées au lysozyme sont fragiles et facilement perturbées par le choc osmotique ou les cycles gel-dégel. Ainsi, nous avons combiné ces procédures pour préparer des extraits cellulaires hautement concentrés, comme décrit dans la figure 1A. Une culture L de E. coli cellules en phase logarithmique tardive (DO600 = 1,0-2,0) a été traité avec du lysozyme sur de la glace. Les cellules ont ensuite été lavées avec du saccharose 400 mM et remises en suspension dans du DDW. Les cellules ont été congelées dans de l'azote liquide et ont été progressivement décongelées dans de l'eau glacée, et les surnageants des cellules traitées ont été récupérés par centrifugation. Les culots étant très visqueux, les surnageants ont été soigneusement collectés. Les extraits cellulaires résultants, obtenus par traitement au lysozyme, choc osmotique et congélation-décongélation (extrait cellulaire LoFT), contenaient généralement 20 à 30 mg/mL de protéines.

(A) Un protocole typique pour préparer l'extrait cellulaire LoFT. (B) Coloration de Coomassie après SDS-PAGE, montrant l'expression de la GFP et de FtsZ (un homologue de la tubuline bactérienne) en utilisant le protocole d'extraction cellulaire LoFT. pOR2OR1-sfGFP (gfp sous contrôle du promoteur OR2-OR1), pET29-sfGFP (gfp sous contrôle du promoteur T7) ou pET29-ftsZ (ftsZ sous le contrôle du promoteur T7), le plasmide a été mélangé avec l'extrait cellulaire LoFT et les mélanges réactionnels et incubé pendant 14 h à 29°C. L'expression de FtsZ a été confirmée à l'aide d'un FluorTect GreenLys in vitro système d'étiquetage de traduction (Promega, Fitchburg, WI).

Les extraits de cellules LoFT présentaient une expression protéique efficace dans le système CFPS, lorsqu'ils étaient combinés avec d'autres composants du mélange réactionnel et de l'ADN plasmidique (figure 1B). Typiquement, environ 10 à 20 M (0,25 à 0,5 mg/mL) de sfGFP actif ont été synthétisés après une réaction de 14 h à 29 °C. L'ARN polymérase T7 et endogène E. coli L'ARN polymérase dans l'extrait cellulaire LoFT a fonctionné comme machinerie de transcription pour CFPS (Fig 1B). La protéine FtsZ, un analogue de la tubuline bactérienne, a également été synthétisée par CFPS en utilisant un extrait cellulaire LoFT (Fig 1B, S1 Fig).

Les niveaux d'expression des protéines étaient presque saturés après une réaction de 3 h (S2 Fig). La 3-PGA et la créatine phosphate kinase ont pu être utilisées comme sources d'énergie (Fig S3), comme indiqué dans d'autres études CFPS [25–28,30,31].

Conditions optimales de gel-dégel après traitement au lysozyme

Les conditions de congélation et le nombre de cycles sont des facteurs importants pour maximiser le rendement en protéines lors de la perturbation du gel-dégel. Premièrement, nous avons évalué l'effet des températures de congélation sur le rendement en protéines. Les suspensions cellulaires ont été divisées dans six tubes immédiatement avant la congélation. Trois tubes ont été congelés dans un congélateur (à -80°C) pendant 1 h, tandis que les trois autres tubes ont été immergés dans de l'azote liquide (à -196°C) pendant 15 min. Tous les tubes ont été décongelés dans de l'eau glacée et les surnageants (extraits cellulaires) ont été collectés après centrifugation. En termes de concentration en protéines, nous avons constaté que la congélation dans l'azote liquide, par rapport à la congélation à -80 ° C, entraînait un rendement en protéines 1,33 fois plus élevé (figure 2A).

(A) Effets de la température de congélation sur la concentration en protéines (concentration de protéines) après congélation-décongélation. Les échantillons ont été congelés dans un congélateur (-80°C) pendant 1 h, immergés dans de l'azote liquide (Liq. N2) pendant 15 min, ou non congelé. (B) Concentration en protéines (barres grises) dans les extraits cellulaires LoFT et volume de surnageant (Sup.) après centrifugation (cercles) par rapport au nombre de cycles de gel-dégel. Les volumes de surnageant collectables ont été dérivés de la viscosité des débris cellulaires après congélation-décongélation. Étant donné que les écarts types de la solution collectable (n = 3) étaient plus petits (sur l'échelle indiquée) que les tailles des cercles, les barres d'erreur ne sont pas indiquées. Tous les échantillons de (A) et (B) ont été décongelés par incubation dans de l'eau glacée, et les barres d'erreur indiquent l'écart type (n = 3).

Deuxièmement, l'effet de plusieurs cycles de gel-dégel sur le rendement en protéines a été évalué. Plus précisément, un, deux et trois cycles de gel-dégel ont été testés. Le nombre de cycles n'a pas affecté les concentrations en protéines des extraits cellulaires LoFT. Cependant, plusieurs cycles de gel-dégel ont réduit le volume de surnageant collectable après centrifugation (figure 2B). Par conséquent, ces résultats ont indiqué qu'une seule étape de gel-dégel était optimale pour la préparation d'extraits de cellules LoFT lors de l'utilisation de DDW comme solution pour le choc osmotique.

Effet du rapport eau distillée double/cellules humides sur les rendements en protéines

Ensuite, nous avons examiné la relation entre les rendements en protéines et le volume de DDW ajouté avant congélation. Des extraits cellulaires LoFT ont été préparés en utilisant 0,5, 1,0, 1,5, 2,0 et 5,0 ml de DDW pour 1 g de cellules humides, et leurs concentrations respectives en protéines et leurs rendements totaux en protéines ont été évalués.

De plus petits volumes de DDW ont conduit à des concentrations de protéines plus élevées dans les extraits cellulaires LoFT (S4A Fig). Les rendements totaux en protéines n'étaient pas égaux entre les différentes conditions, et le rendement le plus élevé a été obtenu en utilisant 1,5 ml de DDW (S4B Fig) cependant, la concentration en protéines n'a pas atteint la concentration requise pour CFPS (>20 mg/mL). Ces résultats suggèrent que 1,0 ml de DDW pour 1 g de cellules est le rapport recommandé, car ce volume donne des concentrations de protéines suffisantes pour CFPS tandis que les rendements en protéines restent relativement élevés.

Effet de la force centrifuge relative sur l'extrait cellulaire LoFT

La force centrifuge relative (rcf) est un facteur important pour la préparation d'extraits cellulaires pour CFPS. Habituellement, les surnageants sont obtenus après centrifugation à 30 000 × g pendant 30 à 60 min (S30), nos extraits LoFT ont été préparés par centrifugation à 25 000 × g pendant 60 minutes. Cependant, les centrifugeuses couramment utilisées pour les tubes de 1,7 ml ne génèrent généralement pas plus de 20 000 × g. À ce jour, plusieurs groupes ont signalé que la centrifugation à 12 000 × g est suffisant pour collecter des extraits cellulaires après avoir utilisé des méthodes de rupture physique [26,30]. Par conséquent, nous avons évalué l'effet de rcf sur la préparation d'extraits cellulaires LoFT. Les niveaux de centrifugation ont été fixés à 12 000 × g et 16 000 × g, vitesses qui peuvent être générées dans des microcentrifugeuses typiques. Le temps de centrifugation a été ajusté pour atteindre des niveaux égaux de force de centrifugation totale (rcf × temps), par rapport à 25 000 × g pendant 60 minutes. Nos résultats ont démontré que les rendements et les concentrations de protéines extraites étaient similaires pour toutes les conditions rcf testées (Fig 3). Le CFPS utilisant les extraits cellulaires LoFT préparés à des vitesses de centrifugation inférieures a présenté des niveaux d'activité comparables à ceux observés pour les extraits obtenus par centrifugation à 25 000 × g pendant 60 minutes.

La concentration en protéines (barres grises) et les niveaux d'expression de sfGFP, de CFPS en utilisant des extraits cellulaires LoFT et 3 nM de pOR2OR1-sfGFP (cercles), ont été tracés en fonction des forces de centrifugation (12 000 × g pendant 2,5 h, 16 000 × g pendant 94 min, et 25 000 × g pendant 1 h) après congélation-décongélation. Les barres d'erreur indiquent les écarts types (n = 3). Les niveaux d'expression de sfGFP ont été normalisés à la valeur moyenne des extraits cellulaires obtenus après centrifugation à 25 000 × g pendant 1 h (axe vertical). GFP exp. signifie « expression GFP ».

Petites molécules essentielles pour CFPS utilisant l'extrait cellulaire LoFT

Les méthodes de préparation de l'extrait cellulaire LoFT n'incluent pas l'élimination des petites molécules. Nos études précédentes sur des extraits cellulaires sans additif préparés par sonication ont indiqué que les nucléosides triphosphates (NTP) et les acides aminés peuvent être omis du mélange réactionnel CFPS [25]. Ainsi, l'importance de chaque composant dans le mélange réactionnel CFPS a été évaluée dans un essai d'omission (Fig 4). Les composants de notre mélange réactionnel étaient l'ADN matrice (gène GFP sous le promoteur OR2-OR1 [27]), les NTP, les acides aminés, le glutamate de potassium (GluK), l'acétate de magnésium (Mg), le 3-phospho glycérate (3PGA), le tampon HEPES , PEG8000, maltose, CoA, AMPc, NAD + , ARNt, spermidine et donneur de formyle. L'omission de l'AMPc, du NAD + et du CoA a affecté l'efficacité du CFPS, comme précédemment rapporté ailleurs [35]. L'importance de l'ARNt, de la spermidine, du donneur de formyle et du maltose pour le CFPS variait parmi les différents extraits de cellules LoFT, nous ne pouvons donc pas déterminer de manière concluante l'importance de ces produits chimiques. D'autres produits chimiques ont été jugés indispensables pour un CFPS efficace sur la base du test d'omission (Fig 4). Ces résultats suggèrent que l'extrait cellulaire LoFT nécessite plus d'espèces de petits métabolites pour CFPS que l'extrait cellulaire sans additif préparé par sonication [25]. Cela pourrait résulter d'une fuite de petites molécules pendant les étapes de lavage après le traitement au lysozyme.

L'importance de chaque produit chimique pour l'expression de la GFP a été évaluée par omission systématique des mélanges réactionnels. AA désigne le mélange de 20 acides aminés. L'ADN matrice utilisé était 10 nM de pOR2OR1-sfGFP. La CFPS a été réalisée à 29°C pendant 14 h. Dans la condition indiquée par « tous », aucun des produits chimiques n'a été omis. Les barres d'erreur indiquent les écarts types (n = 4).

CFPS à partir de fragments d'ADN linéaires utilisant l'extrait cellulaire LoFT

Pour des applications en biologie synthétique ascendante, le CFPS à partir d'ADN linéaire produit par PCR devrait être possible [12]. Des rapports antérieurs ont montré que l'ajout de GamS, un inhibiteur de la nucléase RecBCD, permet l'utilisation d'ADN linéaire comme matrice pour ce processus [36]. Nous avons confirmé que le système d'ADN linéaire GamS fonctionne également avec l'extrait cellulaire LoFT. La mesure de l'intensité de fluorescence a montré que l'extrait cellulaire LoFT est capable de produire de la GFP, codée par un fragment d'ADN linéaire, d'une manière dépendante de GamS. Cependant, l'activité CFPS était plusieurs fois inférieure à celle de CFPS réalisée à l'aide de plasmides circulaires (Fig. 5A). De plus, l'expression de la protéine s'est arrêtée en 1 h (S5 Fig). La supplémentation en GamS a légèrement, mais pas efficacement, réduit l'expression de la GFP dans CFPS en utilisant des plasmides circulaires (S6 Fig). L'activité CFPS inférieure en utilisant l'ADN linéaire avec le système GamS a également été rapportée dans une étude précédente utilisant S30 préparé par rupture physique conventionnelle [12]. La fluorescence de la GFP après SDS-PAGE sans ébullition a soutenu ces résultats (figure 5B).

La sfGFP a été produite en utilisant un extrait cellulaire LoFT et 5 nM d'ADN linéaire (produit PCR) pendant 1 h à 29°C, en l'absence (-) ou en présence (+) de 4 M de GamS. OR et T7 indiquent les produits de PCR du OR2OR1-sfGFP (du plasmide pOR2OR1-sfGFP) et du T7-sfGFP (du plasmide pET29-sfGFP), respectivement. Bal de promo. signifie « Promoteur ». (A) Niveaux d'expression de la GFP estimés par les niveaux de fluorescence totaux. Les barres d'erreur indiquent les écarts types (n = 3). (B) Fluorescence GFP détectée à l'aide de SDS-PAGE sans ébullition. Seules les bandes correspondant à la fluorescence GFP sont représentées.

De petites molécules dans l'extrait cellulaire LoFT pourraient être échangées avec un tampon

La procédure de préparation de l'extrait cellulaire LoFT ne nécessite aucun tampon. Cependant, l'utilisation d'un tampon pourrait peut-être améliorer l'efficacité du CFPS. Pour répondre à ce point, nous avons testé si l'échange de tampon, après préparation de l'extrait cellulaire LoFT, pouvait améliorer l'efficacité du CFPS. After small molecules in the LoFT cell extract were exchanged with CFPS buffer (5 mM Tris-HCl pH 7.6, 60 mM potassium glutamate, 14 mM magnesium acetate), the activity was assayed using GFP as a reporter. The omission assay revealed that the dependence on added chemicals, for CFPS activity, was quite similar to that of extracts without buffer exchange, with the exception of PEG8000 (Fig 6).

The importance of each chemical for GFP expression was evaluated by systematic omission from the reaction mixtures. AA indicates the mixture of 20 amino acids. pOR2OR1-sfGFP (10 nM) was used as the DNA template. CFPS was performed at 29°C for 14 h. “all” indicates no chemicals were omitted. Expression levels of sfGFP were normalized to the average value of “all.” Error bars indicate standard deviation (n = 4). Expression of sfGFP without GluK and Mg is a result of the exchange buffer (S30 buffer) containing these chemicals.

We also tested the effect of LoFT cell extraction using buffers, instead of DDW, on CFPS. DDW at the last suspension step was replaced with S30 buffer (see Materials & Methods). Because several hundred microliters of cell suspension was used, this replacement slightly decreased protein concentrations after centrifugation. In addition, the supernatant obtained after a single freeze-thaw cycle showed reduced CFPS activity (S7 Fig). Interestingly, CFPS activity was recovered in supernatants that underwent two freeze-thaw cycles (S7 Fig). However, we also found that a single freeze-thaw cycle was sufficient when CFPS buffer was used at a volume of 1.5 times the cell mass.


Phenotypes from cell-free DNA

Cell-free DNA (cfDNA) has the potential to enable non-invasive detection of disease states and progression. Beyond its sequence, cfDNA also represents the nucleosomal landscape of cell(s)-of-origin and captures the dynamics of the epigenome. In this review, we highlight the emergence of cfDNA epigenomic methods that assess disease beyond the scope of mutant tumour genotyping. Detection of tumour mutations is the gold standard for sequencing methods in clinical oncology. However, limitations inherent to mutation targeting in cfDNA, and the possibilities of uncovering molecular mechanisms underlying disease, have made epigenomics of cfDNA an exciting alternative. We discuss the epigenomic information revealed by cfDNA, and how epigenomic methods exploit cfDNA to detect and characterize cancer. Future applications of cfDNA epigenomic methods to act complementarily and orthogonally to current clinical practices has the potential to transform cancer management and improve cancer patient outcomes.

1. Introduction

Blood is a minimally invasive source for tracking an individual's health status. Most known biomolecules found in blood, such as proteins, DNA, RNA, lipids, and metabolites inform us of some aspect of body function. However, using blood to diagnose and track cancer is still a major challenge. Minimally invasive diagnostics for cancer can greatly reduce pain and suffering of patients, and if cheaper than current methods, could be performed more often in the course of treatment to monitor disease state and inform clinical care. Genomic characterization of cancer either from biopsies or plasma cell-free DNA (cfDNA) has the added potential of providing personalized treatment options.

cfDNA is DNA bound to mononucleosomes and is found circulating extracellularly in the blood. cfDNA was first identified in 1948 [1] in the blood of patients however, the hypothesis that cfDNA acts as a reflection of disease state arose from observations in 1977 [2]. This relationship between cfDNA and disease has been a subject of study ever since. There are multiple possible pathways for the release of DNA fragments from cells, including apoptosis, necrosis, and exosome secretion [3–6]. Processes that increase the release of cfDNA include disease, inflammation, tissue injury, and exercise [7,8]. In healthy individuals, haematopoietic maturation is a major contributor to the normal cfDNA pool. Lui et al. elegantly demonstrated that lymphoid/myeloid tissues are the major contributors to cfDNA by identifying Y-chromosome sequences in plasma of female recipients of bone marrow transplantations from male donors [9]. Multiple studies since then further confirmed that the lymphoid/myeloid tissues mainly contribute to the normal cfDNA pool [10–13]. Tumours, when present, also contribute to cfDNA. Thus, cfDNA is a molecular barcode of cells undergoing turnover and is an attractive target for clinical diagnostics and real-time monitoring of many cancers.

Provided that there are ways to distinguish cfDNA originating at the disease site from cfDNA produced during normal turnover, cfDNA could be used for diagnosis. The major focus of using cfDNA for cancer diagnosis has been the identification of a limited disease-specific panel of mutations. However, mutation detection has a significant limitation: that clonal haematopoiesis contributes to a significant fraction of mutations in cfDNA, including mutations in prominent cancer-associated genes like TP53 and DNMT3A [14]. Moreover, these mutations in cfDNA from the early stages of disease can be indistinguishable from mutations that arise at appreciable rates in healthy tissues [15,16]. This major obstacle has led to the exploration of other orthogonal information in cfDNA that could identify its tissue-of-origin and, in turn, disease states. Epigenomes reflect cellular identity and phenotype, and our ability to connect epigenomes to cellular identity could be used to infer disease phenotypes from cfDNA. Significantly, epigenome-based cfDNA approaches would be orthogonal and complementary to mutation-based cfDNA assays. In this review, we discuss epigenome features that can be characterized in cfDNA, and which provide information on the cfDNA tissue-of-origin.

2. Cell-free DNA contains a map of the chromatin state in the tissue-of-origin

The periodicity of cytoplasmic DNA released during red blood cell maturation in mouse fetal liver led to the hypothesis that there was a regular arrangement of protein protections on the genome [17,18]. This work preceded both the field of apoptosis and the biochemical characterization of the nucleosome and provided the first hint that cfDNA could be a map of chromatin structure. Protein-bound DNA lasts longer than naked DNA in serum [19], where nucleases are abundant, which suggests that cfDNA is probably double-stranded and protein-bound to inhibit degradation by endogenous nucleases in plasma. This is supported by the ability to detect nucleosomes in plasma by sandwich enzyme-linked immunosorbent assays (ELISA) and by chromatin immunoprecipitation (ChIP) [20–24].

Apoptosis is one of the processes that could lead to genome fragmentation into small protein-DNA complexes that are found in circulation. Apoptosis involves the upregulation of nucleases that attack the cell's genome. Characteristic of this ‘attack' is DNA fragmentation that results in a laddering of repeat species less than 5 kb [5,25]. The repeating unit in laddering seen in apoptosis corresponds to approximately 150 bp, which parallels the length of DNA wrapped around a nucleosome. Therefore, plasma cfDNA, which is typically in the form of a mononucleosome, informs us about the chromatin structure of cells undergoing turnover. In other words, the ‘epigenome' of the tissue-of-origin can be measured from cfDNA (figure 1).

Figure 1. Cell-free DNA reflects the structural epigenomic information of the cell-of-origin. Schematic of the nucleosomal landscape differences of gene X when it is not expressed (left) and expressed (right) in different cell-types. (une) A non-expressed gene features promoter-proximal DNA methylation (red flags), methylation of nucleosomal histone tails (red flags, H3K27me3), nucleosome occlusion of the promoter (arrow), a lack of transcription factors (TFs) upstream of the promoter, and the absence of RNA polymerase II (RNAPII). (b) At expressed genes, nucleosomes are well-positioned, modifications like H3K4me3 (green flags) are present, RNAPII occupies the promoter, and TFs are bound upstream. At the +1 nucleosome during transcriptional elongation, RNAPII transiently breaks DNA-histone contacts allowing H2A-H2B dimers to exchange (light blue crescent). Nucleases, shown as scissors, are ubiquitously present and preferentially cleave accessible DNA. At gene X, when protein protections of DNA change during chromatin remodelling events, such as transcription, nuclease activity captures the different DNA length protections (see fragment lengths). (c) During cell-turnover, DNA-protein complexes are released into circulation. () Circulating DNA-protein complexes in plasma preserve the epigenomic features of the transcriptional status of the cell-of-origin. These features include fragment lengths (protein-DNA protections), DNA methylation, nucleosome positioning profiles, and nucleosome post-translational modifications. Note the preservation of these transcriptional and non-transcriptional DNA-protein species from in the body to plasma.

3. Structural epigenomics

It has long been known that chromatin structure in cells can be inferred from digestion patterns of nucleases that are sensitive to protein-DNA contacts [26]. Micrococcal nuclease (MNase) has been used to study chromatin structure for decades [27]. Understanding chromatin structure by sequencing fragments protected from MNase digestion has an unexpected parallel in cfDNA. The information derived from fragment length and genome location can inform us of biochemical activity at a genomic locus for MNase and cfDNA. For cfDNA, this can be used to infer transcriptional activity and tissue-of-origin. As we will demonstrate below, the length and genomic location of fragments protected from a nuclease can tell us the locus-specific distribution of nucleosomes, transcription factors (TF), and nucleosomal intermediates formed during transcription (figure 1). The ability to identify locus-specific structures of protein-DNA complexes from sequencing data, termed ‘structural epigenomics', is a general strategy applicable to a wide variety of datasets, including cfDNA sequencing datasets [11].

4. Nucleosome positions reflect genome function

Eukaryotic genomic DNA is packaged with nucleosomes like ‘beads on a string' and consecutive nucleosomes are separated by short linker DNA [28,29]. MNase preferentially degrades linker DNA and is inhibited when it encounters a protein-DNA contact [27,30]. A nucleosome protects 147 bp of DNA, a chromatosome (nucleosome with a linker histone bound) protects 167 bp of DNA, and TFs protect less than 50 bp of DNA. MNase has traditionally been used to map positions of whole nucleosomes in intact nuclei by purifying approximately 147 bp DNA after MNase digestion and subjecting this DNA to massively parallel short-read sequencing [31]. Nucleosome positioning impacts all biochemical processes that occur on the genome and consequently, knowing nucleosome positions enables us to predict biochemical activities that occurred in the cells that resulted in these protections [32]. A striking example of a distinct nucleosome organization is found in active genes. There is a depletion of nucleosomes at active promoters and nucleosomes are well-ordered upstream and downstream of active promoters. cfDNA contains information on nucleosome positioning and high-quality nucleosome maps were obtained from deep, whole-genome cfDNA sequencing from the plasma of healthy donors [12,33–35].

Nucleosome density inferred from cfDNA of healthy individuals had the same features as that of lymphoid cell lines: genes highly expressed in lymphoid cell lines featured nucleosome depletion at promoters and ordered nucleosome positions upstream and downstream of the promoter in cfDNA (figure 1). By contrast, genes that were not expressed in these cell lines showed significant nucleosome density over the promoters and lack of ordering over gene bodies in cfDNA [12,35]. These observations strongly validated the lymphoid/myeloid origin of cfDNA in healthy humans.

Quantitative scores were developed based on these striking observations to connect nucleosome profiles to gene activity in the cfDNA tissue-of-origin. Snyder et al. showed that stronger periodicity of nucleosomes in the gene body (the region between the transcription start site (TSS) and TSS+5000 bp) correlated with higher gene expression in lymphoid/myeloid tissues for healthy donors [12]. However, in cfDNA from donors with cancer, the correlation of nucleosome periodicity at gene bodies with gene expression of lymphoid/myeloid tissues was much weaker, suggesting other cell types contributing to the cfDNA pool. This was confirmed by the fact that the correlation of periodicity with gene expression of other cell types increased for donors with cancer [12]. Thus, nucleosome periodicity could inform the gene expression of the cfDNA tissue(s)-of-origin.

Ulz et al. noted that overall nucleosome density was lower in 2 kb upstream and downstream of the TSS (which they termed ‘2 K-TSS') and lowest at the promoter itself (usually termed the ‘nucleosome depleted region', NDR) in expressed genes in both MNase-seq of a lymphoblastoid cell line and the cfDNA sequencing data from healthy donors [35]. They developed a model that used the nucleosome occupancy at 2 K-TSS and NDR to predict gene expression. In a person with cancer, tumour-contributed cfDNA would have a depletion of nucleosomes at active genes, but this depletion may be masked by high nucleosome occupancy in cfDNA from lymphoid/myeloid tissues. Ulz et al. circumvented this problem by focusing on regions in the genome that featured copy-number gains in cfDNA of donors with cancer. These genomic regions would have a higher representation in tumour cfDNA if the tumour was the source of these copy number gains. Their simulations suggested that at least 75% of cfDNA at a given TSS must be released from tumour cells to infer expression status using their method. In the regions of copy number gain, they demonstrated significant changes in nucleosome occupancy at 2 K-TSS and NDR that correlated with increased expression of these genes in the tumour as assessed by RNA-seq of matched tumour biopsy samples. Thus, promoter and gene-body depletion of cfDNA fragments are indicative of gene activity in the tissue-of-origin of cfDNA.

5. Subnucleosomes in cell-free DNA inform expression state of genes

Transcription also results in the formation of subnucleosomes proximal to the promoter and identification of subnucleosomes could serve as a proxy for measuring gene activity. In eukaryotic cells, transcription occurs on a chromatin template. Because RNA polymerase II (RNAPII) needs to unwind the DNA strands to make RNA, every protein-DNA contact in its path needs to be disrupted. In vitro, nucleosomes present a substantial barrier to transcription elongation [36,37], resulting in specific stalls by RNAPII at sites of strong histone-DNA contacts. In cells, we can map the positions where RNAPII stalls with base pair-resolution maps of the 3′ ends of nascent transcripts [38–41]. These maps have shown that the first nucleosome downstream of TSS (+1 nucleosome) presents a strong barrier to RNAPII in cells.

The effect of RNAPII stalling on the +1 nucleosome could be understood by mapping intermediate nucleosome states during transcription elongation. With sequencing library protocols that capture all fragment lengths combined with paired-end sequencing, the full spectrum of fragments generated by MNase treatment of nuclei can be uncovered [11,42–44]. Fragments between 50 and 147 bp are too short to be protected by a whole nucleosome, but too long to be TF footprints. These intermediate-length protections represent a discrete loss of contacts asymmetrically from either side of the nucleosome as it unwraps during transcription and remodelling (figure 1). Correlating a base-pair resolution map of RNAPII with the high-resolution distribution of nucleosomal intermediates at the +1 nucleosome revealed that nucleosome unwrapping occurs in a stepwise manner—first, the contacts to the H2A-H2B dimer proximal to the promoter are lost. Then as RNAPII elongates through the nucleosome, contacts to the H2A-H2B dimer distal to the promoter are lost [11]. Cryo-electron microscopy of unwrapped nucleosomes and of RNAPII transcribing nucleosome templates yielded structures that matched the in vivo structures inferred from paired-end sequencing [45–47]. These observations highlight the ability of genomic sequencing of short DNA fragments to detect transcription-dependent substructures of nucleosomes in cells.

cfDNA is highly nicked and nicked DNA is lost in standard double-stranded library preparation protocols. Inspired by methods used in Neanderthal genome sequencing projects, Snyder et al. used a single-stranded library protocol (SSP) that captures both nicked and non-nicked fragments [12,48]. Surprisingly, they found an abundance of fragments less than nucleosomal size, ranging from approximately 40 bp onwards. These short fragments resemble subnucleosomes observed in MNase sequencing data from Drosophile cells [11]. When the subnucleosomal cfDNA fragments were mapped at +1 nucleosome positions of genes expressed in lymphoid/myeloid tissues, the same asymmetric unwrapping intermediates that were seen in Drosophile cells could also be observed in the cfDNA data [11]. Thus, it seems that the long residence time of RNAPII near the +1 nucleosome results in long-lived nucleosomal intermediate states that are mappable both by MNase, and by the endogenous nucleases that give rise to cfDNA.

Dans Drosophile cells, it was found that the amount of the subnucleosomal particles relative to nucleosomal particles at the +1 nucleosome of a gene correlated with the extent to which that gene was transcribed [11]. Therefore, it was hypothesized that the amount of these intermediates relative to whole nucleosomes (subnucleosome enrichment) at the +1 nucleosome of genes in cfDNA would correlate with the composite expression profile of cells giving rise to cfDNA. Indeed, in a healthy donor, cfDNA subnucleosome enrichment correlated much better with expression profiles of lymphoid/myeloid tissue types compared to other tissue types. However, in donors with cancer, the subnucleosome enrichment corresponding to lymphoid/myeloid tissues weakened substantially, enabling robust differentiation of healthy and cancer plasma cfDNA [11]. Thus, subnucleosomes in cfDNA represent relics of transcription in cfDNA tissues-of-origin that can inform us about the transcriptional programmes active at disease sites.

6. Chromatin structure correlations across megabases

The observation that nucleosome dynamics are reflected by shorter protections in cfDNA can be extended to much larger length scales than single nucleosomes, which allows maximal use of low depth cfDNA sequencing data. Using a machine learning model, Cristiano et al. were able to observe similar ‘fragmentation profiles' at megabase scales between cfDNA from healthy donors and the DNA released by MNase treatment of healthy lymphocytes [49]. Fragmentation profile is a measure similar to subnucleosome enrichment: a ratio of small fragments (100–150 bp) to large cfDNA fragments (151–220 bp). A significant difference in fragmentation profiles was observed between cfDNA from healthy donors and donors with cancer, enabling detection of cancer with low-depth whole-genome cfDNA sequencing. This method works presumably because fragmentation profiles at large length scales differentiate active domains of the chromosome from inactive domains. A tumour is expected to have significantly different active chromatin domains at the megabase scale compared to lymphoid/myeloid tissues.

A similar hypothesis is that the strength of correlation of cfDNA length profiles between genomic loci is proportional to the correlation of contacts made by the loci to the rest of the chromosome [50,51]. The correlation matrix of contact probability for a cell type can be obtained by Hi-C [52]. The Hi-C method involves crosslinking cells, fragmenting the genome into large pieces with the crosslinks intact, and then ligating the cross-linked fragments. Sequencing of the ligated contacts reveals chromatin contacts genome-wide. Regions of the genome with similar activity share similar contact profiles across the chromosome. Liu et al. showed that the strength of correlation of healthy cfDNA length profiles between different genomic regions is proportional to the strength of correlation of Hi-C contacts between different genomic regions as measured in lymphoblastoid cells. Furthermore, this correlation of cfDNA length profiles between different regions of a chromosome could be modelled as a combination of Hi-C maps of different tissue types to uncover tissue contributions to cfDNA in tumour samples with high (greater than 30%) tumour fractions [50]. Thus, cfDNA profiles could be used to infer chromosome contacts in the tissue(s)-of-origin.

7. Distinct cell-free DNA patterns at transcription factor binding sites

TF binding sites at promoters, enhancers, and insulators show enrichment of short protections (less than 50 bp) and depletion of nucleosomes in MNase-seq experiments [11,42,43,53–55]. Binding of many TFs also results in the ordering of nucleosomes around the TF binding sites [56]. Thus, protected TF binding sites represent a discrete class of genomic loci that show distinctive chromatin structural profiles in nuclease-protection assays. The enrichment of short fragments in cfDNA using SSP enabled Snyder et al. to observe similar enrichment of short protections and ordered nucleosome arrays at TF binding sites in cfDNA datasets from healthy plasma. They also observed an enrichment of short fragments in cfDNA at promoters that was proportional to expression levels of a lymphoid cell line, demonstrating the ability to possibly identify transcriptional complexes at a promoter from cfDNA [12].

Ulz et al. found that mononucleosome depletion observed in cfDNA at known TF-binding sites (TFBSs) is a good proxy for inferring TF binding [57]. This enables inference of TF binding from cfDNA sequenced using standard double stranded protocols that do not enrich for short fragments. They selected a set of TFs which are lineage-specific, for example, Androgen Receptor (prostate), Even-Skipped Homeobox 2 (colon), Forkhead box A1 (breast), and for each of them, profiled 1000 binding sites that were concordant across tissue samples [58]. Using plasma from patients with prostate, breast, and colon cancer, they showed that nucleosome depletion levels at binding sites of tumour-specific TFs are significantly higher compared to healthy cohorts and the reverse was true at binding sites for haematopoietic lineage-specific TFs such as LYL1, and EVI1. In addition, they also showed that nucleosome depletion levels at specific TFBSs were predictive of tumour subtypes. For instance, they found a significant reduction in nucleosome depletion at Androgen Receptor-binding sites when comparing samples from before and after a patient's prostate adenocarcinoma became androgen-independent. Thus, TF binding can be inferred from cfDNA either directly through short fragment protections when using SSP or indirectly via nucleosome depletion at TFBSs when using standard double-stranded library protocols and tissue-specific TFBSs enable identification of tissues that contribute to cfDNA.

8. Cell-free DNA fragment length

As we have discussed above, cfDNA length reflects the structure of chromatin in cells of origin and can be explicitly modelled as such. Beyond trying to understand cfDNA profiles in terms of chromatin structure, there have been several useful observations about the use of cfDNA length in biomarker development, for which we can only speculate the underlying molecular details. At its most general, the size of cfDNA fragments is used to delineate between baseline homeostasis and other biological phenomena that give rise to cfDNA. cfDNA has already been directly applied in the clinic for pre-natal testing. In plasma, fetal cfDNA is shorter than maternal cfDNA [13,59,60], which enables detection of aneuploidy or recessive disorders in the fetus non-invasively. Urine cfDNA features short periodic fragments that resemble subnucleosomes [51]. In individuals with cancer, circulating tumour DNA resides in the shorter cfDNA fraction [61–63]. The frequency of shorter, non-tumour cfDNAs is typically low and thus size selection for shorter fragments could dramatically increase the sensitivity of detection for mutant tumour cfDNA. Mutation targeting and identification of copy number variation and/or single copy number alterations is achieved with a higher sensitivity if the shorter cfDNA fraction is profiled [61,62]. This is a consequence of mutant tumour cfDNA being diluted less with non-tumour cfDNA in the shorter fraction. In the light of these observations, one prediction is that shorter cfDNA is a product of a specific mechanism that occurs at a higher frequency in fetal cells, cells that give rise to cfDNA in urine, and cancer cells relative to normal lymphoid/myeloid cell turnover.

9. Cell-free DNA chromatin immunoprecipitation uses cell type-specific genome-wide patterns of histone modifications to identify tissues of origin

Several studies in the early 2000s used ELISA to capture and calculate the concentration of nucleosomes in plasma [20,22–24,64,65]. Specifically, nucleosomes were captured in an antibody ‘sandwich', which used an antibody for a histone and an antibody for double-stranded DNA. This approach was an alternative means to assess cell death using plasma from cancer patients. In a notable study, cancer patients exhibited a statistically significant increase in nucleosome concentration compared to healthy individuals [20]. These findings suggest that nucleosome concentration could act as a biomarker for a disease state and/or discriminate between individuals with disease and those who are healthy. However, this application lacks specific genomic information to identify the tissue-of-origin and specify the disease state.

Beyond differences in overall nucleosome concentrations among physiological states, an intriguing question is if post-translational modifications (PTMs) of nucleosomal histones in plasma can be used to differentiate healthy individuals and those with disease (figure 1). PTMs of nucleosomal histones and DNA differ in euchromatic regions versus heterochromatic regions [66,67]. PTMs range from small chemical groups to larger proteins, such as ubiquitin, that are added to specific amino acids of proteins. For example, tri-methylation of histone 3 lysine 27 (H3K27me3) or H3K9me3 are found at heterochromatic regions where gene activity is repressed or ‘silent'. By contrast, H3K4me3 or H3K36me3 are associated with euchromatic regions where genes are active [68,69].

The link between cancer and chromatin regulation is well documented [70]. The majority of oncogenic mutations occur in genes of chromatin modifiers [71–73], which include a number of tumour-suppressor genes, such as SIRT1 [74]. Genomic instability is a hallmark of cancer and a consequence of alterations in heterochromatin that disrupt silencing [75,76]. Deligezer et al. analysed histone PTMs on circulating nucleosomes in plasma [22]. In light of the evidence for deregulation of repressive PTMs associated with gene silencing in cancer, histone methylation, specifically H3K9me1, was first assessed on circulating nucleosomes from myeloma patient plasma samples. Follow-up papers identified a reduction in repressive chromatin marks (H3K9me3, H4K20me3 and H3K27me3) in patients with colorectal cancer and metastatic prostate cancer [22,23]. However, these studies did not use high-throughput sequencing technology that would provide information on the genomic locations of histone PTMs an aspect that is important to consider when delineating between different physiological states (i.e. disease and non-disease states) that produce changes in PTM levels in circulating nucleosomes.

A recent study sought to assess circulating post-translationally modified nucleosomes in a variety of physiological states using a combination of ChIP and next-generation sequencing [21]. The authors created a workflow to isolate modified circulating nucleosomes from plasma and performed high-throughput sequencing of the associated DNA (cfChIP-seq). Modified nucleosomes containing PTMs associated with active genes or cis-regulatory elements (i.e. enhancers) were specifically targeted: H3K4me1/2/3 and H3K36me3. H3K4me3 cfChIP-seq signal was used as a proxy for active genes and recapitulated earlier findings that cell-type specific gene activation programmes belonged to mainly blood lineages in a healthy individual. Furthermore, the cfChIP-seq signals reflected previously identified ChIP-seq signals for PTMs in these lineages.

This analysis was extended to profile patients with a variety of physiological insults, including surgery and cancer. cfChIP-seq detected differences in gene expression in individuals with cancer compared to healthy individuals. In response to surgical interventions, changes in tissue-specific cfChIP-signatures were detectable in the blood of patients supporting tissue-of-origin specificity. Combinations of PTMs were also assessed for complementary information to further profile tissue-type specific gene activity from non-coding regions. The authors observed changes in H3K4me2 (found at putative enhancer elements) and H3K36me3 (found within the body of transcribed genes) that correlated with differential gene activity unique to cancer tumours. Overall, the ability to identify the tissue-of-origin based on enrichment of circulating nucleosome PTMs associated with transcription at specific regions of the genome is exciting. cfChIP-sequencing provides an additional layer of information about an individual's underlying physiological state derived from the blood.

10. Cell-free DNA methylation patterns identify tissues of origin

Methylation of cytosines in the CpG dinucleotide context is associated with cellular identity [77] and can be identified on cfDNA [78,79]. Deamination of cytosine to uracil using sodium bisulfite or using an antibody specific to CpG methylation to pulldown methylated DNA are the two main methods used to map CpG methylation genome wide. Often promoter hypermethylation of a gene is associated with silencing [79]. DNA methylation profiles are stable and cell-type specific, and differentially methylated regions (DMRs) have been extensively used in quantification of subpopulations in DNA extracted from heterogeneous cell populations [80,81]. Accomando et al. showed that cell-types in leucocytes can be quantified using methylation status at as few as 20 CpG loci [82]. Many genomic locations exhibit highly cell-type specific DNA methylation, which has been instrumental in developing computational methods to delineate the contribution of tissues to cfDNA. CpG islands, a region 300–3000 bp in length and rich in G + C content, are usually hypomethylated, but aberrant methylation of these regions is associated with diseases like cancer [83]. Some CpG islands share high methylation levels across tumour types, while others are tumour specific [84]. Promoter hypermethylation of tumour suppressor genes is especially a striking feature of tumours particularly during carcinogenesis [85,86]. Targeted amplification of candidate promoter regions has been used to find that cfDNA from cancer patients exhibit hypermethylation in contrast to healthy donors [87–89]. Using methylated DNA immunoprecipitation (MeDIP-seq) optimized for low DNA amounts, Shen et al. detected numerous DMRs in cfDNA from individuals with cancer that are specific to tumour tissue-of-origin [90]. In particular, they showed that plasma DMRs in individuals with colorectal cancer closely matched solid tumour-derived DMRs. Thus, tissue-specific methylation patterns and hypermethylation of tumour suppressor genes can be used as signatures to detect cancer as well as identify cfDNA tissue(s)-of-origin [91].

11. Conclusion/future perspectives

The remarkable observation in 1970 that hinted at a relationship between cytoplasmic DNA and the chromatin structure of the cell-of-origin now underlies the conceptual paradigm of cfDNA epigenomics [18]. As there is an increasing awareness of the limitations associated with detecting and identifying diseases, such as cancer, solely based on mutant genotypes, the emergence of cfDNA approaches based on epigenomics provides a valuable alternative (figure 2). Chromatin remodellers, chromatin-modifying complexes and DNA methyltransferases are frequently dysregulated in cancer highlighting the relationship between chromatin regulation and oncogenesis [92–97]. Furthermore, simulations show that using hundreds of features throughout the genome (which would be the case for epigenomic features) improves the limit of detection of disease states from cfDNA compared to a few features (which would be the case when looking for tumour mutations) [49,90]. Combining epigenomic assessments with mutation-based targeting may better guide personalized treatment of cancer patients rather than solely relying on one method.

Figure 2. Clinical applications for cancer patients using epigenomic features of cell-free DNA.

Early detection of cancer still remains a challenge for all cfDNA-based methods. An early cancer diagnosis increases a patient's chance for curative treatment. However, tumour shedding of DNA into the blood is at a lower concentration in early stages than what is observed in advanced cancer stages. Most methods described above have been used on samples of advanced cancer patients indicating a much-needed effort to examine their use and sensitivity for early detection. However, significant in-roads are being made. A recent multi-centre, randomized study used cfDNA methylation analysis to prospectively assess the largest cohort (m = 6689, 4207 healthy and 2482 cancer) to date for early detection and localization of more than 50 types of cancers [91]. With 99.3% specificity, the sensitivity increased as cancer stage increased (Stage I: 18%—Stage IV: 93%), with tissue-of-origin predicting cancer in 96% of samples with an accuracy of 93%. These are promising results for the future development of a cancer screening test for the general population. With improvements over time, cfDNA epigenomic methods described in this review can be combined with current clinical practices to improve detection of cancer in patients.

Obtaining molecular signatures of cancer based on epigenomic features highlights the variety of information contained in the blood of an individual. The studies we reviewed here represent an orthogonal network of disease-specific epigenomic information that is rich for exploitation. Combined with current clinical molecular diagnostics, the timely emergence of epigenomic cfDNA methods herald a chance to revolutionize disease management, specifically cancer. One can envision the successful implementation of these approaches to help guide personalized medicine at different stages of disease beginning with diagnosis and throughout the course of treatment. Beyond biomarkers, diverse epigenomic cfDNA methodologies also provide the opportunity to directly investigate the molecular mechanisms underlying pathology in humans.


Voir la vidéo: Étapes de lextraction dADN et PCR (Décembre 2021).