Informations

Niveau d'expression du facteur de transcription


Quelqu'un pourrait-il m'expliquer en détail ce que l'on entend par "NIVEAU d'expression TF", que représente-t-il et comment est-il mesuré? Ceci est par exemple utilisé dans la figure 3 de cet article : Un recensement des facteurs de transcription humains : fonction, expression et évolution.


Les facteurs de transcription sont un mécanisme de régulation cellulaire important pour contrôler l'expression des gènes. L'expression de TF est importante pour la fonction cellulaire, la différenciation et également pour les réponses aux signaux environnementaux.

Nous connaissons un certain nombre de TF différents, mais seulement pour une petite partie d'entre eux leur fonction exacte (en termes de quels tissus ils sont exprimés, quand et quels gènes ils régulent) et c'est là qu'intervient l'article que vous lisez.

Ils testent l'expression d'environ 1400 TF dans un certain nombre de tissus différents, pour voir où ils sont exprimés (figure 3 de l'article) :

Le groupe a utilisé des puces à ADN pour analyser les niveaux d'expression (dans ce cas, quelle quantité de transcrit des gènes est produite en supposant que cela s'est également traduit). La quantification a été effectuée en utilisant la force du signal de la matrice - plus vous avez de transcription, plus le signal est fort.

L'expression d'un certain TF dans un tissu spécifique montre son implication dans la régulation des gènes (directe ou indirecte) là-bas.


2.10 : Régulation de l'expression génique

La réglementation est une question de prise de décision. La régulation des gènes consiste donc à comprendre comment les cellules prennent des décisions sur les gènes à activer, désactiver ou régler ou réduire. Dans la section suivante, nous discutons de certains des mécanismes et principes fondamentaux utilisés par les cellules pour réguler l'expression des gènes en réponse à des changements de facteurs cellulaires ou externes. Cette biologie est importante pour comprendre comment les cellules ajustent les environnements changeants, y compris comment certaines cellules, dans les organismes multicellulaires, décident de se spécialiser pour certaines fonctions (par exemple les tissus).

Étant donné que le sujet de la réglementation est à la fois un sujet d'étude très profond et vaste en biologie, dans Bis2a, nous n'essayons pas de couvrir tous les détails - il y en a tout simplement trop. Au lieu de cela, comme nous l'avons fait pour tous les autres sujets, nous essayons de nous concentrer sur (a) la description de certaines des constructions logiques de base et des questions que vous devez avoir lorsque vous abordez N'IMPORTE QUEL scénario impliquant une réglementation, (b) l'apprentissage d'un vocabulaire commun et de mécanismes omniprésents et (c) examiner quelques exemples concrets qui illustrent les points soulevés en a et b.


Technologies de biologie synthétique pour la génération de cellules bêta

ARN messagers synthétiques

Les ARN messagers synthétiques (Syn-ARNm) sont les outils les plus robustes et les plus efficaces pour générer des iPSC à partir de cellules somatiques et surpassent les méthodes alternatives de reprogrammation intégrative et non intégrative basées sur l'ADN. 97 Récemment, ils ont été utilisés pour différencier les cellules canalaires pancréatiques humaines en cellules sécrétant de l'insuline sensibles au glucose. 98 Corritore et al. 98 ont démontré que la transfection d'ARNm synthétique codant pour le facteur de transcription MafA seul peut reprogrammer les cellules canalaires pancréatiques adultes en cellules sécrétrices d'insuline. Cependant, des cellules co-exprimant l'insuline et la somatostatine ont également été générées et la sécrétion d'insuline sensible au glucose n'était pas optimale. 98 Le dosage et le moment de l'expression du facteur de transcription peuvent être contrôlés en utilisant des ARN synthétiques, qui peuvent aider à différencier les cellules bêta des types cellulaires étroitement apparentés ainsi que des PSC.

Curieusement, la technologie basée sur l'ARNm synthétique a également été utilisée pour trier et enrichir efficacement les types de cellules souhaités, y compris les cellules de type bêta pancréatiques, in vitro. 99 Miki et al. 99 ont développé un système de purification de commutateur basé sur l'ARNm synthétique utilisant des microARN (miARN) qui pourraient trier une population différenciée hétérogène dérivée d'iPSC en une population homogène (Fig. 3 B). En particulier, les auteurs ont développé un commutateur basé sur l'ARNm pour le miARN-375 et ont pu trier exclusivement les cellules productrices d'insuline dérivées des iPSC. Par conséquent, les ARNm syn détiennent un potentiel énorme pour contrôler les décisions critiques en matière de destin cellulaire et pour la purification des types cellulaires souhaités à partir d'une population hétérogène dérivée d'iPSC.


Contenu

Les facteurs de transcription sont essentiels à la régulation de l'expression des gènes et sont, par conséquent, présents dans tous les organismes vivants. Le nombre de facteurs de transcription trouvés dans un organisme augmente avec la taille du génome, et les génomes plus grands ont tendance à avoir plus de facteurs de transcription par gène. [12]

Il y a environ 2 800 protéines dans le génome humain qui contiennent des domaines de liaison à l'ADN, et 1 600 d'entre elles sont supposées fonctionner comme des facteurs de transcription, [3] bien que d'autres études indiquent qu'il s'agit d'un nombre plus petit. [13] Par conséquent, environ 10 % des gènes du génome codent pour des facteurs de transcription, ce qui fait de cette famille la plus grande famille de protéines humaines. De plus, les gènes sont souvent flanqués de plusieurs sites de liaison pour des facteurs de transcription distincts, et une expression efficace de chacun de ces gènes nécessite l'action coopérative de plusieurs facteurs de transcription différents (voir, par exemple, les facteurs nucléaires des hépatocytes). Par conséquent, l'utilisation combinatoire d'un sous-ensemble des quelque 2000 facteurs de transcription humains explique facilement la régulation unique de chaque gène dans le génome humain au cours du développement. [11]

Les facteurs de transcription se lient aux régions amplificatrices ou promotrices de l'ADN adjacentes aux gènes qu'ils régulent. Selon le facteur de transcription, la transcription du gène adjacent est régulée à la hausse ou à la baisse. Les facteurs de transcription utilisent une variété de mécanismes pour la régulation de l'expression des gènes. [14] Ces mécanismes comprennent :

  • stabiliser ou bloquer la liaison de l'ARN polymérase à l'ADN
  • catalyser l'acétylation ou la désacétylation des protéines histones. Le facteur de transcription peut le faire directement ou recruter d'autres protéines avec cette activité catalytique. De nombreux facteurs de transcription utilisent l'un ou l'autre de deux mécanismes opposés pour réguler la transcription : [15]
      activité (HAT) - acétyle les protéines histones, ce qui affaiblit l'association de l'ADN avec les histones, ce qui rend l'ADN plus accessible à la transcription, régulant ainsi à la hausse l'activité de transcription (HDAC) - désacétyle les protéines histones, ce qui renforce l'association de l'ADN avec les histones, qui rendent l'ADN moins accessible à la transcription, régulant ainsi à la baisse la transcription
  • Les facteurs de transcription sont l'un des groupes de protéines qui lisent et interprètent le "plan" génétique dans l'ADN. Ils se lient à l'ADN et aident à lancer un programme d'augmentation ou de diminution de la transcription des gènes. En tant que tels, ils sont vitaux pour de nombreux processus cellulaires importants. Vous trouverez ci-dessous certaines des fonctions importantes et des rôles biologiques dans lesquels les facteurs de transcription sont impliqués :

    Régulation de la transcription basale Modifier

    Chez les eucaryotes, une classe importante de facteurs de transcription appelés facteurs de transcription généraux (GTF) est nécessaire pour que la transcription se produise. [17] [18] [19] Beaucoup de ces GTF ne se lient pas réellement à l'ADN, mais font plutôt partie du grand complexe de pré-initiation de la transcription qui interagit directement avec l'ARN polymérase. Les GTF les plus courants sont TFIIA, TFIIB, TFIID (voir aussi TATA binding protein), TFIIE, TFIIF et TFIIH. [20] Le complexe de pré-initiation se lie aux régions promotrices de l'ADN en amont du gène qu'ils régulent.

    Amélioration différentielle de la transcription Modifier

    D'autres facteurs de transcription régulent différemment l'expression de divers gènes en se liant à des régions amplificatrices de l'ADN adjacentes aux gènes régulés. Ces facteurs de transcription sont essentiels pour s'assurer que les gènes sont exprimés dans la bonne cellule au bon moment et dans la bonne quantité, en fonction des besoins changeants de l'organisme.

    Développement Modifier

    De nombreux facteurs de transcription dans les organismes multicellulaires sont impliqués dans le développement. [21] En réponse aux stimuli, ces facteurs de transcription activent/désactivent la transcription des gènes appropriés, ce qui, à son tour, permet des changements dans la morphologie cellulaire ou les activités nécessaires à la détermination du destin cellulaire et à la différenciation cellulaire. La famille des facteurs de transcription Hox, par exemple, est importante pour la formation d'un modèle corporel approprié dans des organismes aussi divers que les mouches des fruits chez l'homme. [22] [23] Un autre exemple est le facteur de transcription codé par le gène de la région déterminant le sexe Y (SRY), qui joue un rôle majeur dans la détermination du sexe chez l'homme. [24]

    Réponse aux signaux intercellulaires Modifier

    Les cellules peuvent communiquer entre elles en libérant des molécules qui produisent des cascades de signalisation au sein d'une autre cellule réceptive. Si le signal nécessite une régulation positive ou négative des gènes dans la cellule réceptrice, les facteurs de transcription seront souvent en aval dans la cascade de signalisation. [25] La signalisation des œstrogènes est un exemple de cascade de signalisation assez courte qui implique le facteur de transcription du récepteur des œstrogènes : les œstrogènes sont sécrétés par des tissus tels que les ovaires et le placenta, traversent la membrane cellulaire de la cellule receveuse et sont liés par le récepteur des œstrogènes. dans le cytoplasme de la cellule. Le récepteur des œstrogènes va ensuite au noyau de la cellule et se lie à ses sites de liaison à l'ADN, modifiant ainsi la régulation transcriptionnelle des gènes associés. [26]

    Réponse à l'environnement Modifier

    Non seulement les facteurs de transcription agissent en aval des cascades de signalisation liées aux stimuli biologiques, mais ils peuvent également être en aval des cascades de signalisation impliquées dans les stimuli environnementaux. Les exemples incluent le facteur de choc thermique (HSF), qui régule à la hausse les gènes nécessaires à la survie à des températures plus élevées, [27] le facteur inductible par l'hypoxie (HIF), qui régule à la hausse les gènes nécessaires à la survie des cellules dans des environnements à faible teneur en oxygène, [28] et la liaison aux éléments régulateurs des stérols (SREBP), qui aide à maintenir des niveaux de lipides appropriés dans la cellule. [29]

    Contrôle du cycle cellulaire Modifier

    De nombreux facteurs de transcription, en particulier certains proto-oncogènes ou suppresseurs de tumeurs, aident à réguler le cycle cellulaire et, en tant que tels, déterminent la taille d'une cellule et le moment où elle peut se diviser en deux cellules filles. [30] [31] Un exemple est l'oncogène Myc, qui a des rôles importants dans la croissance cellulaire et l'apoptose. [32]

    Pathogenèse Modifier

    Les facteurs de transcription peuvent également être utilisés pour modifier l'expression des gènes dans une cellule hôte afin de promouvoir la pathogenèse. Un exemple bien étudié de ceci sont les effecteurs de type activateur de transcription (effecteurs TAL) sécrétés par la bactérie Xanthomonas. Lorsqu'elles sont injectées dans des plantes, ces protéines peuvent pénétrer dans le noyau de la cellule végétale, se lier aux séquences de promoteurs végétaux et activer la transcription des gènes végétaux qui contribuent à l'infection bactérienne. [33] Les effecteurs TAL contiennent une région de répétition centrale dans laquelle il existe une relation simple entre l'identité de deux résidus critiques dans les répétitions séquentielles et les bases d'ADN séquentielles dans le site cible de l'effecteur TAL. [34] [35] Cette propriété facilite vraisemblablement l'évolution de ces protéines afin de mieux rivaliser avec les mécanismes de défense de la cellule hôte. [36]

    Il est courant en biologie que des processus importants aient plusieurs niveaux de régulation et de contrôle. Ceci est également vrai avec les facteurs de transcription : non seulement les facteurs de transcription contrôlent les taux de transcription pour réguler les quantités de produits géniques (ARN et protéines) disponibles pour la cellule, mais les facteurs de transcription eux-mêmes sont régulés (souvent par d'autres facteurs de transcription). Vous trouverez ci-dessous un bref résumé de certaines des manières dont l'activité des facteurs de transcription peut être régulée :

    Synthèse Modifier

    Les facteurs de transcription (comme toutes les protéines) sont transcrits à partir d'un gène sur un chromosome en ARN, puis l'ARN est traduit en protéine. Chacune de ces étapes peut être régulée pour affecter la production (et donc l'activité) d'un facteur de transcription. Une implication de ceci est que les facteurs de transcription peuvent s'autoréguler. Par exemple, dans une boucle de rétroaction négative, le facteur de transcription agit comme son propre répresseur : si la protéine du facteur de transcription se lie à l'ADN de son propre gène, elle régule à la baisse la production d'une plus grande partie d'elle-même. Il s'agit d'un mécanisme permettant de maintenir de faibles niveaux d'un facteur de transcription dans une cellule. [37]

    Localisation nucléaire Modifier

    Chez les eucaryotes, les facteurs de transcription (comme la plupart des protéines) sont transcrits dans le noyau mais sont ensuite traduits dans le cytoplasme de la cellule. De nombreuses protéines actives dans le noyau contiennent des signaux de localisation nucléaire qui les dirigent vers le noyau. Mais, pour de nombreux facteurs de transcription, c'est un point clé de leur régulation. [38] Des classes importantes de facteurs de transcription tels que certains récepteurs nucléaires doivent d'abord lier un ligand alors qu'ils se trouvent dans le cytoplasme avant de pouvoir se déplacer vers le noyau. [38]

    Activation Modifier

    Les facteurs de transcription peuvent être activés (ou désactivés) par leur domaine de détection de signal par un certain nombre de mécanismes, notamment :

      liaison - Non seulement la liaison au ligand peut influencer l'emplacement d'un facteur de transcription dans une cellule, mais la liaison au ligand peut également affecter si le facteur de transcription est dans un état actif et capable de se lier à l'ADN ou à d'autres cofacteurs (voir, par exemple, les récepteurs nucléaires ). [39][40] – De nombreux facteurs de transcription tels que les protéines STAT doivent être phosphorylés avant de pouvoir se lier à l'ADN.
    • interaction avec d'autres facteurs de transcription (par exemple., homo- ou hétéro-dimérisation) ou protéines corégulatrices

    Accessibilité du site de liaison à l'ADN Modifier

    Chez les eucaryotes, l'ADN est organisé à l'aide d'histones en particules compactes appelées nucléosomes, où des séquences d'environ 147 paires de bases d'ADN font

    1,65 tourne autour des octamères de protéines d'histone. L'ADN dans les nucléosomes est inaccessible à de nombreux facteurs de transcription. Certains facteurs de transcription, appelés facteurs pionniers, sont encore capables de lier leurs sites de liaison à l'ADN sur l'ADN nucléosomique. Pour la plupart des autres facteurs de transcription, le nucléosome doit être activement déroulé par des moteurs moléculaires tels que les remodeleurs de la chromatine. [41] Alternativement, le nucléosome peut être partiellement déroulé par des fluctuations thermiques, permettant un accès temporaire au site de liaison du facteur de transcription. Dans de nombreux cas, un facteur de transcription doit entrer en compétition pour se lier à son site de liaison à l'ADN avec d'autres facteurs de transcription et des histones ou des protéines de chromatine non histones. [42] Des paires de facteurs de transcription et d'autres protéines peuvent jouer des rôles antagonistes (activateur versus répresseur) dans la régulation d'un même gène.

    Disponibilité d'autres cofacteurs/facteurs de transcription Modifier

    La plupart des facteurs de transcription ne fonctionnent pas seuls. De nombreuses grandes familles de TF forment des interactions homotypiques ou hétérotypiques complexes par dimérisation. [43] Pour que la transcription des gènes se produise, un certain nombre de facteurs de transcription doivent se lier aux séquences régulatrices de l'ADN. Cette collection de facteurs de transcription, à son tour, recrute des protéines intermédiaires telles que des cofacteurs qui permettent un recrutement efficace du complexe de pré-initiation et de l'ARN polymérase. Ainsi, pour qu'un seul facteur de transcription initie la transcription, toutes ces autres protéines doivent également être présentes, et le facteur de transcription doit être dans un état où il peut s'y lier si nécessaire. Les cofacteurs sont des protéines qui modulent les effets des facteurs de transcription. Les cofacteurs sont interchangeables entre des promoteurs de gènes spécifiques, le complexe protéique qui occupe l'ADN du promoteur et la séquence d'acides aminés du cofacteur déterminent sa conformation spatiale. Par exemple, certains récepteurs stéroïdiens peuvent échanger des cofacteurs avec NF-κB, qui est un commutateur entre l'inflammation et la différenciation cellulaire, de sorte que les stéroïdes peuvent affecter la réponse inflammatoire et la fonction de certains tissus. [44]

    Interaction avec la cytosine méthylée Modifier

    Les facteurs de transcription et les cytosines méthylées dans l'ADN ont tous deux un rôle majeur dans la régulation de l'expression des gènes. (La méthylation de la cytosine dans l'ADN se produit principalement lorsque la cytosine est suivie par la guanine dans la séquence d'ADN 5' à 3', un site CpG.) La méthylation des sites CpG dans une région promotrice d'un gène réprime généralement la transcription du gène, [45] tandis que la méthylation de CpG dans le corps d'un gène augmente l'expression. [46] Les enzymes TET jouent un rôle central dans la déméthylation des cytosines méthylées. La déméthylation des CpG dans un promoteur de gène par l'activité enzymatique TET augmente la transcription du gène. [47]

    Les sites de liaison à l'ADN de 519 facteurs de transcription ont été évalués. [48] ​​Parmi ceux-ci, 169 facteurs de transcription (33 %) n'avaient pas de dinucléotides CpG dans leurs sites de liaison, et 33 facteurs de transcription (6 %) pouvaient se lier à un motif contenant des CpG mais n'affichaient pas de préférence pour un site de liaison avec soit un CpG méthylé ou non méthylé. Il y avait 117 facteurs de transcription (23 %) qui étaient inhibés de se lier à leur séquence de liaison s'il contenait un site CpG méthylé, 175 facteurs de transcription (34 %) qui avaient une liaison améliorée si leur séquence de liaison avait un site CpG méthylé, et 25 facteurs de transcription les facteurs (5 %) étaient soit inhibés, soit avaient une liaison améliorée selon l'endroit dans la séquence de liaison où se trouvait le CpG méthylé.

    Les enzymes TET ne se lient pas spécifiquement à la méthylcytosine, sauf lorsqu'elles sont recrutées (voir déméthylation de l'ADN). Il a été démontré que plusieurs facteurs de transcription importants dans la différenciation cellulaire et la spécification de la lignée, notamment NANOG, SALL4A, WT1, EBF1, PU.1 et E2A, recrutent des enzymes TET dans des loci génomiques spécifiques (principalement des activateurs) pour agir sur la méthylcytosine (mC) et le convertir en hydroxyméthylcytosine hmC (et dans la plupart des cas les marquer pour une déméthylation complète ultérieure en cytosine). [49] La conversion médiée par TET de mC en hmC semble perturber la liaison des protéines de liaison 5mC, y compris les protéines MECP2 et MBD (domaine de liaison au méthyle-CpG), facilitant le remodelage des nucléosomes et la liaison des facteurs de transcription, activant ainsi la transcription de ceux-ci. gènes. EGR1 est un facteur de transcription important dans la formation de la mémoire. Il a un rôle essentiel dans la reprogrammation épigénétique des neurones du cerveau. Le facteur de transcription EGR1 recrute la protéine TET1 qui initie une voie de déméthylation de l'ADN. [50] EGR1, avec TET1, est utilisé dans la programmation de la distribution des sites de méthylation sur l'ADN du cerveau pendant le développement du cerveau et dans l'apprentissage (voir Epigénétique dans l'apprentissage et la mémoire).

    Les facteurs de transcription sont de structure modulaire et contiennent les domaines suivants : [1]

    • domaine de liaison à l'ADN (DBD), qui se fixe à des séquences spécifiques d'ADN (amplificateur ou promoteur. Composant nécessaire pour tous les vecteurs. Utilisé pour piloter la transcription des séquences promotrices du transgène du vecteur) adjacentes aux gènes régulés. Les séquences d'ADN qui se lient aux facteurs de transcription sont souvent appelées éléments de réponse.
    • Domaine d'activation (UN D), qui contient des sites de liaison pour d'autres protéines telles que les corégulateurs de transcription. Ces sites de liaison sont souvent appelés fonctions d'activation (AF), Domaine de transactivation (TAD) ou Domaine transactivantTAD mais ne se mélange pas avec le domaine associant topologiquement TAD. [51]
    • Un facultatif domaine de détection de signal (SSD) (par exemple., un domaine de liaison au ligand), qui détecte les signaux externes et, en réponse, transmet ces signaux au reste du complexe de transcription, entraînant une régulation à la hausse ou à la baisse de l'expression génique. De plus, les domaines DBD et de détection de signal peuvent résider sur des protéines distinctes qui s'associent au sein du complexe de transcription pour réguler l'expression des gènes.

    Domaine de liaison à l'ADN Modifier

    La partie (domaine) du facteur de transcription qui lie l'ADN est appelée son domaine de liaison à l'ADN. Vous trouverez ci-dessous une liste partielle de certaines des grandes familles de domaines de liaison à l'ADN/facteurs de transcription :

    Famille InterPro Pfam SCOP
    hélice-boucle-hélice de base [52] InterPro : IPR001092 Pfam PF00010 SCOP 47460
    fermeture éclair basique-leucine (bZIP) [53] InterPro : IPR004827 Pfam PF00170 SCOP 57959
    Domaine effecteur C-terminal des régulateurs de réponse bipartite InterPro : IPR001789 Pfam PF00072 SCOP 46894
    Boîtier AP2/ERF/GCC InterPro : IPR001471 Pfam PF00847 SCOP 54176
    hélice-tour-hélice [54]
    Les protéines homéodomaines, qui sont codées par des gènes homéoboîtes, sont des facteurs de transcription. Les protéines homéodomaines jouent un rôle essentiel dans la régulation du développement. [55] [56] InterPro : IPR009057 Pfam PF00046 SCOP 46689
    de type répresseur lambda InterPro : IPR010982 SCOP 47413
    srf-like (facteur de réponse sérique) InterPro : IPR002100 Pfam PF00319 SCOP 55455
    boîte appariée [57]
    hélice ailée InterPro : IPR013196 Pfam PF08279 SCOP 46785
    doigts de zinc [58]
    * Cys multi-domaines2Le sien2 doigts de zinc [59] InterPro : IPR007087 Pfam PF00096 SCOP 57667
    * Zn2/Cys6 SCOP 57701
    * Zn2/Cys8 doigt de zinc du récepteur nucléaire InterPro : IPR001628 Pfam PF00105 SCOP 57716

    Éléments de réponse Modifier

    La séquence d'ADN à laquelle se lie un facteur de transcription est appelée site de liaison au facteur de transcription ou élément de réponse. [60]

    Les facteurs de transcription interagissent avec leurs sites de liaison en utilisant une combinaison de forces électrostatiques (dont les liaisons hydrogène sont un cas particulier) et de forces de Van der Waals. En raison de la nature de ces interactions chimiques, la plupart des facteurs de transcription se lient à l'ADN d'une manière spécifique à la séquence. Cependant, toutes les bases du site de liaison au facteur de transcription ne peuvent pas réellement interagir avec le facteur de transcription. De plus, certaines de ces interactions peuvent être plus faibles que d'autres. Ainsi, les facteurs de transcription ne se lient pas à une seule séquence mais sont capables de lier un sous-ensemble de séquences étroitement liées, chacune avec une force d'interaction différente.

    Par exemple, bien que le site de liaison consensus pour la protéine de liaison à TATA (TBP) soit TATAAAA, le facteur de transcription TBP peut également lier des séquences similaires telles que TATATAT ou TATATAA.

    Étant donné que les facteurs de transcription peuvent se lier à un ensemble de séquences apparentées et que ces séquences ont tendance à être courtes, des sites potentiels de liaison aux facteurs de transcription peuvent apparaître par hasard si la séquence d'ADN est suffisamment longue. Il est cependant peu probable qu'un facteur de transcription se lie à toutes les séquences compatibles dans le génome de la cellule. D'autres contraintes, telles que l'accessibilité de l'ADN dans la cellule ou la disponibilité de cofacteurs, peuvent également aider à dicter où un facteur de transcription se liera réellement. Ainsi, étant donné la séquence du génome, il est encore difficile de prédire où un facteur de transcription se liera réellement dans une cellule vivante.

    Une spécificité de reconnaissance supplémentaire, cependant, peut être obtenue par l'utilisation de plus d'un domaine de liaison à l'ADN (par exemple des DBD en tandem dans le même facteur de transcription ou par la dimérisation de deux facteurs de transcription) qui se lient à deux ou plusieurs séquences adjacentes d'ADN.

    Les facteurs de transcription ont une importance clinique pour au moins deux raisons : (1) les mutations peuvent être associées à des maladies spécifiques, et (2) elles peuvent être la cible de médicaments.

    Troubles Modifier

    En raison de leurs rôles importants dans le développement, la signalisation intercellulaire et le cycle cellulaire, certaines maladies humaines ont été associées à des mutations des facteurs de transcription. [61]

    De nombreux facteurs de transcription sont soit des suppresseurs de tumeurs, soit des oncogènes, et, par conséquent, des mutations ou une régulation aberrante de ceux-ci sont associés au cancer. Trois groupes de facteurs de transcription sont connus pour être importants dans le cancer humain : (1) les familles NF-kappaB et AP-1, (2) la famille STAT et (3) les récepteurs stéroïdes. [62]

    Vous trouverez ci-dessous quelques-uns des exemples les mieux étudiés :

    État La description Lieu
    syndrome de Rett Des mutations du facteur de transcription MECP2 sont associées au syndrome de Rett, un trouble neurodéveloppemental. [63] [64] Xq28
    Diabète Une forme rare de diabète appelée MODY (Maturity onset diabetes of the young) peut être causée par des mutations des facteurs nucléaires des hépatocytes (HNF) [65] ou du facteur 1 du promoteur de l'insuline (IPF1/Pdx1). [66] plusieurs
    Dyspraxie verbale développementale Des mutations du facteur de transcription FOXP2 sont associées à une dyspraxie verbale développementale, une maladie dans laquelle les individus sont incapables de produire les mouvements finement coordonnés nécessaires à la parole. [67] 7q31
    Maladies auto-immunes Des mutations du facteur de transcription FOXP3 provoquent une forme rare de maladie auto-immune appelée IPEX. [68] Xp11.23-q13.3
    Syndrome de Li-Fraumeni Causée par des mutations dans le suppresseur de tumeur p53. [69] 17p13.1
    Cancer du sein La famille STAT est pertinente pour le cancer du sein. [70] plusieurs
    Cancers multiples La famille HOX est impliquée dans une variété de cancers. [71] plusieurs
    Arthrose Mutation ou activité réduite de SOX9 [72]

    Cibles potentielles de médicaments Modifier

    Environ 10 % des médicaments actuellement prescrits ciblent directement la classe des récepteurs nucléaires des facteurs de transcription. [73] Les exemples incluent le tamoxifène et le bicalutamide pour le traitement du cancer du sein et de la prostate, respectivement, et divers types de stéroïdes anti-inflammatoires et anabolisants. [74] De plus, les facteurs de transcription sont souvent indirectement modulés par les médicaments via des cascades de signalisation. Il pourrait être possible de cibler directement d'autres facteurs de transcription moins explorés tels que NF-κB avec des médicaments. [75] [76] [77] [78] Les facteurs de transcription en dehors de la famille des récepteurs nucléaires sont considérés comme plus difficiles à cibler avec des thérapies à petites molécules car il n'est pas clair qu'ils soient « médicamenteux » mais des progrès ont été réalisés sur Pax2 [ 79] [80] et la voie de l'encoche. [81]

    Les duplications de gènes ont joué un rôle crucial dans l'évolution des espèces. Ceci s'applique en particulier aux facteurs de transcription. Une fois qu'elles se produisent sous forme de doublons, les mutations accumulées codant pour une copie peuvent avoir lieu sans affecter négativement la régulation des cibles en aval. Cependant, des changements dans les spécificités de liaison à l'ADN du facteur de transcription LEAFY à copie unique, qui se produisent dans la plupart des plantes terrestres, ont été récemment élucidés. À cet égard, un facteur de transcription à copie unique peut subir un changement de spécificité par l'intermédiaire d'un intermédiaire proche sans perdre sa fonction. Des mécanismes similaires ont été proposés dans le cadre de toutes les hypothèses phylogénétiques alternatives et du rôle des facteurs de transcription dans l'évolution de toutes les espèces. [82] [83]

    Il existe différentes technologies pour analyser les facteurs de transcription. Au niveau génomique, le séquençage de l'ADN [84] et la recherche de bases de données sont couramment utilisés [85] La version protéique du facteur de transcription est détectable en utilisant des anticorps spécifiques. L'échantillon est détecté sur un western blot. En utilisant le test de déplacement de mobilité électrophorétique (EMSA), [86] le profil d'activation des facteurs de transcription peut être détecté. Une approche multiplex pour le profilage d'activation est un système de puce TF où plusieurs facteurs de transcription différents peuvent être détectés en parallèle.

    La méthode la plus couramment utilisée pour identifier les sites de liaison des facteurs de transcription est l'immunoprécipitation de la chromatine (ChIP). [87] Cette technique repose sur la fixation chimique de la chromatine avec du formaldéhyde, suivie de la co-précipitation de l'ADN et du facteur de transcription d'intérêt à l'aide d'un anticorps qui cible spécifiquement cette protéine. Les séquences d'ADN peuvent ensuite être identifiées par microarray ou séquençage à haut débit (ChIP-seq) pour déterminer les sites de liaison des facteurs de transcription. Si aucun anticorps n'est disponible pour la protéine d'intérêt, DamID peut être une alternative pratique. [88]

    Comme décrit plus en détail ci-dessous, les facteurs de transcription peuvent être classés par leur (1) mécanisme d'action, (2) fonction de régulation ou (3) homologie de séquence (et donc similitude structurelle) dans leurs domaines de liaison à l'ADN.

    Mécanique Modifier

    Il existe deux classes mécanistes de facteurs de transcription :

      sont impliqués dans la formation d'un complexe de pré-initiation. Les plus courants sont abrégés en TFIIA, TFIIB, TFIID, TFIIE, TFIIF et TFIIH. Ils sont omniprésents et interagissent avec la région promotrice centrale entourant le ou les sites de démarrage de la transcription de tous les gènes de classe II. [89]
    • Facteurs de transcription en amont sont des protéines qui se lient quelque part en amont du site d'initiation pour stimuler ou réprimer la transcription. Ceux-ci sont à peu près synonymes de facteurs de transcription spécifiques, car elles varient considérablement en fonction des séquences de reconnaissance présentes à proximité du gène. [90]

    Modification fonctionnelle

    Les facteurs de transcription ont été classés selon leur fonction régulatrice : [11]

    • JE. constitutivement actif – présent dans toutes les cellules à tout moment – ​​facteurs de transcription généraux, Sp1, NF1, CCAAT
    • II. conditionnellement active - nécessite une activation
      • II.A du développement (spécifique à la cellule) - l'expression est étroitement contrôlée, mais, une fois exprimée, ne nécessite aucune activation supplémentaire - GATA, HNF, PIT-1, MyoD, Myf5, Hox, Winged Helix
      • II.B dépendant du signal – nécessite un signal externe pour l'activation
        • II.B.1 ligand extracellulaire (endocrinien ou paracrine)-dépendant – les récepteurs nucléaires
        • II.B.2 ligand intracellulaire (autocrine)-dépendant - activé par de petites molécules intracellulaires – SREBP, p53, récepteurs nucléaires orphelins
        • II.B.3 dépendant des récepteurs de la membrane cellulaire – des cascades de signalisation de second messager entraînant la phosphorylation du facteur de transcription
          • II.B.3.a facteurs nucléaires résidents – résider dans le noyau quel que soit l'état d'activation – CREB, AP-1, Mef2
          • II.B.3.b facteurs cytoplasmiques latents – la forme inactive réside dans le cytoplasme, mais, lorsqu'elle est activée, est transloquée dans le noyau – STAT, R-SMAD, NF-κB, Notch, TUBBY, NFAT

          Modification structurelle

          Les facteurs de transcription sont souvent classés en fonction de la similarité des séquences et donc de la structure tertiaire de leurs domaines de liaison à l'ADN : [91] [10] [92] [9]


          Fonction des facteurs de transcription

          Le rôle principal joué par les facteurs de transcription est de permettre aux cellules de se différencier. Grâce à leur capacité à initier ou à réprimer la transcription spécifique à un site, chaque cellule de notre corps peut se différencier en un type cellulaire différent bien qu'elle contienne le même code génétique exact. L'activation ou la désactivation des gènes permet aux cellules de se potentialiser dans les différents tissus et organes qui composent notre corps. (En fait, les cellules souches embryonnaires et adultes sont une classe de cellules indifférenciées qui peuvent se différencier en le type cellulaire à côté duquel elles sont placées.)

          Les facteurs de transcription rendent également possible l'ajustement génétique. La modulation de l'activité et de la quantité de facteur de transcription peut augmenter (augmenter) ou diminuer (diminuer) les taux de transcription du gène choisi. Par conséquent, ces altérations permettent non seulement d'exprimer un gène, mais elles déterminent à quel niveau chaque gène est exprimé. Par exemple, lorsque les niveaux d'insuline dans notre sang sont élevés, nos cellules déclenchent une régulation négative de l'expression du récepteur de l'insuline. Ainsi, bien que les récepteurs d'insuline continuent d'être fabriqués à des fins de maintien de la vie, les niveaux d'expression diminuent pour s'adapter aux nouvelles conditions internes de notre corps.

          La méthode d'action est reflétée dans la classification dont relève le facteur, comme nous le verrons ci-dessous.


          Régulation de l'expression génique | La génétique

          Dans cet article, nous discuterons de la régulation de l'expression des gènes chez les procaryotes et les eucaryotes.

          L'ADN d'une cellule microbienne est constitué de gènes, quelques à des milliers, qui ne s'expriment pas en même temps. À un moment donné, seuls quelques gènes expriment et synthétisent la protéine souhaitée. Les autres gènes restent silencieux à ce moment et s'expriment lorsque cela est nécessaire. L'exigence d'expression des gènes est régie par l'environnement dans lequel ils se développent. Cela montre que les gènes ont la propriété d'activer et de désactiver.

          Le code génétique que 20 acides aminés différents constituent une protéine différente. Tous sont synthétisés par des codons. Par conséquent, la synthèse de tous les acides aminés nécessite de l'énergie qui est inutile car tous les acides aminés constituant les protéines ne sont pas nécessaires à la fois.

          Hence, there is need to control the synthesis of those amino acids (proteins) which are not required. By doing this the energy of a living cell is conserved and cells become more competent. Therefore, a control system is operative which is known as gene regulation.

          There are certain substrates called inducers that induce the enzyme synthesis. For example, if yeast cells are grown in medium containing lactose, an enzyme lactase is formed. Lactase hydrolyses the lactose into glucose and galactose. In the absence of lactase, lactose synthesis does not occur.

          This shows that lactose induces the enzyme lactase. Therefore, lactase is known as inducible enzyme. In addition, sometimes the end product of metabolism has inhibitory effect on the synthesis of enzyme. This phenomenon is called feed back or end product inhibition.

          From the outgoing discussion it appears that a cell has auto-control mediated by the gene itself. For the first time Francois Jacob and Jacques Monod (1961) at the Pasteur Institute (Paris) put forward a hypothesis to explain the induction and repression of enzyme synthesis.

          They investigated the regulation of activities of genes which controls lactose fermentation in E. coli through synthesis of an enzyme, β-galactosidase. For this significant contribution in the field of biochemistry they were awarded Nobel Prize in Medicine in 1965.

          Regulation of Gene Expression in Prokaryotes:

          Gene expression of prokaryotes is controlled basically at two levels i.e. transcription and translation stages. In addition, mRNA degradation and protein modification also play a role in regulation. Most of the prokaryotic genes that are regulated are controlled at transcriptional stage.

          Other control measures operating at different levels are given in Table. 10.2:

          Transcriptional Control in Prokaryotes:

          It is a general strategy in a living organism that chemical changes occur by a metabolic pathway through a chain of reactions. Each step is determined by the enzymes. Again synthesis of an enzyme comes under the control of genetic material i.e. DNA in living organisms. Enzymes (proteins) are synthesised via two steps: transcription and translation.

          Transcription refers to synthesis of mRNA. Transcription is regulated at or around promoter region of a gene. By controlling the ability of RNA polymerase to the promoter the cell can modulate the amount of message being transcribed through the structural gene. However, if RNA polymerase has bound, again it can modulate transcription.

          By doing so the amount of gene product synthesized is also modulated. The coding region is also called structural gene. Adjacent to it are regulatory regions that control the structural genes. The regulatory regions are composed of promoter (for the initiation of transcription) and an operator (where a diffusible regulatory protein binds) regions.

          The molecular mechanisms for each of regulatory patterns vary widely but usually fall in one of two major groups: negative regulation and positive regulation. In negative regulation an inhibitor is present in the cell and prevents transcription. This inhibitor is called as repressor.

          An inducer i.e. antagonist repressor is required to permit the initiation of transcription. In a positive regulated system an effector molecule (i.e. a protein, molecule or molecular complex) activates a promoter. The repressor proteins produce negative control, whereas the activator proteins produce positive control.

          Since the transcription process is accomplished in three steps (RNA polymerase binding, isomerization of a few nucleotides and release of RNA polymerase from promoter region), the negative regulators usually block the binding, whereas the activators interact with RNA polymerase making one or more steps.

          Fig. 10.19 shows the negative and positive regulation mechanism of the genes. In negative regulation (A) an inhibitor is bound to the DNA molecule. It must be removed for efficient transcription. In positive regulation (B) an effector molecule must bind to DNA for transcription.

          je. Les Lac Operon Model (Jacob-Monod Model):

          For the first time Jacob and Monod (1961) gave the concept of operon model to explain the regulation of gene action. An operon is defined as several distinct genes situated in tandem, all controlled by a common regulatory region.

          Commonly an operon consists of repressor, promoter, operator and structural genes. The message produced by an operon is polycistronic because the information of all the structural genes resides on a single molecule of mRNA.

          The regulatory mechanism of operon responsible for utilization of lactose as a carbon source is called the lac operon. It was extensively studied for the first time by Jacob and Monod (1961). Lactose is a disaccharide which is composed of glucose and galactose (Fig. 10.20).

          The lactose utilizing system consists of two types of components the structural genes (lacZ, lacY and lacA) the products of which are required for transport and metabolism of lactose and the regulatory genes (the lad, the lacO and the lacP). These two components together comprises of the lac operon (Fig. 10.21a).

          One of the most key features is that operon provides a mechanism for the coordinate expression of structural genes controlled by regulatory genes. Secondly, operon shows polarity i.e. the genes Z, Y and A synthesise equal quantities of three enzymes β-galactosidase (by lacZ), permease (by lacY) and acetylase (by lacA). These are synthesized in an order i.e. β- galactosidase first and acetylase in the last.

          (i) The Structural Genes:

          The structural genes form one long polycistronic mRNA molecule. The number of structural gene corresponds to the number of proteins. Each structural gene is controlled independently, and transcribes mRNA molecules separately.

          This depends on substrates to be utilized. For example, in lac operon three structural genes (Z, Y and A) are associated with lactose utilization (Fig. 10.21A). β-galactose is the product of lacZ that cleaves β-1 → 4 linkage of lactose and releases the free monosaccharides.

          This enzyme is a tetramer of four identical subunits each with molecular weight of 1,16,400. The enzyme permease (a product of lacY) facilitates the lactose to enter inside the bacterium.

          Permease has molecular weight of 46,500. It is hydrophobic. The cells mutant in lacZ and lacY are designated as Lac – i.e. the bacteria cannot grow in lactose-free medium. The enzyme transacetylase (30,000 MW) is a product of lacA whose no definite role has been assigned.

          The lac operon consists of a promoter (P) and an operator (O) together with the structural genes. The initiation codon of lacZ is TAG that corresponds to AUG of mRNA. It is situated 10 bp away from the end of operator gene. However, the lac operon cannot function in the presence of sugars other than lactose.

          The operator gene is about 28 bp in length present adjacent to lacZ gene. The base pairs in the operator region are palindrome i.e. show two fold symmetry from a point (Fig. 10.22). The operator overlaps the promoter region.

          The lac repressor proteins (a tetramer of four subunits) bind to the lac operator in vitro and protect part of the lac operator in vitro and protect part of the promoter region from the digestion of DNase.

          The repressor proteins bind to the operator and form an operator-repressor complex which in turn physically blocks the transcription of Z,Y and A genes by preventing the release of RNA polymerase to begin transcription (Fig. 10.21b).

          In bacteriophage λ there are two operators the OL and OR which have different base sequences. Lambda repressor (gpcl) is rapidly synthesized, binds to OL and OR and inhibits the synthesis of mRNA and production of proteins gpcll and gpcII.

          (iii) The Promoter Gene:

          The promoter gene is about 100, nucleotide long and continuous with the operator gene. Gilbert (1974) and Dickson (1975) have worked out the complete nucleotide sequence of the control region of lac operon. The promoter gene lies between the operator gene and regulator gene.

          Like operators the promoter region consists of palindromic sequence of nucleotides (Figs. 10.22 and 10.23). These palindromic sequences are recognized by such proteins that have symmetrically arranged subunits. This section of two fold symmetry is present on the CRP site that binds to a protein called CRP (cyclic AMP receptor protein). The CRP is encoded by CRP gene (Fig. 10.25).

          It has been shown experimentally that CRP binds to cAMP (cyclic AMP found in E. coli and other organisms) molecule and form a cAMP-CRP complex. This complex is required for transcription because it binds to promoter and enhances the attachment of RNA polymerase to the promoter.

          Therefore, it increases transcription and translation processes. Thus, cAMP-CRP is a positive regulator in contrast to the repressor, and the lac operon is controlled by both positively and negatively.

          According to a model proposed by Pribnow (1975) the promoter region consists of three important components which are present at a fixed position to each other.

          These components are:

          (i) The recognition sequence,

          (ii) The binding sequence, and

          (iii) An mRNA initiation site.

          The recognition sequence is situated outside the polymerase binding site that is why it is protected from DNase. Firstly, RNA polymerase binds to DNA and forms a complex with the recognition sequence. The binding site is 7 bp long (5’TATGTTG) and present at such region that is protected from DNase. In other organisms the base pairs do not differ from more than two bases. Hence, it can be written as 5′ TATPuATG.

          The mRNA initiation site is present near the binding site on one of the two bases. The initiation site is also protected from DNase. However, there is overlapping of promoter and operator in lac operon, Moreover, there is a sequence 5’CCGG, 20 bp left to mRNA initiation site. This is known as Hpall site (5’CCGG) because of being cleaved at this site by the restriction enzyme Hpall.

          (iv) The Repressor (Regulator) Gene:

          Repressor gene determines the transcription of structural gene.

          It is of two types:

          It codes for amino acid of a defined repressor protein.

          After synthesis the repressor molecules are diffused from the ribosome and bind to the operator in the absence of an inducer. Finally, the path of RNA polymerase is blocked and mRNA is not transcribed. Consequently, no protein synthesis occurs. This type of mechanism occurs in the inducible system of active repressor.

          Moreover, when an inducer (e.g. lactose) is present, it binds to repressor proteins and forms an inducer-repressor complex. This complex cannot bind to the operator. Due to formation of complex the repressor undergoes changes in conformation of shape and becomes inactive. Consequently, the structural genes can synthesise the polycistronic mRNAs and the later synthesizes enzymes (proteins).

          In contrast, in the reversible system the regulator gene synthesizes repressor protein that is inactive and, therefore, fails to bind to operator. Consequently, proteins are synthesised by the structural genes.

          However, the repressor proteins can be activated in the presence of a co-repressor. The co-repressor together with repressor proteins forms the repressor-co-repressor complex. This complex binds to operator gene and blocks protein synthesis.

          Jacob and Monod (1961) could not identify the repressor protein. Gilbert and Muller – Hill (1966) succeeded in isolating the lac repressor from the Lac mutant cells of E. coli inside which the lac repressor was about ten times greater than the normal cells. The lac repressor proteins have been crystallized. It has a molecular weight of about 1,50,000.

          It consists of four subunits-each has 347 amino acid residues and molecular weight of about 40,000 Daltons. The repressor proteins have strong affinity for a segment of 12-15 base pairs of operator gene. This binding of repressor blocks the synthesis of mRNA transcript by RNA polymerase.

          The lac operon is induced when E. coli cells are kept in medium containing lactose. The lactose is taken up inside the cell where it undergoes glycosylation i.e. molecular rearrangement from lactose to allolactose. The galactosyl residue is present on 6 rather than 4 position of glucose (Fig. 10.20). Glycosylation is done by β-galactosidase that is constitutively present in the cell before induction.

          Allolactose is the real inducer molecule. The lac repressor protein is an allosteric molecule with specific binding sites for DNA and inducer. Allolacctose binds to lac repressor to form an inducer- repressor complex. Binding of inducer to repressor allosterically changes the repressor lowering its affinity for lacO DNA.

          Consequently repressor is released from lacO due to changes in three dimensional conformations. This is called allosteric effect. After being free lacO allows the RNA polymerase to form mRNA transcript. Here, allolactose acts as the effector molecule and checks the regulatory protein from binding to lacO (operator) gene.

          ii. Positive Regulation of the lac Operon-Catabolic Control:

          Cyclic AMP (cAMP) is the small molecule which is distributed in animal tissues, and controls the action of many hormones. It is also present in E. coli and the other bacteria. The cAMP is synthesized by the enzyme adenyl cyclase. (Fig. 10.24). Its concentration is directly regulated by glucose metabolism.

          The Lac operon has an additional positive regulatory control mechanism to avoid the wastage of energy during the synthesis of lactose-utilizing proteins while there is adequate supply of glucose.

          When E. coli grows in a medium containing glucose the cAMP concentration in the cells falls down. This mechanism is poorly understood. However, the note worthy point is that cAMP regulates the activity of lac operon (and other operons also).

          In contrast when E. coli cells are fed with alternate carbon source e.g. succinate, cAMP level increases. The crp locus expresses the enzyme adenylate cyclase that converts the ATP to cAMP.

          How does cAMP increase the process of transcription, is not known clearly. It has been shown experimentally that cAMP binds to the proteins expressed by crp locus which is known as cAMP receptor protein (CRP) or catabolic activator protein (CAP) (Fig. 10.25).

          Therefore, CRP-cAMP complex binds to the CAP-binding site present on lac promoter. The CRP -cAMP bound complex promotes the helix destabilization downstream, and facilitates RNA polymerase binding. This results in efficient open promoter formation and in turn transcription.

          iii. The PaJaMo Experiment:

          The key experiment in understanding the induction of β-galactosidase was done by Arthur Pardee, Jacob and Monod therefore, it is called PaJaMo experiment. They found that if a DNA molecule containing the lac operon enters a cell devoid of lac operon (lac – ), then the lac – cells are converted in to lac + cells.

          The lac operon expresses in the new cells, provided the DNA contains complete genes or open reading frames and a good promoter. The genes express and RNA polymerase binds to the promoter. The genes are transcribed, ribosomes bind to the mRNA, and β-galactosidase is synthesised.

          II. Regulation of Gene Expression in Eukaryotes:

          There is much variation and complexity in regulation of genes in eukaryotes. Because in eukaryotes different genes are expressed at different developmental stages of cells or different tissues under the influence of different types of stimuli imposed by external environment. Eukaryotic DNA undergoes several changes such as double stranded, linear thread, nucleosome, fibres, chromatid and chromosomes.

          Gene expression and regulation take place only when DNA is in double stranded linear form. Moreover, if the promoter or regulator region of any gene is organized into chromosome, initiation of transcription does not take place.

          Therefore, changes in state of chromatin occur by chromatin remodeling which results in gene activation. Thus packaging of DNA influences gene expression. In majority of cases regulation of gene expression takes place at transcription level. Regulation of expression at processing or translation level may also occur in eukaryotes.

          Gene expression can be regulated at several steps in the pathway from DNA to RNA to protein in a cell as described below:

          je. Transcriptional control:

          Controlling the gene expression during transcription

          ii. RNA processing control:

          Control 8f processing of primary RNA transcripts to form mature mRNA

          iii. RNA transport control:

          Control of transport of mature mRNA from nucleus to cytoplasm

          iv. Translational control:

          Selection of mRNAs in cytoplasm to be translated by ribosome.

          v. mRNA degradation control:

          Selective degradation of certain mRNA molecules in the cytoplasm, or

          vi. Protein activity control:

          Selective activation, inactivation or compartmentalization of specific protein molecule after their synthesis. Only transcriptional control ensures that no superfluous intermediates are synthesized.

          (i) Regulation through Transcriptional Factors:

          Unlike prokaryotes, there are multiple DNA binding proteins called transcription factors that control transcription in eukaryotes. These proteins are grouped into two major classes: the general transcriptional factors (GTFs) and the regulatory transcriptional factors (RTFs) The eukaryotic RNA polymerase fails to recognize the promoter directly.

          Therefore, the GTFs bind first the promoter directly (TATA sequence of all prokaryotes). RNA polymerase starts transcription at promoter site. The RTFs bind the regulatory site of the genes which is far away from the promoter.

          The RTFs bind to all the regulatory sequences of gene and control the rate of assembly of GTFs at the promoter. The RTFs either increase or decrease the transcription. When transcription is increased, this property is called activator. The decreasing level of transcription is called repression.

          (ii) Britten-Davidson Model for Gene Regulation:

          Regulation at transcription level involves both activation and repression of genes. Because genes may be switched on in some cases and switched off in others. Various models have been proposed for regulation of gene expression in eukaryotes. In 1969, Britten and Davidson proposed a model called gene battery model or Britten- Davidson model which is very popular. This model was further elaborated in 1973.

          According to this model, there are four classes of sequences:

          (i) Producer genes (which are comparable to structural genes of prokaryotes),

          (ii) Receptor site (comparable to operator gene in bacterial operon),

          (iii) Integrator gene (comparable to regulator gene synthesizing an activator RNA which may or may not synthesize protein before it activates the receptor site), and

          (iv) Sensor site (regulates the activity of integrator gene which can be transcribed only after activation of sensor site). The four classes of se­quences are interrelated (Fig. 10.27).

          In this model producer gene and integrator gene are involved in transcription, whereas the receptor and sen­sor sequences help in recogni­tion without participating in RNA synthesis.

          It has been proposed that receptor site and integrator gene are repeated several times so that the activ­ity of a large number of genes may be controlled in the same cell, same activator may rec­ognize all the repeats, and sev­eral enzymes of one pathway may be synthesized simultaneously.

          Transcription of the same gene is done in different developmental stages. This is achieved by several receptor sites and integrator genes. Each producer gene possesses many receptors sites, each site responds to one activator (Fig. 10.28) so that several genes can be recognized by a single activator. But at different time the same gene may be activated by different activators.

          A set of structural genes controlled by one sensor site is called ‘gene battery’. Several sets of genes may be activated when major changes are required. If one sensor site gets associated with them, transcription of all integrators may be caused at the same time. Thus, transcription of several producer genes is caused through receptor sites.


          Effect of transcription factor resource sharing on gene expression noise

          Gene expression is intrinsically a stochastic (noisy) process with important implications for cellular functions. Deciphering the underlying mechanisms of gene expression noise remains one of the key challenges of regulatory biology. Theoretical models of transcription often incorporate the kinetics of how transcription factors (TFs) interact with a single promoter to impact gene expression noise. However, inside single cells multiple identical gene copies as well as additional binding sites can compete for a limiting pool of TFs. Here we develop a simple kinetic model of transcription, which explicitly incorporates this interplay between TF copy number and its binding sites. We show that TF sharing enhances noise in mRNA distribution across an isogenic population of cells. Moreover, when a single gene copy shares it's TFs with multiple competitor sites, the mRNA variance as a function of the mean remains unaltered by their presence. Hence, all the data for variance as a function of mean expression collapse onto a single master curve independent of the strength and number of competitor sites. However, this result does not hold true when the competition stems from multiple copies of the same gene. Therefore, although previous studies showed that the mean expression follows a universal master curve, our findings suggest that different scenarios of competition bear distinct signatures at the level of variance. Intriguingly, the introduction of competitor sites can transform a unimodal mRNA distribution into a multimodal distribution. These results demonstrate the impact of limited availability of TF resource on the regulation of noise in gene expression.

          Déclaration de conflit d'intérêts

          Les auteurs ont déclaré qu'ils n'existaient pas de conflit d'intérêts.

          Les figures

          Fig 1. Different scenarios of competition for…

          Fig 1. Different scenarios of competition for a pool of TFs among promoters and other…

          Fig 2. A kinetic model of transcription,…

          Fig 2. A kinetic model of transcription, incorporating the TFs’ binding and unbinding to multiple…

          Fig 3. Our model of TF sharing…

          Fig 3. Our model of TF sharing predicts the behavior of the first two moments…

          Fig 4. Prediction of mRNA variance as…

          Fig 4. Prediction of mRNA variance as a function of mean, when the promoters share…

          Fig 5. Introduction of competitor sites can…

          Fig 5. Introduction of competitor sites can lead to multi-modal mRNA distribution.


          Decoupling transcription factor expression and activity enables dimmer switch gene regulation

          Gene-regulatory networks achieve complex mappings of inputs to outputs through mechanisms that are poorly understood. We found that in the galactose-responsive pathway in Saccharomyces cerevisiae, the decision to activate the transcription of genes encoding pathway components is controlled independently from the expression level, resulting in behavior resembling that of a mechanical dimmer switch. This was not a direct result of chromatin regulation or combinatorial control at galactose-responsive promoters rather, this behavior was achieved by hierarchical regulation of the expression and activity of a single transcription factor. Hierarchical regulation is ubiquitous, and thus dimmer switch regulation is likely a key feature of many biological systems. Dimmer switch gene regulation may allow cells to fine-tune their responses to multi-input environments on both physiological and evolutionary time scales.

          Copyright © 2021 The Authors, some rights reserved exclusive licensee American Association for the Advancement of Science. No claim to original U.S. Government Works.

          Déclaration de conflit d'intérêts

          Competing interests: The authors declare no competing interests.

          Les figures

          Fig. 1.. Switch-like activation and rheostat-like control…

          Fig. 1.. Switch-like activation and rheostat-like control of expression level are genetically decoupled in the…

          Fig. 2.. Decoupling occurs through regulation of…

          Fig. 2.. Decoupling occurs through regulation of the Gal4p transcription factor rather than directly at…

          Fig. 3.. Mechanistic model: switch-and-rheostat works through…

          Fig. 3.. Mechanistic model: switch-and-rheostat works through decoupled regulation of Gal4p activity and abundance.


          Enhancers and Transcription

          In some eukaryotic genes, there are regions that help increase or enhance transcription. These regions, called enhancers, are not necessarily close to the genes they enhance. They can be located upstream of a gene, within the coding region of the gene, downstream of a gene, or may be thousands of nucleotides away.

          Enhancer regions are binding sequences, or sites, for transcription factors. When a DNA-bending protein binds to an enhancer, the shape of the DNA changes. This shape change allows the interaction between the activators bound to the enhancers and the transcription factors bound to the promoter region and the RNA polymerase to occur. Whereas DNA is generally depicted as a straight line in two dimensions, it is actually a three-dimensional object. Therefore, a nucleotide sequence thousands of nucleotides away can fold over and interact with a specific promoter.

          Figure (PageIndex<1>): Enhancers: An enhancer is a DNA sequence that promotes transcription. Each enhancer is made up of short DNA sequences called distal control elements. Activators bound to the distal control elements interact with mediator proteins and transcription factors.


          Méthodes

          Data details and processing

          We analyzed a cohort of 50 Yoruban samples, for which genotypes of SNPs that are fully ascertained from sequencing data [29] along with RNA-sequencing data [30] are publicly available. Briefly, the raw dataset consists of 10,553,953 genotyped SNPs and expression measurements (quantile-quantile normalized values) of 18,147 genes with Ensembl gene ID across these 50 samples. Standard filters have been applied to the genetic data: minor allele frequency >0.05, SNP missingness rate <0.1 and individual missingness rate <0.1 [53]. After filtering, data for analysis consist of 50 samples with 7,206,056 SNPs.

          Association testing

          For association analysis, we considered only SNPs that resided within candidate regulatory regions along the genome. Pour trans association, we tested for association between a SNP and every gene we considered SNPs within the span of known exons and TFs (including introns) [54]. We tested for association using linear regression (Figure S2 in Additional file 1).

          Obtaining a random distribution of association test statistics

          Examining the random distribution of association tests was helpful in evaluating the empirical significance of results. This was achieved by generating 100,000 random pairs of sources and targets for exonic and TF variation separately. We used a strict randomization process of edges switching. We picked a source gene from all sources in the real data we then picked a target gene from all targets in the real data with a P-value cutoff of 10 -6 . When evaluating the number of targets per TF source, we created 1,000 sets of random TF source and gene target pairs each set contained 370 such pairs corresponding to 370 TF source-target pairs at a P-value cutoff of 10 -6 in the real data.

          Identifying topological properties of source-target pairs projected on the PPI network

          We used the PPI network provided by the Human Protein Reference Database [49]. The undirected network contains 9,671 nodes and 37,041 edges. For each node, we calculated its degree: the number of edges incident on the node. We defined a distance between every two nodes as the number of edges on the shortest path between them. All pair-wise shortest paths were determined using the Floyd-Warshall algorithm [55]. In cases where the network had more than one connected component, nodes from two different components were defined to have a distance of twice the maximal distance obtained within the components.

          Identifying topological trends across association P-values

          For exons, we observed the emergence of true positive associations between P-values 10 -6 and 10 -7 (Figure S2a in Additional file 1). Therefore, we focused on P-values <10 -6 and sorted all source-target pairs according to the significance of their association signal. We considered each prefix of this list, that is, each subset of source-target pairs exceeding a particular threshold, for significance of association signal. For each such subset, we reported each one of the topological properties defined above averaged over the subset. We calculated Spearman's correlation coefficient between significance thresholds and each of these cumulative averages. In a similar process, we randomly chose an equal number of arbitrary source-target pairs on the PPI network. Adding these pairs one by one created a distribution of analogous cumulative averages for permuted pairs. We recorded the Spearman correlation coefficient for these 100,000 permuted distributions. We calculated the empirical P-value for the significance of the observed correlation coefficients by counting the number of times when permuted r > real r and divided this by the number of permutations.

          Expression analysis

          We calculated all pairwise co-expression correlations for all gene pairs in the dataset using Spearman rank-correlation test, and therefore obtained the distribution of the correlation coefficient r. To determine whether the distribution of r between source-target pairs differed from its background distribution, we employed the Wilcoxon ranked-sum test.

          Enrichment of eSNPs for cis effects

          We examined whether eSNPs that were associated with a target's expression level also affected expression levels of the corresponding source. We tested this by considering, for each source-target pair, the one eSNP most associated to the expression for the target. We tallied the source-target pairs for which this eSNP was also significantly associated (P <0.05) with the expression level of the source. Under the null, the number of such pairs is a random variable that is binomially distributed. Bin (n = number ofunique source genes, P =0.05).

          Unit and path annotation

          We defined units of genes by considering a TF source and its gene targets. We examined shortest paths within the PPI network between eSNP exon source and its gene target. The enrichment of units and paths with gene subsets from the Gene Ontology [38], and KEGG [37] databases was calculated by Genatomy [36]. We reported only units or paths with annotations that had a significant FDR of 0.05 or better. The description of genes in units or paths is cited from the National Center for Biotechnology Information Gene database and GeneCards [56].

          Finding transcription factor source-target pairs in the experimental database

          The ChIP Enrichment Analysis (ChEA) database [39] represents a collection of interactions describing the binding of transcription factors to DNA, collected from ChIP-X (ChIP-chip, ChIP-sequencing, ChIP-positron emission tomography and DNA adenine methyltransferase identification) experiments. For each TF source and target, we examined if they were present in ChEA. We repeated the same procedure for 100,000 permuted pairs of a random TF source and a random gene target. We then compared, using Fisher's exact test, the number of pairs in ChEA between real and permutation pairs, out of all pairs where the TF source was included in the database.

          Finding PPI network decomposition to clusters

          The decomposition of the PPI network to clusters was computed by using the Louvain algorithm presented in [57]. This is a heuristic method that is based on modularity optimization. The method consists of two phases and partitions the network into clusters such that the number of edges between clusters is significantly less than expected by chance. The method provides a mathematical measure for modularity with network-size normalized values, ranging from 0 (low modularity) to 1 (maximum modularity). This method has been previously applied to various biological networks [58] and specifically to a PPI network [59].

          Significance of source and target residing in the same PPI cluster

          For each exon and TF source-target pair, we recorded whether both source and target resided in the same PPI cluster. We repeated the same procedure with 100,000 permuted unique source-target pairs from nodes on the PPI network. We then compared the number of cluster co-occurrences between real data and permutations using the Fisher exact test.

          Comparing shortest paths annotation content

          We recorded all genes along the shortest paths between exonic sources and targets, both in real and permuted data. We then looked for enrichment in this set of genes (at least 10 genes per category, FDR <0.05). We created sets of 1,000 permuted 55 shortest paths (from the 17,564 shortest paths in permutations) that followed the exact length distribution of the 55 real paths. For each one of the six categories that was not enriched in permutations, we performed two analyses: first, we counted how many genes from each category appeared in the real paths (with repetitions, that is if gene × from category Y appeared in two shortest paths we counted it twice) and second, we counted how many of the 55 paths had at least one gene from this category. We repeated the same procedures for the 1,000 permuted sets. For each category, we then counted how many of the 1,000 permutations achieved equal or greater numbers than seen for the real data (empirical P-value).


          Voir la vidéo: DELF B1. PRODUCTION ORALE. Simulation examen complet (Janvier 2022).