Informations

Qu'est-ce qui détermine une expression protéique réussie dans E. coli ?


Certaines protéines s'expriment bien dans un hôte hétérologue ; d'autres, non. Quelques exigences sont connues pour déterminer l'expression de la protéine, comme un promoteur fort (comme T7) pour la transcription et un site de liaison au ribosome fort pour la traduction. Je travaille avec une protéine, qui se compose de 2 sous-unités - alpha et bêta. Les deux sont sur un plasmide avec le promoteur T7 devant la sous-unité bêta (c'est-à-dire que la construction est le promoteur T7, CDS pour la sous-unité bêta, CDS pour la sous-unité alpha). La sous-unité bêta s'exprime bien, mais pas l'alpha. Pensez-vous que cela a quelque chose à voir avec l'environnement local (promoteurs, RBS, etc.) et dans quelle mesure cela dépend-il de cela ? Comment puis-je augmenter l'expression des protéines?


Un aspect important lors de l'expression d'une protéine d'un organisme différent dans E. coli est que l'utilisation des codons de l'organisme d'origine est probablement différente de l'utilisation des codons d'E. coli utilisé pour l'expression (biais d'utilisation des codons).

Bien que le code génétique soit dégénéré, tous les codons ne sont pas égaux. Ils peuvent coder pour le même acide aminé, mais les organismes ont tendance à favoriser des codons spécifiques par rapport aux autres et les ARNt de ces codons ont tendance à être présents à des concentrations différentes. Lorsque vous avez maintenant beaucoup de codons dans votre séquence qui sont très rares dans E. coli, l'expression en souffrira car l'ARNt de ces codons n'est pas présent à des concentrations suffisamment élevées pour soutenir la traduction.

Il existe deux façons de compenser cela, soit vous obtenez que votre E. coli produise plus d'ARNt rares, soit vous optimisez votre séquence pour utiliser différents codons. Pour la première solution, vous pouvez acheter certaines souches d'E. coli qui contiennent des plasmides codant pour les ARNt rares dans E. coli, l'une de ces souches est par ex. la souche Rosetta BL21.

Pour optimiser l'utilisation des codons, plusieurs sociétés proposent de synthétiser des séquences optimisées. Il existe également des outils disponibles en ligne, mais je n'ai aucune expérience directe avec ceux-ci.

L'optimisation n'est pas non plus aussi simple que d'utiliser le codon le plus répandu à chaque fois, il a été démontré que l'optimisation des codons pour qu'ils correspondent à la vitesse de traduction dans l'organisme d'origine peut améliorer les rendements d'expression. Pour certaines protéines, des sites de pause pendant la traduction peuvent être nécessaires pour assurer un repliement correct. Si la protéine ne se plie pas correctement, elle se dégradera rapidement et votre rendement en souffrira. Ceci est décrit dans l'article "Heterologous Protein Expression Is Enhanced by Harmonizing the Codon Usage Frequencies of the Target Gene with these of the Expression Host" de Angov et al.

Vous trouverez un bon aperçu de l'ensemble du sujet dans l'article "You're one in a googol: optimiser genes for protein expression" de Welsh et al.


Avez-vous essayé de placer vos deux gènes sur deux plasmides distincts (avec des origines de réplication et de sélection d'antibiotiques différentes, bien sûr) et de co-exprimer de cette façon ? Si la première des deux sous-unités s'exprime bien et que la seconde ne l'est pas, c'est probablement parce que les ribosomes tombent de l'ARNm avant de transcrire complètement le deuxième gène. Les gènes sont-ils d'origine eucaryote ? Je pense qu'il est difficile de "tromper" les ribosomes d'E. coli en traitant des séquences hétérologues comme un opéron, mais peut-être que quelqu'un ayant plus de connaissances sur la traduction procaryote pourrait aider.

En fait, le simple fait d'ajouter un deuxième promoteur T7 devant le gène 2 aiderait probablement beaucoup :

Les gènes sont transcrits soit à partir de promoteurs individuels, soit à partir d'un seul promoteur, conduisant à un long ARNm polycistronique. Il a été rapporté que l'expression polycistronique conduit à une expression plus faible de la protéine codée plus en aval, qui peut être exploitée pour influencer la stoechiométrie d'un complexe protéique (9). Une expression plusieurs fois plus élevée avec des promoteurs individuels par rapport à la transcription polycistronique a été rapportée (10). (La source)

Je sais par expérience personnelle que la co-expression utilisant deux plasmides peut très bien fonctionner avec les bons gènes !


Mad Scientist a couvert les problèmes potentiels de biais de codon (qui peuvent être améliorés avec Rosettas), mais plus généralement, j'ai vu une énorme variabilité des taux d'expression entre différents vecteurs (pET-28 vs pET-24) sans aucune raison apparente. Notre laboratoire a eu un énorme succès avec les vecteurs inductibles par IPTG (passer de pBC-SK à pET-24 a augmenté l'expression de 50 fois).

Au-delà de l'expression, la protéine peut être perdue lors de la préparation de l'extrait acellulaire. Il peut ne pas être dans le culot cellulaire s'il est exporté avec la permission d'un peptide signal, ou peut être jeté dans le culot de "débris" lors de la rotation des cellules lysées s'il est peu soluble. J'ai entendu une théorie selon laquelle les problèmes de solubilité peuvent être exagérés par des vecteurs qui saturent la machinerie d'exportation, qui peuvent à la fois entraver la synthèse et/ou être si efficaces qu'ils provoquent simplement des précipitations. Les Manuel du système PET suggère que des temps d'expression plus longs (du jour au lendemain) à des températures plus basses (15-20 °C) peuvent aider à résoudre les problèmes de solubilité. Quelle que soit la raison, l'élimination du peptide signal a considérablement augmenté l'expression de bon nombre de nos protéines.


J'ai trouvé un très bon article : Designing Genes for Successful Protein Expression, qui couvre la plupart des facteurs qui déterminent l'expression des protéines. J'en poste des parties, car je suis sûr que cela sera utile à certains d'entre vous.

La traduction peut être contrôlée au niveau de l'initiation et de l'allongement. L'initiation de la traduction dépend principalement de la séquence du site de liaison du ribosome (RBS) et de la structure secondaire précoce de l'ARNm. D'autres déterminants de l'expression des protéines sont moins bien compris mais tout aussi puissants.

1. Initiation à la traduction

Un élément clé affectant l'initiation de la traduction chez les procaryotes est la RBS qui se produit entre 5 et 15 bases en amont du codon d'initiation AUG du cadre de lecture ouvert (ORF). La liaison du ribosome à la séquence Shine-Dalgarno (SD) au sein du RBS localise le ribosome au codon d'initiation… Affinité du RBS car le ribosome est un facteur critique contrôlant l'efficacité avec laquelle de nouvelles chaînes polypeptidiques sont initiées. Cette interaction est en compétition avec d'éventuelles interactions d'appariement de bases impliquant la région RBS qui peuvent se former dans l'ARNm lui-même. Ainsi, les séquences SD avec un appariement de bases plus faible au ribosome sont plus sensibles aux interférences de la structure de l'ARNm. Cependant, certaines expériences suggèrent que les séquences SD avec une affinité trop forte peuvent être délétères, en particulier à des températures plus basses, en retardant l'élongation initiale. La distance entre le RBS et le codon de départ avec 5 à 7 bases du consensus SD AGGAGG étant également critique est également critique.

De nombreux éléments de preuve suggèrent que la 15-25 premiers codons de l'ORF méritent une attention particulière dans l'optimisation des gènes. Des études ont montré que l'impact des codons rares sur la vitesse de traduction est particulièrement fort dans ces premiers codons, pour l'expression à la fois chez Escherichia coli et Saccharomyces cerevisiae. Chez E. coli, la chute du peptidyl-ARNt lors de la traduction des codons initiaux semble être accentuée par la présence de rares codons NGG. Ces effets semblent être indépendants de la structure secondaire de l'ARNm local. Il est également vrai que l'expression peut être récupérée par remplacement de séquence 5' même pour des séquences qui ne présentent pas une structure d'ARNm particulièrement forte ou qui contiennent des codons rares ou d'autres éléments délétères évidents dans cette région.

2. Biais de codons

La deuxième manière dont les fréquences des codons de l'hôte peuvent être utilisées est de faire correspondre les fréquences des codons de l'hôte dans le gène conçu. Cela peut être fait simplement en choisissant chaque codon avec une probabilité qui correspond à la fréquence du codon de l'hôte… En utilisant des ensembles de gènes largement variés dans les caractéristiques de conception des gènes, Welch et al. ont constaté que la variation des fréquences d'utilisation des codons synonymes avait un effet profond sur la quantité de protéines produites dans E. coli, indépendamment des effets locaux de la séquence 5'. Une variation d'au moins deux ordres de grandeur dans l'expression a été observée en raison d'une substitution au-delà des 15 codons initiaux de l'ORF. Cette variation était fortement corrélée avec les fréquences globales d'utilisation des codons des gènes, bien que les fréquences des codons trouvées dans les variantes les plus exprimées ne correspondaient pas à celles trouvées dans le génome ou dans les gènes endogènes hautement exprimés d'E. coli. L'analyse multivariée a montré que les fréquences de codons spécifiques pour environ six acides aminés pouvaient prédire les différences observées dans l'expression. La base biochimique de cette corrélation n'est pas claire.

3. Structure de l'ARNm et élongation traductionnelle

Alors que de nombreuses preuves suggèrent que la structure de l'ARNm peut interférer avec l'initiation de la traduction chez les procaryotes et les eucaryotes, les effets de la structure sur l'élongation sont moins bien compris. Cela peut être dû en partie à l'activité hélicase intrinsèque des ribosomes, qui permet la traduction à travers des épingles à cheveux même très fortes et peut empêcher de nombreuses structures de limiter la vitesse de traduction chez les procaryotes ou les eucaryotes. Peut-être plus important encore, la structure de l'ARNm est difficile à prédire, en particulier pour les messages traduits activement qui sont en flux continu entre divers états repliés et dépliés.

4. Facteurs spécifiques aux protéines apportant une complexité supplémentaire

La protéine peut être particulièrement instable chez l'hôte, surtout si elle est mal repliée en raison d'une instabilité inhérente, d'un manque de facteurs prothétiques suffisants ou d'une modification post-traductionnelle inappropriée… L'expression des protéines sécrétées et membranaires peut être limitée par des mécanismes pour diriger ces protéines vers la membrane. Il est même possible que la séquence d'acides aminés de la protéine limite l'efficacité de la traduction. Par exemple, on pense que la proline est lentement traduite dans E. coli, quel que soit le codon utilisé.

L'expression de la protéine peut être toxique à la cellule conduisant à l'instabilité du vecteur d'expression ou à la suppression de la synthèse protéique par l'hôte… Une stratégie courante pour réduire la toxicité consiste à abaisser l'expression à des niveaux tolérables. Des promoteurs de force variable peuvent être des outils précieux pour trouver un taux d'expression optimal pour un rendement maximal… Un moyen potentiel d'éviter la toxicité de certaines protéines est de diriger l'expression vers le périplasme ou le milieu. Ceci peut être accompli par fusion N-terminale d'une séquence signal de sécrétion.

Pour plus d'informations, veuillez lire l'intégralité du document. Je recommande également de lire les paramètres de conception pour contrôler l'expression des gènes synthétiques chez Escherichia coli.


Plasmides 101 : Souches d'E. coli pour l'expression des protéines

Dans un précédent blog Plasmids 101, nous avons passé en revue les principales caractéristiques de plusieurs souches populaires de E. coli pour la propagation de l'ADN. Bien qu'excellents à des fins de clonage, ces E. coli les souches ne sont généralement pas bien adaptées à l'expression de protéines recombinantes. De nombreux défis peuvent survenir lors de la surexpression d'une protéine étrangère dans E. coli. Nous passerons en revue les pièges potentiels de l'expression des protéines recombinantes et certaines des souches commerciales les plus populaires conçues pour les éviter.


Pas Projet Traiter Caractéristiques de Cusabio Délai de mise en œuvre
1 Construction plasmidique Synthèse de gènes d'optimisation de codons Optimisation de plusieurs vecteurs, Plus d'options pour les clients
Optimisez plusieurs vecteurs en même temps Sélectionnez le vecteur qui a le rendement le plus élevé, ce qui peut raccourcir le délai
15-20 jours ouvrables
Digestion par restriction des produits de PCR Ligature au vecteur d'expression, par ex. Pcold-SUMO, pGEX-4T-1, pET22b-JT, etc.
Transformez les cellules compétentes TOP10 E.coil
Obtenir le bon plasmide recombinant
2 Transformation et criblage des souches Transformez le plasmide recombinant en cellules hôtes, par ex. BL21 (DE3), Rosetta-gami B (DE3) pLysS, cellules C41, culture une nuit à 37℃ Optimisation multi-conditions, sélection multi-hôtes
Dans le petit test, la température et l'IPTG sont optimisés pour obtenir les conditions de culture les plus adaptées. Plusieurs hôtes sont transformés en même temps pour sélectionner les bactéries hôtes avec le rendement le plus élevé.
5 jours ouvrables
Sélectionnez une seule colonie pour une expression induite à petite échelle Détectez l'expression des protéines par SDS-PAGE Préservez la meilleure colonie.
Optimiser les conditions d'expression
3 Expression et purification des protéines cibles 1-10 L d'expression à grande échelle Plusieurs méthodes de purification (facultatif)
Explorez différentes conditions chromatographiques, y compris l'échange d'ions, hydrophobe et autres en utilisant AKTA, puis déterminez la méthode de purification optimale.
12-15 jours ouvrables
Purification des protéines
4 Renaturation du corps d'inclusion Repliement si la protéine cible est un corps d'inclusion Diverses méthodes de repliage
Diverses conditions de mise en mémoire tampon sont utilisées pour cribler rapidement la meilleure formule de tampon de repliement. La protéine de repliement avec une pureté supérieure à 90 % est obtenue par renaturation par dilution, renaturation par dialyse, renaturation par chromatographie sur colonne, etc. La solubilisation et le repliement peuvent être réalisés pour plus de 95 % des corps d'inclusion.
5 Services supplémentaires (facultatif) Charger Suppression des tags par digestion de restriction Services supplémentaires flexibles
Les clients peuvent choisir de manière flexible parmi une variété de services supplémentaires en fonction de leurs besoins spécifiques, par ex. Élimination des endotoxines, stérilisation par filtre, élimination des étiquettes, lyophilisation, etc. Certains sont gratuits et d'autres nécessitent des frais supplémentaires.
3 jours ouvrables
Libérer Filtre-stérilisation Élimination des endotoxines Lyophilisation (Remarque : la lyophilisation et la stérilisation par filtre ne peuvent pas être réalisées simultanément) 2 jours ouvrables
6 Contrôle de qualité Test de pureté, concentration, etc. Un rapport de CQ est fourni. Rapport COA détaillé
Une fiche produit détaillée et un COA sont fournis pour chaque projet.
3-5 jours ouvrables
Délai total 35-45 jours ouvrables

Cas 1
Caractéristiques : La protéine est une protéine de fusion et digérée avec la protéase PreScission pendant la nuit sur la colonne de chromatographie d'affinité GST, puis avec une purification en une étape pour obtenir la protéine sans étiquette.

  • Piste 1:Lysat cellulaire (la flèche indique la protéine de fusion cible)
  • Voie 2:Flux à travers
  • Piste 3:Protéine digérée par la protéase PreScission (la flèche indique la protéine cible)
  • Voie 4 : éliminez les impuretés avec du PBS
  • Piste 5:Élution GSH (la flèche indique la protéine marquée GST)
  • Piste 6:Protéine cible concentrée

Cas 2
Caractéristiques : Après expression, la protéine cible a été purifiée par chromatographie d'affinité sur colonne de nickel. La pureté atteint 90 % et le rendement atteint 20 mg/L

  • Piste 1 : Lysat cellulaire
  • Voie 2:Flux à travers
  • Piste 3:30 mM d'élution d'imidazole
  • Piste 4:60 mM d'élution d'imidazole
  • Piste 5:200 mM d'élution d'imidazole
  • Piste 6:500 mM d'élution d'imidazole

Cas 3
Caractéristiques : plusieurs options d'étiquettes peuvent être fournies pour une protéine.

  • Piste 1:60 mM d'élution et de concentré d'imidazole
  • Ligne 2:200 mM d'élution et de concentré d'imidazole
  • Piste 3:500 mM d'élution et de concentré d'imidazole

Cas 4
Caractéristiques:La protéine recombinante est fonctionnellement active.

L'activité de liaison d'aqpZ avec ytfE

Mesurée par sa capacité de liaison dans un ELISA fonctionnel. L'aqpZ immobilisé à 5 g/ml peut se lier à l'ytfE humain, la CE50 de la protéine ytfE humaine est de 197,90 à 259,70 g/ml.

Systèmes d'expression caractéristiques

Plasmide pET22b-JT + Bactérie hôte Rosetta-gami B (DE3) pLysS Système d'expression à basse température

Porter un puissant promoteur T7 Contient le peptide signal PelB Expression sécrétoire induite à basse température, qui est propice à la correction du repliement des protéines et à l'amélioration de la solubilité des protéines.

Clonage sans couture, aucune enzyme de restriction nécessaire.

Par rapport à l'étiquette 6xHis conventionnelle, l'étiquette N-terminale 10xHis a une capacité de liaison plus forte dans IMAC. Pendant ce temps, le site de la thrombine permet de retirer facilement l'étiquette.

Le tag MYC C-terminal peut être utilisé pour la détection des WB, et il a une sensibilité plus élevée que le tag His.

Plasmide pCold-SUMO + système d'expression à basse température de la bactérie hôte Rosetta-gami B(DE3)pLysS

Carry cspA fort promoteur Contient la protéine de fusion SUMO possédant une forte capacité à promouvoir l'expression.

Clonage sans couture, aucune enzyme de restriction nécessaire.

Par rapport à l'étiquette 6xHis conventionnelle, l'étiquette N-terminale 10xHis a une capacité de liaison plus forte dans IMAC. Pendant ce temps, le site de la thrombine permet de retirer facilement l'étiquette.

Le tag MYC C-terminal peut être utilisé pour la détection des WB et sa sensibilité est plus élevée que le tag His.


Li, C., Schwabe, J.W., Banayo, E. & Evans, R.M. La coexpression de partenaires récepteurs nucléaires augmente leur solubilité et leurs activités biologiques. Proc. Natl. Acad. Sci. Etats-Unis 94, 2278–2283 (1997).

Rivas, F.V. et al. Argonaute2 purifié et un siRNA forment un RISC humain recombinant. Nat. Structurer. Mol. Biol. 12, 340–349 (2005).

Bross, P. et al. La co-surexpression des chaperonines GroESL bactériennes surmonte en partie le repliement non productif et l'assemblage tétramère de E. coli–l'acyl-CoA déshydrogénase (MCAD) à chaîne moyenne humaine exprimée portant la mutation K304E à l'origine de la maladie prévalente. Biochim. Biophys. Acta 1182, 264–274 (1993).

Woestenenk, E.A., Hammarstrom, M., van den Berg, S., Hard, T. & Berglund, H. Son effet de balise sur la solubilité des protéines humaines produites dans Escherichia coli: une comparaison entre quatre vecteurs d'expression. J. Struct. Fonction. Génomique 5, 217–229 (2004).

Kapust, R.B. et Waugh, D.S. Escherichia coli la protéine de liaison au maltose est exceptionnellement efficace pour favoriser la solubilité des polypeptides auxquels elle est fusionnée. Protéine Sci. 8, 1668–1674 (1999).

Selzer, G., Som, T., Itoh, T. & Tomizawa, J. L'origine de réplication du plasmide p15A et des études comparatives sur les séquences nucléotidiques autour de l'origine des plasmides apparentés. Cellule 32, 119–129 (1983).

Davison, J. Mécanisme de contrôle de la réplication de l'ADN et de l'incompatibilité dans les plasmides de type ColE1 - une revue. Gène 28, 1–15 (1984).

Ho, T.Q., Zhong, Z., Aung, S. & Pogliano, J. Les plasmides bactériens compatibles ciblent des emplacements cellulaires indépendants dans Escherichia coli. EMBO J. 21, 1864–1872 (2002).

Song, J.J., Smith, S.K., Hannon, G.J. & Joshua-Tor, L. Structure cristalline de l'Argonaute et ses implications pour l'activité des trancheuses RISC. Science 305, 1434–1437 (2004).

Liu, J. et al. Argonaute2 est le moteur catalytique de l'ARNi des mammifères. Science 305, 1437–1441 (2004).

Meister, G. et al. L'Argonaute2 humain médie le clivage de l'ARN ciblé par les miARN et les siARN. Mol. Cellule 15, 185–197 (2004).

Held, D., Yaeger, K. & Novy, R. Nouveaux vecteurs de coexpression pour des compatibilités étendues dans E. coli. dans Novations 18, 4–6 (2003).


Production de protéines solubles de mammifères chez Escherichia coli : identification des caractéristiques des protéines en corrélation avec une expression réussie

Fond: Dans la recherche de stratégies d'expression génériques pour les familles de protéines de mammifères, plusieurs vecteurs d'expression bactériens ont été examinés pour leur capacité à promouvoir des rendements élevés de protéines solubles. Les protéines étudiées comprenaient des récepteurs de surface cellulaire (récepteurs Ephrins et Eph, CD44), des kinases (EGFR-domaine cytoplasmique, CDK2 et 4), des protéases (MMP1, CASP2), des protéines de transduction du signal (GRB2, RAF1, HRAS) et des facteurs de transcription (GATA2, Fli1, Trp53, Mdm2, JUN, FOS, MAD, MAX). Plus de 400 expériences ont été réalisées au cours desquelles l'expression de 30 protéines et domaines protéiques complets a été évaluée avec 6 partenaires de fusion N-terminaux et 8 C-terminaux différents. L'expression d'un ensemble supplémentaire de 95 protéines de mammifères a également été réalisée pour tester les conclusions de cette étude.

Résultats: Plusieurs caractéristiques des protéines sont corrélées avec le rendement d'expression des protéines solubles, notamment le poids moléculaire et le nombre de résidus hydrophobes contigus et de régions de faible complexité. Il n'y avait aucune relation entre l'expression réussie et la protéine pI, la grande moyenne d'hydropathie (GRAVY) ou la localisation subcellulaire. Seules les petites protéines cytoplasmiques globulaires avec un poids moléculaire moyen de 23 kDa n'ont pas nécessité d'étiquette améliorant la solubilité pour une expression soluble de haut niveau. La thiorédoxine (Trx) et la protéine de liaison au maltose (MBP) étaient les meilleures fusions de protéines N-terminales pour favoriser l'expression soluble, mais la MBP était la plus efficace en tant que fusion C-terminale. 63 des 95 protéines de mammifères exprimées à des niveaux solubles supérieurs à 1 mg/l sous forme de fusions N-terminales H10-MBP et celles qui ont échoué possédaient, en moyenne, un poids moléculaire plus élevé et un plus grand nombre d'acides aminés hydrophobes contigus et des régions de faible complexité.

Conclusion : Par l'analyse des caractéristiques des protéines identifiées ici, cette étude aidera à prédire quelles protéines et domaines de mammifères peuvent être exprimés avec succès dans E. coli en tant que produit soluble et également lesquels sont les mieux ciblés pour un système d'expression eucaryote. Dans certains cas, les protéines peuvent être tronquées pour minimiser le poids moléculaire et le nombre d'acides aminés hydrophobes contigus et de régions de faible complexité pour faciliter l'expression soluble dans E. coli.


Résultats

Afin de permettre le criblage des IMP solubilisés par un détergent à l'aide du transfert CoFi, il a été modifié et optimisé pour l'utilisation de détergents (données non présentées).

Les E. coli les protéines de la présente étude ont été choisies et classées en fonction de leurs niveaux d'expression obtenus dans des expériences d'analyse comparative antérieures (voir Matériels et méthodes). De cet ensemble, nous avons sélectionné huit E. coli cibles ainsi qu'une protéine membranaire humaine avec une expression nulle, faible ou moyenne (tableau 1). Tous les IMP ont été soumis à une mutagenèse aléatoire, à un dépistage par transfert CoFi et à une caractérisation.

Tableau 1.

Protéines utilisées dans cette étude

Création de librairies de mutagenèse aléatoire

Les bibliothèques de mutations aléatoires ont été créées à l'aide d'une polymérase disponible dans le commerce avec un taux de mutation facilement contrôlable, qui était limité à 3 mutations/kb. Le cadre de lecture ouvert muté (ORF) a été cloné dans le plasmide d'expression contenant un tag FLAG N-terminal et un His C-terminal6 tag utilisant le système Gateway et transformé en une souche de clonage, résultant en au moins 15 000 colonies. Cette banque amplifiée a ensuite été récoltée et transformée dans la souche d'expression C41 et criblée avec le CoFi blot. Typiquement 6000� colonies ont été criblées par bibliothèque.

Criblage CoFi blot et validation de la culture liquide

Dans les bibliothèques correspondant aux quatre protéines MP01, 02, 06 et 08, nous n'avons pas été en mesure de détecter des clones exprimant à des niveaux supérieurs au bruit de fond dans le transfert CoFi (Fig. 1A). Toutes ces quatre protéines avaient été précédemment désignées comme faibles ou non exprimantes (Eshaghi et al. 2005) (tableau 1 figure supplémentaire 1). Les bibliothèques des cinq protéines initialement classées comme exprimants faibles ou moyens (MP03, 04, 05, 07 et 09) ont montré des variations d'intensité considérables entre les colonies (Fig. 1B𠄽). A partir de ces transferts CoFi, nous avons sélectionné entre 20 et 50 colonies avec les intensités les plus élevées. Pour MP07, seules quelques colonies fortes étaient présentes et la plupart des colonies sélectionnées étaient d'intensité moyenne. Les colonies sélectionnées à partir des différentes protéines ont été cultivées et induites dans des cultures liquides avec des constructions WT en double. En utilisant une stratégie de séparation par filtration à 96 puits (Knaust et Nordlund 2001) suivie d'un dot blot sondé avec un réactif Ni-chélate, des constructions protéiques solubilisées par un détergent ont été identifiées. Pour les cibles MP03, 04, 05, 07 et 09, un certain nombre de clones sélectionnés se sont avérés exprimer mieux que WT (tableau 1).

Exemple de transferts CoFi pour des bibliothèques de mutagenèse aléatoire pour quatre cibles différentes. (UNE) MP01 ne contenant aucune colonie jugée positive. (B) MP07 montrant seulement quelques colonies positives. (C) MP05 et () MP09 illustrant des taches CoFi avec de grandes variations dans les niveaux d'expression.

Pour obtenir une estimation des performances du transfert CoFi adapté aux détergents, nous avons comparé 24 colonies classées comme faibles et 24 classées comme élevées de chacune des bibliothèques de MP04 et 05. Pour MP07, nous avons également inclus des colonies d'intensités moyennes, car très peu les colonies ont été jugées exprimer à un niveau élevé. Les constructions ont été cultivées dans des cultures liquides et des dot blots de matériel purifié ont été réalisés. Pour MP04 et MP05, il y avait une bonne corrélation entre l'évaluation du CoFi blot et les intensités observées dans les dot blots du matériel solubilisé (Fig. 2A,B,D,E), et pour MP07 nous avons pu identifier correctement les quelques clones significativement plus forts présent dans la bibliothèque avec plusieurs constructions exprimant à un niveau moyen (figures 1B, 2C, F).

Vérification de la méthode CoFi blot pour les protéines membranaires. (A𠄼) Les transferts CoFi des bibliothèques pour MP04 et 05 ont été utilisés pour diviser les clones de chaque transfert en catégories de niveau d'expression élevé ou faible. Pour MP07, nous avons également inclus des colonies exprimant à un niveau moyen des catégories. A partir de chaque transfert, 48 colonies jugées comme des exprimants élevés, moyens ou faibles ont été prélevées, cultivées et induites pour l'expression, aux côtés du type sauvage correspondant dans des cultures liquides. Des dot blots de matériau solubilisé à partir de ceux-ci ont été réalisés. Dessus les points de type sauvage en quatre exemplaires, quatre échantillons de type sauvage non induits sont présents. (D𠄿) Les intensités des taches de points dans A𠄼 ont été quantifiés. Des points de type sauvage ont été utilisés comme référence et ont été fixés à 1. Les intensités moyennes sont représentées sous forme de barres et les intensités individuelles sont représentées sous forme de bandes.

Expression et purification à moyenne échelle

Afin de confirmer les différences de niveaux d'expression, nous avons effectué des purifications IMAC à moyenne échelle sur au moins des échantillons en triple pour le meilleur clone exprimant et le WT correspondant pour les cibles MP03, 04, 05, 07 et 09. Les protéines purifiées ont été analysées soit par Western blots (MP03, 05 et 09) ou par dot blots (MP04 et 07).

Dans tous les cas, l'amélioration du rendement était significative et les différences au sein des ensembles de test étaient faibles (Fig. 3A𠄾). Le plus petit changement de rendement dans ces expériences à moyenne échelle était une augmentation d'environ 1,5 fois en moyenne pour MP03. Le changement le plus important observé a été pour MP07, où nous avons constaté une augmentation d'environ 12 fois en moyenne.

Comparaison entre les meilleurs clones exprimant et le type sauvage correspondant. Plusieurs purifications à moyenne échelle ont été effectuées pour (UNE) MP03 n = 3, (B) MP04 n = 7, (C) MP05 n = 4, () MP07 n = 7, et (E) MP09 n = 4. Les échantillons purifiés ont été analysés soit par Western blots (UNE,C,E) ou par dot blots (B,D) et les intensités de bande/point ont été déterminées semi-quantitativement. L'intensité de type sauvage a été définie sur 1, et chaque valeur de barre représente la moyenne ± SD de m expériences. (F) Échantillons purifiés après purifications à grande échelle, analysés sur SDS-PAGE. (G–I) Chromatogrammes de filtration sur gel issus de purifications à grande échelle de (g) MP03, (H) MP07, et (je) MP09. Le vide est indiqué par une flèche. Pour le meilleur clone exprimant de chaque cible, nous avons obtenu en moyenne 1 mg de protéine pure (après une purification en deux étapes) par L de culture LB (à une DO600 de 𢏂.0).

Expression et purification à grande échelle

Les cibles MP03, 07 et 09 ont été exprimées en culture liquide à grande échelle (4 litres) et soumises à une purification par affinité et à une filtration sur gel. Les échantillons purifiés ont été analysés par SDS-PAGE coloré au Coomassie (figure 3F). Les chromatogrammes de filtration sur gel ont montré que les protéines pouvaient être purifiées en tant que non-agrégats et que le profil chromatographique de chaque clone ressemblait à celui de WT (Fig. 3G–I).

Pour ces protéines, une détermination plus précise du rendement d'expression de clone amélioré a été effectuée en calculant l'aire sous la courbe chromatographique. Pour MP03, l'augmentation du rendement a été améliorée de 25 %, similaire à la quantité estimée à partir des expériences à moyenne échelle. Les clones un et deux de MP09 ont montré une augmentation de l'expression de 60% et 80%, respectivement, et MP07 a eu une amélioration de l'expression de 40 fois (4000%).

Analyse de séquence

Les clones positifs sélectionnés à partir du transfert CoFi qui ont donné des niveaux d'expression accrus dans les cultures liquides ont été séquencés afin de déterminer l'étendue et l'emplacement des mutations. En moyenne, 0,60 substitutions d'acides aminés ont été observées pour 100 acides aminés (tableau 1). Des clones montrant seulement une augmentation modérée, c'est-à-dire proches des niveaux d'expression de type sauvage, ont également été séquencés et avaient les mêmes taux de mutation. Puisqu'il n'y a pas de structure déterminée expérimentalement disponible de nos protéines cibles, nous avons prédit la structure secondaire des protéines en utilisant TMHMM (Krogh et al. 2001). Ces résultats ont ensuite été utilisés pour créer un modèle de structure secondaire sur lequel les mutations ont été tracées (Fig. 4A𠄾). En général, les mutations étaient uniformément réparties sur l'ensemble de la protéine. Toutes les substitutions dans les clones positifs sont résumées dans le tableau supplémentaire 1.

Prédiction de la structure secondaire et analyse de la localisation des mutations. La topologie des cibles (UNE) MP03, (B) MP04, (C) MP05, () MP07, et (E) MP09 a été prédit à l'aide de TMHMM(22). Le numéro de clone et l'emplacement des mutations sont indiqués par des couleurs différentes. Les clones exprimant aux niveaux les plus élevés sont représentés par des cercles plus grands. Les segments transmembranaires prédits sont représentés en gris plus foncé.


I. Protocole d'expression dans E. coli

Le protocole général du processus d'expression du gène à la protéine est donné ci-dessous.


Phase 1 : Synthèse de gènes optimisés pour les codons et construction de vecteurs

  • Optimisation de la structure des codons et des ARNm
  • Fusionner le gène à une étiquette de protéine et les insérer dans un vecteur d'expression
  • Vérifier l'exactitude de la construction par séquençage

Phase 2 : Transformer le vecteur d'expression en E. coli Cellules compétentes

  • Ajouter un vecteur d'expression aux cellules compétentes décongelées
  • Ajouter les cellules choquées par la chaleur au bouillon LB et agiter
  • Plaque de culture cellulaire sur des plaques de gélose LB avec un antibiotique approprié

Phase 3 : Culture de démarrage

  • Choisissez une seule colonie de souche d'expression dans 5 ml de LB avec l'antibiotique approprié
  • Agiter à 37℃ pendant 3 à 5 heures

Phase 4 : Expansion de la culture de démarrage

  • Développez la culture en ajoutant la culture de démarrage à un plus grand volume de LB avec un antibiotique (température ambiante)
  • Incuber pendant 1 à 4 heures jusqu'à ce que la densité de culture de DO600 atteigne 0,5-0,6

Remarque : Remplissez le flacon avec du coton ou un bouchon de flacon de culture pour permettre à la culture de s'oxygéner sans contaminer l'environnement.
Phase 5 : Intronisation

  • Induire l'expression en ajoutant de l'IPTG à une concentration finale de 0,5 mM après que la culture a atteint la DO600 0,5-0,6
  • Induire pendant 3-4 heures à 37℃ avec agitation

Remarque : IPTG est une solution congelée dans le congélateur à -20℃.

Option 2: Induction à température ambiante (20 ℃)

  • Refroidir la culture à température ambiante en la plaçant au réfrigérateur ou au bain-marie après avoir atteint la DO600 0,5-0,6
  • Induire l'expression en ajoutant de l'IPTG à une concentration finale de 0,1 à 1,0 mM
  • Induire pendant la nuit (12-18 heures) à température ambiante (20 ) avec agitation

Phase 6 : Collecte et lyse des cellules

  • Centrifuger les cellules à 3 500 x g pendant 20 min
  • Remettre les cellules en suspension dans du PBS glacé et re-centrifuger dans un tube de taille appropriée
  • Retirer le surnageant et congeler le culot pour un traitement ultérieur
  • Lyser les cellules en utilisant le protocole approprié

Expression de protéine recombinante dans Pichia pastoris

Introduction à Pichia pastoris

Pichia pastoris est une levure méthylotrophe et peut être utilisée comme système d'expression hétérologue [1] . C'est un micro-organisme unicellulaire facile à manipuler et à cultiver comme Escherichia coli [2] . En attendant, en tant qu'eucaryote, il possède les capacités de modifications post-traductionnelles effectuées par les cellules eucaryotes supérieures. Les protéines qui s'expriment sous forme de corps d'inclusion inactifs dans les systèmes d'expression bactériens peuvent donc être produites sous forme de molécules biologiquement actives dans P. pastoris, avec un traitement protéolytique, un repliement, une formation de liaison disulfure et une glycosylation corrects. En plus, le P. pastoris système est également considéré comme étant plus facile, plus rapide et plus rentable à utiliser que les systèmes d'expression développés à partir d'eucaryotes supérieurs tels que les cellules d'insectes et les systèmes cellulaires de culture de tissus de mammifères. Les niveaux d'expression des protéines chez P. pastoris système sont également généralement beaucoup plus élevés. En tant que levure, elle partage les avantages des manipulations génétiques faciles avec Saccharomyces, de plus, elle possède l'avantage de niveaux d'expression de protéines hétérologues 10 à 100 fois plus élevés. Toutes les caractéristiques ci-dessus ont fait Pichia un système d'expression protéique très utile. Il convient de mentionner que plusieurs techniques développées initialement pour Saccharomyces peuvent également être appliquées à Pichia, y compris la transformation par complémentation, la perturbation et le remplacement de gènes.

Pichia pastoris is a type of methylotrophic yeast and thus is capable of metabolizing methanol as its sole carbon source [3] . The first step in the metabolism of methanol is the oxidation of methanol into formaldehyde by molecular oxygen. The reaction also generates hydrogen peroxide except for formaldehyde. To avoid the toxicity of hydrogen peroxide, methanol metabolism normally takes place within the peroxisome, a specialized cellular organelle. Alcohol oxidase, the enzyme that catalyzes the oxidation of methanol has a poor affinity for oxygen, and thus Pichia pastoris has to generate large amounts of the enzyme as compensation. In the meantime, the promoter regulating the production of the enzyme is therefore used to drive heterologous protein expression in Pichia.

There are two genes code for alcohol oxidase in Pichia, AOX1 and AOX2 [4] . Generally, a majority of the activity of the enzymes relies on the AOX1 gene. Its expression is largely controlled by methanol. A plasmid-born version of the AOX1 promoter is applied to induce expression of inserted gene of interest for the desired heterologous protein [3,4] . Même si AOX2 is about 97% homologous to AOX1, its growth on methanol is much slower than that of AOX1.

To be more specific, the expression of the AOX1 gene is controlled at the level of transcription. The regulation of AOX1 gene is a two-step process, which includes a repression mechanism and an induction mechanism. Since growth on glucose can repress transcription process even when methanol exists growth on glycerol is recommended for optimal induction with methanol.

As to the expression pattern of heterologous protein in Pichia pastoris, it can be either intracellular or secreted, depending on the chosen expression vector. Secretion requires the presence of a signal peptide on the protein via secretory pathway. A major advantage of secreted expression of heterologous protein is that Pichia pastoris itself secrets very low levels of native proteins. Thus the secreted heterologous comprises the majority of the total protein in Pichia growth medium and therefore simplifies subsequent purification procedure of the protein [1] .

Typically, posttranslational modifications in Pichia include removal of signal sequences, folding, disulfide bridge formation and O-/N-linked glycosylation. In mammals, O-linked oligosaccharides are composed of sugars including N-acetygalactosamine, galactose and sialic acid [2] . While in lower eukaryotes like P.pastoris, the added O-linked oligosaccharide simply refers to mannose residues.

P. pastoris has become a highly successful system for the expression of heterologous genes. Several important factors that contribute to its rapid spread and wide range application are summarized as following points [2] .

a.A promoter derived from the alcohol oxidase I (AOX1) gene of P.pastoris that is appropriate for the precise expression of foreign genes.
b. Similar techniques of the molecular genetic manipulation in P.pastoris to those from Saccharomyces cerevisiae, one of the most well-characterized experimental systems in modern biology.
c. P.pastoris prefers respiratory growth, which is a key physiological trait which allows its culturing at high cell densities relative to fermentative yeasts.

Our trained custom service group will perform all the steps for the fastest expression of your target protein using the P.pastoris Expression System, which will definitely save your resources and time.

Experimental Outline

The flow chart below illustrates the overall experimental process required for recombinant protein production using the Pichia Expression System.

Protocol for Recombinant protein expression using the Pichia Expression System

The following protocol can be a reference for you to understand more details of the techniques utilized in our lab and workflow involved in producing the protein of interest using P.pastoris.

1. Select the appropriate Expression Vector for your target gene.

You may choose to express your protein intracellularly if your protein is cytosolic and non-glycosylated. You can also have your target protein secreted into the culture media if your protein is generally secreted, glycosylated or directed to an intracellular organelle.

2. Transformation into E.coli.

je. Insert the target gene in frame with the expression vector.
ii. Transform the E.coli with the ligation mixture by electroporation or chemical methods.
iii. Add LB medium to the cells for recovery after heat shock or electroporation.
iv. Plate on LB medium with Zeocin.
v. Incubate overnight.

3. Analyze transformants.

je. Select Zeocin-resistant colonies and inoculate into LB medium with Zeocin.
ii. Grow overnight and isolate plasmid DNA.
iii. Sequence the gene construct to confirm the correct insertion of gene within the vector.

4. Preparation for transformation

Prior to transformation and selection in Pichia, the plasmid should be linearized. Vector linearized within the 5’ AOX1 region will integrate into the host 5’ AOX1 region by gene insertion.

je. Digest the plasmid DNA with selected restriction enzymes.
ii. Check the digested mixture for complete linearization by agarose gel electrophoresis.
iii. Once the vector is confirmed to be completely linearized, use heat treatment for inactivation or add EDTA to cease the reaction immediately.
iv. Use phenol/chloroform for extraction and ethanol for precipitation of the DNA.
v. Centrifuge the solution and wash the pellet DNA with ethanol.
vi. Resuspend the DNA in sterile water after air-dry for immediate use or store at -20°C.

5. Electroporation of Pichia.

The method of electroporation is strongly recommended because it gives the highest transformation frequency in Pichia.

je. Grow the selected P.pastoris strain in yeast medium overnight.
ii. Add fresh medium in the overnight culture. Grow overnight again.
iii. Centrifuge the cells and resuspend with ice-cold, sterile water. Répétez deux fois.
iv. Centrifuge the cells, then resuspend with ice-cold sorbitol. Répétez deux fois. Place the cells on ice before use.
v. Mix the cells with linearized DNA.
vi. Transfer the mixture to an ice-cold electroporation cuvette. Incubate on ice.
vii. Add ice-cold sorbitol to the cells, then transfer the cuvette content and incubate at 30°C.
viii. Spread the cells on plates for Zeocin selection.
ix. Incubate the plates until colonies form.
X. Pick 10-20 colonies for further selection.

6. Analyze Pichia transformants

je. Inoculate yeast medium with the chosen single colony of Pichia souche. Grow overnight.
ii. Dilute the cells from the overnight culture and grow approximately 4-6 h.
iii. Centrifuge the cells and keep the pellet.
iv. Resuspend the cell pellet and get the competent cells.
v. The cells can be kept at room temperature and used for transformation assay at once or frozen for storage.

7. Transformation assay

The following procedure provides details of transformation of freshly prepared or frozen competent Pichia cellules. Note that transformation efficiency may vary among different Pichia strains and expression vectors used.

je. Add linearized recombinant vector DNA to the competent cells.
ii. Add solution containing PEG into the DNA/cell mixture.
iii. Incubate the transformation reaction for 1h at 30°C. Mix the reaction solution to increase transformation efficiency.
iv. Treat with heat shock and split the cells into microcentrifuge tubes for incubation.
v. Centrifuge the cells and keep the pellet.
vi. Resuspend and combine the cells.
vii. Plate the cells for selection. Incubate the plates until colonies appear.

8. Determine the Mut (Methanol Utilization Slow) phenotype.

Identify the expression levels among several chosen Mut phenotypes by SDS-PAGE analysis and screen for the high-expression Pichia recombinant clones. This may help optimize the expression condition of the recombinant clone.

The effectiveness of expression conditions of Pichia strain with Mut phenotype can be tested as follows.

je. Include a control gene transformed with the parent vector as a control for background intracellular expression.
ii. Inoculate a single colony in a baffled shaking flask and grow at 28-30°C.
iii. Harvest the cells and centrifuge at room temperature.
iv. Discard supernatant and resuspend cell pellet. Cover the flask with 2 layers of sterile gauze and continue growth.
v. Add methanol every 24 hours to maintain induction.
vi. Transfer 1 ml of the expression culture to a fresh microcentrifuge tube to analyze expression levels at a series of time points (i.e., 0-96 h post-induction).
vii. Determine the optimal time to harvest the cells. Centrifuge the cells at room temperature.
viii. For secreted expression, transfer the supernatant to a fresh tube and store until ready to assay. While, for intracellular expression, discard the supernatant and store the cell pellets until ready to assay.
ix. Analyze the supernatants and cell pellets respectively for protein expression by SDS-PAGE and Western blot.

The above steps can be adjusted to optimize expression for your target protein.

9. Scale-up expression.

Once expression condition is optimized, larger baffled flasks or fermentation will be utilized to increase the culture volume for scale-up production of target protein.

Note that proteins secreted into the media are normally more than 50% homogeneous and need additional purification. Therefore it is an optimal step to concentrate the protein before the purification process if the expression level is low. Commonly used methods for this step are ammonium sulfate precipitation, lyophilization and centrifuge concentrator for small volumes [5] .

References:

[1] Higgins D R. Overview of protein expression in Pichia pastoris[J]. Curr Protoc Protein Sci, 2001, Chapter 5: Unit5 7.
[2] Higgins D R, Cregg J M. Introduction to Pichia pastoris[J]. Methods Mol Biol, 1998, 103: 1-15.
[3] Lundblad R L. Glycosylation in Pichia pastoris[J]. Biotechnol Appl Biochem, 1999, 30 ( Pt 3): 191-2.
[4] Bretthauer R K, Castellino F J. Glycosylation of Pichia pastoris-derived proteins[J]. Biotechnol Appl Biochem, 1999, 30 ( Pt 3): 193-200.
[5] Buckholz R G, Gleeson M A. Yeast systems for the commercial production of heterologous proteins[J]. Biotechnology (N Y), 1991, 9(11): 1067-72.


Introduction

Membrane proteins (MP) play a central role in several biological processes, which includes cell signaling, ion and metabolites transport and energy conversion. Since the first MP structure was determined in 1986 1 , over 450 unique MP structures have been obtained (see crystal structure list from White 2 and NMR structure list from Warschawski 3 ). They provide molecular details explaining how MP work. Despite numerous breakthroughs in X-ray diffraction 4,5 , NMR 6 and electron microscopy 7 , as well as in MP production 8,9,10,11 and stabilization 12 , the structural biology of MP is hampered by the production of the recombinant protein and its purification in a functional state. In 1986, Studier and colleagues 13 set up a powerful bacterial expression system, in which the RNA polymerase from the bacteriophage T7 specifically drove the transcription of the target gene inserted in the expression plasmid, under the control of the T7 promoter. However, one of the main drawbacks of the T7 based expression system is that the rate of transcription of the target gene is rather fast because the T7 RNA polymerase (T7 RNApol) transcription activity is over ten times faster than E. coli ARN polymérase. Moreover, the expression system is further enhanced by the copy number of the expression plasmid. Consequently, upon expression of the T7 RNApol, an excess of target RNA is produced, which is often toxic to the cell and triggers uncoupling between transcription and translation and growth arrest 14,15 . Therefore, several strategies have been developed to attenuate and better regulate the T7 expression system: 1. Introducing a T7/lac hybrid promoter within the expression plasmid 2. Over-expressing the T7 lysozyme, a natural inhibitor of the T7 RNApol 16 3. Expressing the T7 RNApol under the control of the tightly regulated arabinose promoter (BL21-AI, Invitrogen).

In 1996, two spontaneous mutants of the BL21λ(DE3) bacterial host, namely C41λ(DE3) and C43λ(DE3), were isolated by exploiting the toxicity of the over-expression of the oxoglutarate mitochondrial carrier gene and of atpF encoding the b subunit of the E. coli ATP synthase, respectively 17 . We found that the level of accumulation of the target gene mRNA is ten times lower in C41λ(DE3) and is delayed by one hour in the C41λ(DE3)-derived bacterial host, C43λ(DE3). More recently, Wagner et al. have shown that the level of T7 RNApol is strongly reduced in both mutants, thereby allowing the bacterial cell to mediate cell growth with protein production 18 . Ensuring viability allowed metabolic adaptation, as illustrated by the production of the b subunit of the ATP synthase. In the C41λ(DE3) host, the b subunit was found in a partially unfolded state whereas in the C43λ(DE3) host, the production of the protein was accompanied by intense membrane proliferation with the b subunit in the correctly folded state 19 . In parallel to developments in the T7 based expression system, alternative expression systems have been established by employing arabinose 20 , lactose, tetracycline 21 , or T5 promoters 22 . Today, a profusion of expression plasmids and bacterial hosts are available for protein over-production 23,24 , however there is no clear rationale for choosing the appropriate bacterial expression system in each individual case.

Our objective here was to perform a global analysis of existing expression systems in the frame of MP production and structure determination. In a first step, entry codes referring to membrane protein structures obtained from E. coli were extracted from the Protein Data Bank (PDB) and the two major expression systems, T7 and arabinose promoter based, were identified. In a second step, a bibliographic database was constructed to perform an extensive analysis of expression protocols. The results we have obtained thus provide a systematic set of rules for the successful production of membrane proteins in E. coli.


Introduction

Prion diseases, also referred as transmissible spongiform encephalopathies (TSEs), are a family of rare progressive neurodegenerative disorders that affect both humans and animals [1]. TSEs include, for instance, bovine spongiform encephalopathy (BSE) in cattle, and Creutzfeldt-Jakob disease (CJD) in humans. These disorders are characterized by long incubation periods and characteristic spongiform changes in the brain associated with neuronal loss. The causative agent of TSEs is an infectious protein known as prion (also denoted as PrP Sc ) [2]. This pathogenic beta-sheet-rich conformer derives from the normal, mostly alpha-helical isoform, cellular prion protein (PrP or PrP C ), through a conformational conversion event which leads to aggregates in the brains of affected individuals leading to neurodegeneration [3].

Since the identification of prions as the causing agent of TSEs, recombinant PrP has been instrumental to study the structural and biophysical aspects of prion amyloidosis [4].

Due to its easy handling, inexpensive medium and large-scale production, the enteric bacterium Escherichia coli (E. coli) is the organism of choice for the production of numerous recombinant proteins [5]. However, expression of mammalian proteins in E. coli remains difficult and often results in inactive aggregates because the recombinant proteins do not fold properly in this host [6]. For example, recombinant PrP is largely expressed as inclusion bodies [7]. Most refolding protocols require a large amount of reagents and are time consuming. Success is highly dependent on the experimenter's savoir-faire. Attempts to assist proper folding of the PrP in the cytoplasm of E. coli by co-expression with bacterial chaperones failed [8]. As the formation of a disulfide bond is essential for PrP proper folding, expression of full-length PrP in the periplasm of E. coli was also investigated, resulting in soluble PrP which is partially degraded at the unstructured N-terminal end [9]. It has been observed that PrP can interact with several chaperones from the endoplasmic reticulum (ER) [10], including Pdia3 (also known as ERp57) and Grp58 (ERp60) [11], suggesting that in physiological condition, PrP requires assistance to fold into the correct conformation. In addition, PrP contains a disulfide bond which is crucial for the proper α-helical fold [12]. Based on these observations, we investigated the use of QSOX as a folding catalyst for PrP in the cytoplasm of E. coli. QSOX is a human chaperone that introduces disulfide bonds in secreted proteins downstream of the ER [13], and has been shown to be enzymatically active in the bacterial cytoplasm [14].

In the present study, we describe for the first time the production of soluble PrP of both mouse (MoPrP) and human (HuPrP) using co-expression with QSOX in the E. coli cytoplasm.