banner
Casa / Notizia / Nuovo design del peptide modulare
Notizia

Nuovo design del peptide modulare

Apr 06, 2023Apr 06, 2023

Natura volume 616, pagine 581–589 (2023) Citare questo articolo

29k accessi

118 Altmetrico

Dettagli sulle metriche

Approcci generali per la progettazione di proteine ​​che legano peptidi specifici per sequenza avrebbero ampia utilità nella proteomica e nella biologia sintetica. Tuttavia, la progettazione di proteine ​​che legano i peptidi è impegnativa, poiché la maggior parte dei peptidi non ha strutture definite in isolamento e i legami idrogeno devono essere creati con i gruppi polari sepolti nella struttura peptidica1,2,3. Qui, ispirandoci a sistemi proteina-peptide naturali e riprogettati4,5,6,7,8,9,10,11, abbiamo deciso di progettare proteine ​​costituite da unità ripetitive che legano peptidi con sequenze ripetute, con un unico corrispondenza biunivoca tra le unità ripetitive della proteina e quelle del peptide. Utilizziamo l'hashing geometrico per identificare le catene portanti proteiche e le disposizioni di aggancio dei peptidi che sono compatibili con i legami idrogeno bidentati tra le catene laterali della proteina e la struttura portante del peptide12. Il resto della sequenza proteica viene quindi ottimizzata per il ripiegamento e il legame peptidico. Progettiamo proteine ​​ripetute per legarsi a sei diverse sequenze di ripetizione del tripeptide nelle conformazioni della poliprolina II. Le proteine ​​sono iperstabili e si legano a 4-6 ripetizioni in tandem dei loro bersagli tripeptidici con affinità da nanomolari a picomolari in vitro e nelle cellule viventi. Le strutture cristalline rivelano interazioni ripetute tra proteine ​​e peptidi come previsto, comprese le scale di legami idrogeno dalle catene laterali delle proteine ​​alle strutture peptidiche. Riprogettando le interfacce di legame delle singole unità ripetitive, è possibile ottenere specificità per sequenze peptidiche non ripetitive e per regioni disordinate di proteine ​​native.

Numerose famiglie di proteine ​​presenti in natura si legano ai peptidi con sequenze interne ripetute7,9. Le proteine ​​ripetitive dell'armadillo, che includono i recettori di importazione nucleare, si legano a peptidi estesi con sequenze ricche di lisina e arginina in modo tale che ciascuna unità ripetuta nel peptide si inserisca in un'unità o modulo ripetuto nella proteina5,8. Studi precedenti hanno dimostrato che la specificità delle singole unità ripetitive proteiche può essere riprogettata, consentendo un riconoscimento più ampio delle sequenze peptidiche6,11,13,14. Sebbene questo approccio sia potente, è limitato al legame dei peptidi nelle conformazioni della spina dorsale compatibili con la geometria della ripetizione dell'armadillo. Le proteine ​​ripetitive del tetratricopeptide si legano a peptidi con una varietà di sequenze e conformazioni con affinità inferiore (micromolare) (per le eccezioni, vedere rif. 15,16,17) e con deviazioni in ciascun registro di interazione peptide-proteina, il che complica l'ingegneria per aspetti più generali riconoscimento dei peptidi4,9,10.

Abbiamo deciso di generalizzare il riconoscimento dei peptidi mediante scaffold modulari di proteine ​​ripetute a geometrie arbitrarie della spina dorsale di peptidi ripetuti. Ciò richiede la risoluzione di due sfide principali: in primo luogo, costruire strutture proteiche con una spaziatura e un orientamento ripetuti che corrispondano a quelli della conformazione del peptide bersaglio; e, in secondo luogo, garantire la sostituzione dei legami idrogeno peptide-acqua nello stato non legato con legami idrogeno peptide-proteina nello stato legato. La prima sfida è cruciale per il riconoscimento di sequenze modulari ed estensibili: se le singole unità ripetute nella proteina devono legare le singole unità ripetute sul peptide nello stesso orientamento, la fase geometrica delle unità ripetute sulla proteina e sul peptide deve essere compatibile. La seconda sfida è importante per ottenere un'elevata affinità di legame: in conformazioni diverse dall'elica α e 310, i gruppi NH e C=O formano legami idrogeno con l'acqua nello stato non legato che devono essere sostituiti con legami idrogeno all'acqua. proteina dopo il legame per evitare di incorrere in una sostanziale penalizzazione dell'energia libera15.

Per affrontare la prima sfida, abbiamo ritenuto che un criterio necessario (ma non sufficiente) per la corrispondenza geometrica in fase tra le unità ripetitive sulla proteina progettata e le unità ripetitive sul peptide fosse una corrispondenza tra le supereliche tracciate dalle due. Tutte le strutture polimeriche ripetitive tracciano supereliche che possono essere descritte da tre parametri: la traslazione (sollevamento) lungo l'asse elicoidale per unità di ripetizione; la rotazione (torsione) attorno a questo asse; e la distanza (raggio) del baricentro dell'unità di ripetizione dall'asse18,19 (Fig. 1a). Abbiamo generato grandi serie di dorsali proteiche ripetitive che hanno campionato un'ampia gamma di geometrie superelicoidali (vedi Metodi). Abbiamo quindi generato serie corrispondenti di dorsali peptidiche ripetute campionando casualmente le conformazioni di di-peptidi e tri-peptidi (evitando scontri sterici intra-peptidici) e quindi ripetendoli 4-6 volte per generare peptidi di 8-18 residui. Abbiamo quindi cercato coppie corrispondenti di backbone di proteine ​​ripetute e peptidi ripetuti, richiedendo che la salita fosse entro 0,2 Å, la torsione fosse entro 5° e il raggio differisse di almeno 4 Å (la differenza di raggio è necessaria per evitare lo scontro tra peptide e proteina; il peptide può avvolgersi sia all'esterno che all'interno della proteina).

3.0.CO;2-2" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291522-2683%2819991201%2920%3A18%3C3551%3A%3AAID-ELPS3551%3E3.0.CO%3B2-2" aria-label="Article reference 53" data-doi="10.1002/(SICI)1522-2683(19991201)20:183.0.CO;2-2"Article CAS PubMed Google Scholar /p>