Genome editing
E’ una tecnica molto importante, comparabile alla scoperta della struttura del DNA.
Ci sono tre sistemi possibile per generare diversità nelle piante.
Incrocio
Ho due varietà di riso, una molto bella ma suscettibile ad una malattia, o che non cresce in carenza di azoto e di acqua, e un’altra più brutta ma resistente a tutto questo.
Le incrocio tra loro e ottengo l’F1: durante la gametogenesi ci sarà ricombinazione tra i cromosomi delle due piante, e al termine vi saranno nuove combinazioni gametiche.
Potrò perciò creare delle linee diverse dal parentale e alcune di queste magari saranno dotate di caratteri favorevoli. Tutto ciò richiede, però, tempi lunghi e porta spesso all’ottenimento di effetti indesiderati.
Mutagenesi
Per ottenere l’effetto potrò avvalermi di mutageni fisici, come i raggi γ che determinano piccole delezioni di 2-4 bp, oppure potrò sfruttare neutroni veloci che, avendo energia maggiore, posso determinare la comparsa di mutazioni in centinaia, ma anche migliaia di basi.
Esistono anche mutageni chimici come l’EMS (Metano Sulfonato di Etile) che determina transizioni, ma anche il sodio azìde un composto di per sé non pericolo, ma che può essere successivamente metabolizzato come un composto mutageno in lievito, in E. coli, nel mais etc.
Trattando i semi con agenti mutageni si ottengono piante mutanti di cui solo una sarà di interesse: potrei già conoscere il gene in questione, per esempio quello del nanismo, e da questo potrei creare una linea che porti questa mutazione segnalata da marcatori molecolari.
Tuttavia, a seguito di un trattamento mutageno, le mutazioni generate saranno tante, migliaia in più rispetto a quella di reale interesse, quindi sarà poi necessario fare dei re-incroci con la pianta wild type per cercare di eliminare tutto il background.
Alcune volte non è possibile eliminare completamente questo rumore di fondo, poiché potrebbe capitare che le mutazioni siano molto vicine al gene di interesse, e che quindi non verranno mai rimosse da eventi di ricombinazione.
Per cercare di bypassare questi problemi, si utilizza il genome editing.
Genome editing
Fare “Genome editing” significa fare una modifica specifica sul DNA in base alla conoscenza che si possiede del genoma della pianta. Potrò agire in tempi brevi e con risultati nettamente specifici.
Si sfruttano delle nucleasi:
Le Zinc finger sono proteine che legano il DNA, sono composte da diversi moduli, ognuno dei quali riconosce una sequenza di 3 bp. Perciò, associando tre moduli, si possono riconoscere 9 bp del DNA.
Si potranno ricombinare questi moduli, in modo tale da poter riconoscere delle specifiche sequenze sul genoma. Agiscono come dimeri, ovvero un monomero riconosce la sequenza su un filamento, e l’altro modulo la sequenza sul filamento complementare.
Sono legate a Fok1 che è un enzima di restrizione che non ha specifiche esigenze di riconoscimento del DNA, il riconoscimento corretto avviene da parte delle Zinc finger.
Fok1 generalmente taglia il doppio filamento con tagli sfalsati.
TALEN è un sistema derivato dal batterio fitopatogeno Xanthomonas.
Si lega al promotore dei geni delle piante per favorire la sua stessa sopravvivenza.
Anche qui, il riconoscimento è basato su peptidi modulari, ognuno da 33-34 amminoacidi.
Ognuno di questi peptidi modulari riconosce una singola base del DNA, potendo quindi interagire con una regione specifica.
Sono nuovamente uniti all’enzima Fok1, e ogni monomero si occupa del taglio di un singolo filamento, in questo modo, globalmente, si ottiene un taglio sul double strand con estremità sfalsate.
CRISPR-Cas9 permette il riconoscimento di sequenze specifiche grazie alla presenza di una RNA guida.
Questo sRNA a singolo filamento è portato all’interno della Cas9 e permette il riconoscimento di una regione specifica del DNA che poi potrà essere modificata.
Cas9 è infatti una nucleasi che taglia il doppio filamento grazie alle sue due subunità, tuttavia, questa volta, il taglio è blunt (piatto).
La freccia rossa indica la versatilità: è evidente che è sia più semplice ottenere un certo costrutto genetico usando il metodo CRISPR-Cas9 che non gli altri due.
Questi sistemi generano tagli del doppio filamento, questo taglio può essere riconosciuto e riparato in tre modi diversi: uno di questi è il NEHJ (Non Homologous End Joining – ricontrollare come funziona) che però non è molto preciso, anzi è molto errore prone, introduce inserzioni e delezioni (solitamente di 1-2 nt) durante la riparazione del double strand.
Queste mutazioni possono essere eterozigoti (su un cromosoma ma non sull’omologo), bialleliche (sono diverse, su un cromosoma avviene una inserzione e sull’altro una delezione), oppure omozigoti (su entrambi i cromosomi e identiche).
Se queste mutazioni avvengono in sequenze codificanti provoca frame shit e prima o poi si genererà un codone di stop e la proteina non sarà ottenuta.
È un metodo per generare, quindi, mutanti knock out.
Il secondo sistema è HR (Homologous Recombination – ricontrollare meccanismo): quando si verifica un taglio sul doppio filamento, interviene un MRN che degrada uno dei due filamenti in direzione 5’-3’, perciò resta una regione a singolo filamento che viene legata da proteine dette Rad51 e Rad52 che la proteggono.
Il 3’-OH libero del filamento singolo, può poi andare a ricercare una zona omologa sull’altro cromosoma, invadendola. Questa regione verrà quindi usata come stampo per sintetizzare quella mancante, ripristinando così il filamento corretto.
Se durante la riparazione fornisco al sistema un mio templato con una certa omologia per la zona del taglio, allora userà quello per ripristinare il tutto. Il templato da me fornito può essere diverso dall’originale, per esempio, può avere una tripletta in più che porta poi all’aggiunta di un amminoacido, e quindi potrò modificare specificatamente quella regione del DNA. (3)
Posso fornire un templato che è stato digerito all’estremità con lo stesso enzima che ha tagliato il doppio filamento, in questo modo potrò essere inserito perfettamente nella regione del taglio.
Nel terzo caso posso anche inserire dei domini, geni di resistenza etc.
Se ho la zona di un trascritto che è il target per un microRNA, posso anche fare una piccola delezione in frame per abolire la regolazione di questo miRNA.
SDN1 (Site directed Nuclease) – potrò spegnere il gene (knock out del gene), SDN2 potrò fare specifiche inserzioni/delezioni (posso modificare delle specifiche regioni), SDN3 posso inserire nuove sequenze di DNA (es. geni di resistenza agli antibiotici).
Come possono le nucleasi essere introdotte nelle cellule delle piante?
Per attuare queste modifiche è necessario inserire un gRNA e una sequenza che codifica per la Cas9, quindi bisognerà introdurre nella pianta un transgene.
Potrò quindi sfruttare una trasformazione stabile utilizzando Agrobaterium, in questo modo il DNA sarà inserito in una certa regione del genoma dove potrà codificare per il single guide RNA e per la nucleasi che andrà a modificare un’altra zona del genoma.
La modifica avviene in una zona del genoma diversa da quella in cui si è inserito il transgene.
Avvenuta la modifica, potrò incrociare la pianta modificata con il wild type e la zona in cui si è inserito il transgene segregherà dalla regione in cui è avvenuta la modifica.
Mettiamo che il transgene si sia inserito in una certa regione del cromosoma 5 e voglio che mi modifichi una regione del cromosoma 5 che magari è distante dalla prima 10 Mb, o addirittura voglio che modifichi una zona sul cromosoma 6.
Se poi incrocio la pianta con il wild type (cromosoma 5 normale), potrà avvenire una ricombinazione tra la modifica e la zona del costrutto, potendo quindi separare le due cose: posso ottenere una pianta senza il transgene ma con la modifica sul genoma.
Per fare questa modifica devo trasformare una pianta e lo farà con Agrobacterium che ha i geni vir che mobilitano la sequenza di DNA che ho messo tra i due border, e il transgene si integrerà in una regione random del genoma. Questo esprimerà il gRNA e la proteina Cas9 che ha come target una regione genomica diversa da quella in cui è stato inserito il transgene. Incrociando la linea con la modifica con il wild type privo di transgene e di modifica, si formeranno i gameti e durante questa ci può essere ricombinazione tra la zona del transgene e quella dove è avvenuta la modifica. Posso poi selezionare piante con la modifica ma senza transgene.
Il mio costrutto può anche essere inserito tramite particol bombardment o shot gun, tramite trasformazione di colture cellulari, di embrioni immaturi, utilizzando particelle di oro/tungsteno rivestite dal costrutto.
Rigenero le piante trasformate e anche qua avrò un’integrazione stabile e la modifica può essere in posizioni diverse dal transgene, quindi per ricombinazione potrò separare le due cose, ottenendo linee con modifica ma senza transgene.
Mal grado vi sia questa separazione, la Corte costituzionale europea considera queste piante come transgeniche, nonostante la modifica sia separata dai transgeni, e possa comunque essere ottenuta tramite semplice mutagenesi; sono considerate OGM.
Per questo, hanno cercato di trovare delle scappatoie, ovvero hanno cercato in ogni modo di indurre queste modifiche senza inserimento di DNA.
Un sistema che è stato sviluppato è quello di inserire nelle piante dell’RNA che codifica per la Cas9 e il gRNA, si tratta di inserire nelle piante una mistura di RNA.
Lo fanno usando, per esempio, dei protoplasti, funziona, ma l’RNA è molto delicato e le RNasi molto resistenti.
Hanno cercato di migliorare il sistema con protettori dell’RNA, hanno provato anche ad usare ribonucleo proteine pre-assemblate: utilizzando il gRNA come RNA e la Cas9 pre-assemblata, lo usano per trasformare protoplasti mediante elettroporazione, e comunque non c’è inserimento di DNA esogeno, ma solo un RNA e la proteina. I protoplasti nelle piante si possono fare digerendo le pareti cellulari, li trasformo poi con le ribonucleo proteine, però poi da questi dovrò rigenerare delle piante e questo spesso non è possibile (es. frumento, mais etc.)
CRISPR/Cas9
Il sistema funziona con un riconoscimento guidato da un gRNA verso sequenze target.
L’altra parte del gRNA è a doppio filamento, questo forma uno scaffold che trascina le nucleasi verso la regione target del genoma.
La nucleasi riconosce e taglia il doppio filamento che potrà poi essere riparato dalla ricombinazione omologa o non omologa.
La nucleasi ha due subunità dette RuvC e HNH.
Per quanto riguarda il gRNA, sono molto importanti, nello specifico, 12 nucleotidi che devono avere completa omologia con il target (sequenza seed).
Anche la sequenza PAM (Motivo Adiacente al Protospacer) è importante.
Questo PAM per Streptococcus pyogenes (microrganismo da cui è stato derivato un importante CRISPR) è NGG, con N al 5’ e G al 3’.
E’ importante che vi sia complementarietà con il gRNA, però affinchè il sistema di questo microrganismo funzioni, ci deve essere anche l’NGG.
Perché la nucleasi di CRISPR-Cas9 taglia tre nucleotidi a monte di NGG.
La subunità HNH taglia a 3 bp da NCC e RuvC da NGG.
Posso quindi disegnare il gRNA in modo che PAM sia vicino all’NGG, per sapere esattamente dove questo sistema andrà a tagliare.
Per i genomi delle piante disponibili hanno visto che c’è una frequenza di questa NGG da 5 a 15 volte ogni 100 bp. Sono stati in grado di disegnare gRNA che possono avere come bersaglio dall’85 al 99% di tutti i trascritti annotati. Quindi, si potrà fare knock out su quasi tutti i geni di queste piante.
Si attacca poi il sistema di riparazione non omologa, che metterà delle basi sbagliate, quindi a valle si interrompe la ORF e il gene non sarà più attivo.
Devo selezionare sul genoma il target da modificare, dovrò conoscerne la sequenza, e poi disegnerò il gRNA adeguato.
Nel far questo bisogna soprattutto fare attenzione all’appaiamento di quei 20 nucleotidi che devono avere omologia perfetta. Inoltre, potrebbe capitare che nel genoma vi siano altre regioni ad avere omologia con questi 20 nt, bisogna quindi fare in modo che non vi siano degli off targets che possano andare ad interessare anche altre regioni del genoma.
Ci sono appositi programmi che permettono di verificare se il gRNA sia sufficientemente specifico verso un unico target.
Sarà inoltre necessario ottimizzare i codoni, siccome il gRNA di Cas9 deriva da un batterio procariota, mentre la pianta sarà logicamente eucariota.
Cas9 deve essere sotto il controllo di un promotore costitutivo trascritto dalla RNA polimerasi II, oppure sotto il promotore dell’ubiquitina.
Invece, il gRNA deve essere sotto il controllo di un promotore per snRNA. Tutto questo dovrà essere inserito in un vettore per trasformare Agrobacterium e poi la pianta.
Stanno anche cercando di multplexare i targe: posso mettere diversi gRNA in un solo costrutto con un'unica Cas9, in questo modo potrò avere come target diverse regioni del genoma, a partire da un solo evento di trasformazione. Posso poi trasformare i protoplasti tramite elettroporazione, o tramite bombarding sui calli. Posso poi fare uno screening per identificare le modificazioni.
Dopo aver rigenerato le piante trasformate, già nella prima progenie andrò a sequenziare per verificare che sia avvenuto l’editing nella regione del genoma che avevo come bersaglio.
La nucleasi ha due subunità dette RuvC e HNH.
Per quanto riguarda il gRNA, sono molto importanti, nello specifico, 12 nucleotidi che devono avere completa omologia con il target (sequenza seed).
Anche la sequenza PAM (Motivo Adiacente al Protospacer) è importante.
Questo PAM per Streptococcus pyogenes (microrganismo da cui è stato derivato un importante CRISPR) è NGG, con N al 5’ e G al 3’.
E’ importante che vi sia complementarietà con il gRNA, però affinchè il sistema di questo microrganismo funzioni, ci deve essere anche l’NGG.
Perché la nucleasi di CRISPR-Cas9 taglia tre nucleotidi a monte di NGG.
La subunità HNH taglia a 3 bp da NCC e RuvC da NGG.
Posso quindi disegnare il gRNA in modo che PAM sia vicino all’NGG, per sapere esattamente dove questo sistema andrà a tagliare.
Per i genomi delle piante disponibili hanno visto che c’è una frequenza di questa NGG da 5 a 15 volte ogni 100 bp. Sono stati in grado di disegnare gRNA che possono avere come bersaglio dall’85 al 99% di tutti i trascritti annotati. Quindi, si potrà fare knock out su quasi tutti i geni di queste piante.
Si attacca poi il sistema di riparazione non omologa, che metterà delle basi sbagliate, quindi a valle si interrompe la ORF e il gene non sarà più attivo.
Devo selezionare sul genoma il target da modificare, dovrò conoscerne la sequenza, e poi disegnerò il gRNA adeguato.
Nel far questo bisogna soprattutto fare attenzione all’appaiamento di quei 20 nucleotidi che devono avere omologia perfetta. Inoltre, potrebbe capitare che nel genoma vi siano altre regioni ad avere omologia con questi 20 nt, bisogna quindi fare in modo che non vi siano degli off targets che possano andare ad interessare anche altre regioni del genoma.
Ci sono appositi programmi che permettono di verificare se il gRNA sia sufficientemente specifico verso un unico target.
Sarà inoltre necessario ottimizzare i codoni, siccome il gRNA di Cas9 deriva da un batterio procariota, mentre la pianta sarà logicamente eucariota.
Cas9 deve essere sotto il controllo di un promotore costitutivo trascritto dalla RNA polimerasi II, oppure sotto il promotore dell’ubiquitina.
Invece, il gRNA deve essere sotto il controllo di un promotore per snRNA. Tutto questo dovrà essere inserito in un vettore per trasformare Agrobacterium e poi la pianta.
Stanno anche cercando di multplexare i targe: posso mettere diversi gRNA in un solo costrutto con un'unica Cas9, in questo modo potrò avere come target diverse regioni del genoma, a partire da un solo evento di trasformazione. Posso poi trasformare i protoplasti tramite elettroporazione, o tramite bombarding sui calli. Posso poi fare uno screening per identificare le modificazioni.
Dopo aver rigenerato le piante trasformate, già nella prima progenie andrò a sequenziare per verificare che sia avvenuto l’editing nella regione del genoma che avevo come bersaglio.
Il CRISPR-Cas9 è un sistema derivato dai batteri che hanno loci CRISPR caratterizzati dall’avere ripetizioni dirette di circa 20-40 bp conservate, alternate a ripetizioni da 40-50 bp variabili, quest’ultime sono dette “spacers”.
Queste sequenze variabili hanno omologa con sequenze di fagi o con sequenze plasmidiche. In questi loci CRISPR, i batteri accumulano DNA esogeno derivato da organismi invasori.
Si tratta quindi di una sorta di “sistema immunitario adattativo”. I loci vengono trascritti e poi processati in un RNA maturo formato da una regione data dallo spacer e da una sequenza di RNA a doppio filamento garantito dalla ripetizione diretta e da una regione al 5’ dei loci CRISPR, detta tracrRNA. L’RNA a doppio filamento crea uno scaffold che trascina la nucleasi Cas9.
Si può rimuovere lo spacer e inserire una sequenza a mio piacimento che targetti verso il DNA che voglio modificare, nell’uomo, nelle piante, nei topi etc.
Lo spacer, normalmente, riconosce una sequenza target virale, per esempio, e portando la Cas9 lì, ne determina il taglio che protegge il batterio dal DNA invasore.
Nei loci target la regione di DNA adiacente allo spacer è quella che viene riconosciuta nel target, quindi il locus PAM è adiacente allo spacer che però essendo nel target è un protospacer.
Prodotti derivati da piante editate
Sono tutti prodotti attualmente in commercio ma non in Italia.
C’è un fungo che non si imbrunisce: in questi funghi è presente l’enzima polifenolo-ossidasi che polimerizza dei composti fenolici detti chinoni per dare polifenoli.
La polimerizzazione, quindi, porta all’imbrunimento che rende i funghi meno appetibili.
Usando il sistema CRISPR-Cas hanno ridotto del 30% l’attività di questo enzima, risolvendo in parte il problema.
Mais con poco acido fitico: l’inositolo-6-esafosfato rappresenta nei semi una fonte di accumulo di fosfato.
L’acido fitico non viene digerito dai monogastrici, quindi rappresenta un fattore antinutrizionale che, non essendo appunto digerito, diventa fonte di inquinamento.
Hanno fatto knock out per tre geni della via biosintetica dei fitati, abbattendone l’accumulo.
Pomodoro e frumento resistenti ai funghi.*
Patate con alterata qualità dell’amido, con poco acrilamide: dentro le patate ci sono zuccheri riducenti (glucosio, fruttosio) che ad alte temperature generano acrilamide e asparagina.
Le patate se messe in frigo sviluppano più zuccheri di questo tipo (cold sweetening), infatti devono essere conservate al fresco ma fuori frigo, al buio, e mai cotte oltre i 120°C.
Gli zuccheri si formano a partire dal saccarosio per azione dell’enzima invertasi acida. Hanno fatto knock out per i 4 geni dell’invertasi, essendo la patata un autotetraploide.
Soia con molto acido oleico: contiene molti acidi grassi insaturi come l’acido linoleico e linolenico.
Per risolvere il problema dell’instabilità delle insaturazioni, usano le idrogenazioni parziali che possono poi portare all’ottenimento di prodotti dannosi per la salute cardiovascolare.
Hanno fatto un knock out genico dell’acido grasso desaturasi (aumenta la desaturazione dei trigliceridi), ne hanno silenziati due e hanno visto che nei prodotti derivati si aveva un aumento dell’acido oleico saturo e una drastica riduzione degli insaturi (linoleico e linolenico).
* Editing dei tre omeoalleli di Mlo in frumento esaploide conferisce resistenza a oidio
Il frumento che si usa per il pane è un alloesaploide con tre copie di ogni genoma (a-b-d), quindi se dovrò fare una modifica, dovrò farla per tre volte.
L’oidio è una malattia che colpisce le Graminacee.
Nel frumento e nell’orzo esiste un gene detto MLO, che allo stato dominante conferisce suscettibilità alla malattia.
Se invece risulta mutato e ridotto in forma recessiva, la pianta diventa resistente.
Il wild type si comporta come un regolatore negativo della resistenza alla malattia. Usando CRISPR-Cas si può disegnare un gRNA per fare knock out di questo gene in genomi diversi (su omeologhi).
Quando si riesce a silenziare la copia del gene in tutti i genomi, allora la pianta diventa resistente alla malattia.
Sviluppo di sistemi di base editing che consentono di modificare sequenze specifiche sul DNA senza provocare danni sul doppio filamento
I CBEs delle citosine sono enzimi che vengono fusi al C-terminale della Cas9, uno dei due domini è stato inattivato e resta solo la funzione elicasica.
Avendo questa deaminasi fusa al C-terminale della Cas9, potrò convertire G-A e C-T. Anche questo fatto è interessante perché potrò modificare una tripletta senza tagliare il DNA, inoltre, talvolta basta il cambiamento di un singolo amminoacido per modificare un’intera proteina.
Potrò anche modificare una regione target di un miRNA per impedirne la degradazione.
Un tempo questi base editor agivano in una finestra target un po’ più ampia, mentre adesso riescono a restringere la finestra a 1-2bp attorno alla citosina.
E’ importante la variante VQR di Cas9, perché è capace di riconoscere un PAM diverso da NGA, ovvero NGG, questo permette di espandere le regioni modificabili.
Possibili applicazioni addizionali di CRISPR/Cas9
I sistemi addizionali sono stati identificati in specie batteriche diverse dal classico S. pyogenes, per esempio in Neisseria, in S. thermophilus etc.
Quando esprimo questi diversi sistemi, non cross-interagiranno tra loro
perché hanno PAM diversi.
Quindi, la Cas9 di pyogenes non potrà usare il
gRNA di Neisseria, sono molto specifici.
Sfruttandoli potrò però agire
su quattro target diversi all’interno della stessa cellula.
Questi
sistemi possono essere ortogonali, nella stessa cellula posso favorire
la trascrizione di un gene e contemporaneamente inibire quella di un
altro.
Questi sistemi sono basati su Cas9 defected, quindi la loro
attività nucleasica è stata mutata, non tagliano il DNA, ma solo cercano
determinate regioni specifiche.
Posso legare al C-terminale un
attivatore della trascrizione in un costrutto, mentre in un altro un
disattivatore, nella stessa cellula, per vedere che effetto si ottiene.
Al C-terminale hanno coniugato 4 diverse proteine fluorescenti con 4
target diversi nel DNA, questo ha permesso di verificare se una
determinata sequenza enhancer interagisce con un’altra sequenza che si
pensava fosse il promotore target di un determinato enhancer.
Illumina
con GPF determina la sequenza che si pensa sia un enhancer e con la
yellow il target dell’enhancer, si può quindi visualizzare quando
l’enhnacer agisce con il promotore. Al C- terminale posso unire proteine
che modificano gli istoni come p300, un enzima che li fosforila o
metila, e li posso indirizzare verso le sequenze che dico io.