Dit artikel beschrijft de procedure voor de identificatie en karakterisering van de familie van een gen in grapevine toegepast aan de familie van Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitin ligases.
Indeling en naamgeving van genen in een gezin kunnen aanzienlijk bijdragen aan de beschrijving van de diversiteit van gecodeerde eiwitten en de voorspelling van familiefeesten gebaseerd op verschillende functies, zoals de aanwezigheid van reeks motieven of van bepaalde sites voor de posttranslationele wijziging en het profiel van de expressie van familieleden in verschillende omstandigheden. Dit werk beschrijft een gedetailleerd protocol voor karakterisering van de familie van het gen. Hier wordt de procedure toegepast op de karakterisatie van de familie van Arabidopsis Tóxicos in Levadura (ATL) E3 ubiquitin ligase in grapevine. De methoden omvatten de genoom-brede identificatie van familieleden, de karakterisatie van gene lokalisatie, structuur en duplicatie, de analyse van geconserveerde proteïne motieven, de voorspelling van eiwit lokalisatie en fosforylering sites, evenals gen expressie profilering over de familie in verschillende datasets. Dergelijke procedure, die kan worden verlengd tot verdere analyses afhankelijk van experimentele doeleinden, kan worden toegepast op elke gen familie in alle plantensoorten waarvoor genomic gegevens beschikbaar zijn, en biedt waardevolle informatie ter identificatie van interessante kandidaten voor functionele studies, geeft inzicht in de moleculaire mechanismen van plant aanpassing aan hun omgeving.
Tijdens het laatste decennium, veel onderzoek verricht in grapevine genomica. Grapevine is een erkende economisch relevante gewas, die uitgegroeid een model voor onderzoek op fruit ontwikkeling en op de reacties van houtige gewassen op biotische en abiotische benadrukt tot is. In deze context, de vrijlating van de soort Vitis vinifera cv. PN40024 genoom in 20071 en de bijgewerkte versie in 20112 geleid tot een snelle ophoping van ‘ Omics ‘-schaal gegevens en tot een uitbarsting van high-throughput onderzoek. Op basis van de gepubliceerde reeks gegevens, de uitgebreide analyse van een bepaald gen familie (meestal opgebouwd uit eiwitten delen van geconserveerde motieven, structurele en/of functionele gelijkenissen en evolutionaire relaties), kan nu worden uitgevoerd om bloot te zijn moleculaire functies, evolutie en gen expressieprofielen. Deze analyses kunnen bijdragen aan inzicht hoe gen gezinnen fysiologische processen op het niveau van een genoom-brede te controleren.
Veel aspecten van de levenscyclus van de plant worden geregeld door ubiquitin-gemedieerde afbraak van belangrijke eiwitten, waarvoor een verfijnd omzet om regelmatige cellulaire processen. Belangrijke onderdelen van het proces van ubiquitin-gemedieerde afbraak zijn de E3 ubiquitin ligases, die belast zijn met systeem flexibiliteit, dankzij de aanwerving van specifieke doelstellingen3. Dienovereenkomstig, vertegenwoordigen deze enzymen een enorme gen-familie, met ongeveer 1.400 E3 ligase-encoding genen voorspeld in Arabidopsis thaliana genoom4, elke E3 ubiquitin ligase handelt voor de ubiquitination van specifieke doel eiwitten. Ondanks het belang van substraat-specifieke ubiquitination in cellulaire verordening in planten, is weinig bekend over hoe het traject ubiquitination is gereguleerd en doel eiwitten zijn geïdentificeerd alleen in een paar gevallen. De ontcijfering van dergelijke mechanismen specificiteit en de verordening berust eerst op de identificatie en karakterisering van de verschillende onderdelen van het systeem, met name de E3 ligases. Onder ubiquitin ligases, wordt de ATL onderfamilie gekenmerkt door 91 leden geïdentificeerd in A. thaliana weergeven van een RING-H2 vinger domein5,6, sommigen van hen spelen een rol in de verdediging en hormoon reacties7.
De eerste cruciale stap om de leden van een nieuwe gen-familie te definiëren is de nauwkeurige definitie van de familie functies, zoals consensus motieven, sleutelgebieden en eiwit sequentie kenmerken. Inderdaad, het betrouwbare ophalen van alle gene familieleden op basis van BLAST analyse vereist enkele verplichte reeks kenmerken, in bepaalde eiwitten domeinen verantwoordelijk voor eiwit functie/activiteit, proteïne handtekening bijeenkomen. Dit kan worden vergemakkelijkt door eerdere karakterisering van hetzelfde gen gezin bij andere plantensoorten of bereikt door het analyseren van verschillende genen vermoedelijk die behoren tot dezelfde familie in verschillende plantensoorten, te isoleren van gemeenschappelijke sequenties. De familieleden kunnen vervolgens worden afzonderlijk genoemd volgens gemeenschappelijke regels geregeld door internationale consortia voor een bepaalde plantensoorten. In grapevine, bijvoorbeeld is zo’n procedure onderworpen aan de aanbevelingen van het Comité van de Super nomenclatuur voor druivenmost Gene aantekening (sNCGGa), tot oprichting van de bouw van een fylogenetische boom waaronder V. vinifera en A. thaliana familieleden van het gen dat gene annotatie gebaseerd op nucleotide sequences8.
Chromosoom lokalisatie van familieleden en gene dubbel enquête kunnen markeren van de aanwezigheid van geheel-genoom- of tandem gedupliceerde genen. Deze informatie verschijnt nuttig te ontrafelen van vermeende gene functies, aangezien het kan weergeven van functionele redundantie of verschillende situaties, dat wil zeggen, niet-functionalization, neo-functionalization of sub functionalization9 onthullen. Beide neo – en sub – functionalization zijn belangrijke gebeurtenissen die genetische nieuwheid, plant aanpassing aan veranderende omgevingen10te voorzien in de nieuwe cellulaire componenten maken. In het bijzonder, doublures van voorouderlijke genen en productie van nieuwe genen waren zeer frequent gedurende de evolutie van het genoom van de grapevine en nieuw gevormde genen afkomstig van proximale en tandem doublures in grapevine waren meer kans op produceren nieuw functies11.
Een andere belangrijke factor in het ontcijferen van de familie genfuncties is het profiel van de transcriptomic. De beschikbaarheid van openbare databanken die toegang geven tot een enorme hoeveelheid gegevens van de transcriptomic kan aldus worden benut om de vermeende functies toewijzen aan gene familieleden met behulp van grootschalige in silico expressie analyses. Inderdaad, de eigenaardige expressie van bepaalde genen in specifieke plant organen of in antwoord op bepaalde benadrukt kan geven enkele tips met betrekking tot de vermeende rol van de overeenkomstige eiwitten in welbepaalde omstandigheden, en steun geven aan hypothesen over mogelijke sub functionalization van gedupliceerde genen om verschillende uitdagingen aan. Voor dat doel, is het belangrijk om te overwegen verschillende datasets: dit kan reeds beschikbare gen expressie matrices, zoals de genoom-brede transcriptomic atlas van grapevine organen en ontwikkelingsstadia12, of ad hoc door kan worden gebouwd het ophalen van transcriptomic datasets voor de bijzondere plantensoorten onderworpen aan gedefinieerde benadrukt. Bovendien, een eenvoudige benadering met behulp van twee matrices, een met paarsgewijze gelijkenis gegevens en de andere met paarsgewijze co expressie coëfficiënten kunnen worden toegepast om te evalueren van de relaties tussen reeks gelijkenis en expressie patronen binnen de familie van een gen.
Het doel van dit werk is bedoeld als een globale aanpak, gene structuur, Geconserveerde proteïne motieven chromosomale locatie, gene duplicaties en expressiepatronen, als ook de voorspelling van eiwit lokalisatie en fosforylering sites, om te bereiken definiëren een uitputtende karakterisatie van de familie van een gen in planten. Een dergelijke aanpak is hier toegepast op de karakterisatie van de ATL E3 ubiquitin ligase familie in grapevine. Volgens de nieuwe rol van ATL onderfamilie leden bij het reguleren van de belangrijke cellulaire processen7, dit werk kan ook helpen de identificatie van sterke kandidaten voor functionele studies, en uiteindelijk het ontrafelen van de moleculaire mechanismen inzake de aanpassing van dit belangrijk gewas aan zijn omgeving.
In de genomic era, veel gene gezinnen diep gekenmerkt in verschillende plantensoorten. Deze informatie is voorafgaand aan functionele studies en bieden een kader om de rol van verschillende leden in een gezin verder te onderzoeken. In dit verband is er ook een noodzaak om een nomenclatuur systeem ter identificatie van elk lid in een gezin, het vermijden van de redundantie en de verwarring die kunnen ontstaan wanneer de namen onafhankelijk zijn toegewezen aan verschillende genen door verschillende onderzoeksgroepen.
<…The authors have nothing to disclose.
Het werk werd gesteund door de Universiteit van Verona, in het kader van gezamenlijke Project 2014 (karakterisering van de ATL gene familie in grapevine en haar betrokkenheid bij weerstand tegen Plasmopara noordelijke).
Personal computer | |||
Basic Local Alignment Search Tool (BLAST) | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
Molecular Evolutionary Genetics Analysis (MEGA) | http://www.megasoftware.net/ | ||
Motif-based sequence analysis tools (MEME) | http://meme-suite.org/ | ||
Geneious | Biomatters Limited | http://www.geneious.com/ | |
ProtParam Tool | http://web.expasy.org/protparam/ | ||
ngLOC | http://genome.unmc.edu/ngLOC/index.html | ||
TargetP v1.1 Server | http://www.cbs.dtu.dk/services/TargetP/ | ||
Protein Prowler | http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ | ||
MUsite | http://musite.sourceforge.net/ | ||
Pfam | http://pfam.xfam.org/ | ||
TMHMM Server v. 2.0 | http://www.cbs.dtu.dk/services/TMHMM/ | ||
ProtScale | http://web.expasy.org/protscale/ | ||
Grape Genome Database (CRIBI) | http://genomes.cribi.unipd.it/grape/ | ||
PhenoGram | http://visualization.ritchielab.psu.edu/phenograms/plot | ||
MCScanX | http://chibba.pgml.uga.edu/mcscan2/ | ||
Interactive Tree Of Life (iTOL) | http://itol.embl.de/ | ||
UniProt | http://www.uniprot.org/ | ||
Phylogeny.fr | http://www.phylogeny.fr/index.cgi | ||
MUSCLE | http://www.ebi.ac.uk/Tools/msa/muscle/ | ||
Gblocks Server | http://molevol.cmima.csic.es/castresana/Gblocks_server.html | ||
Vitis vinifera cv. Corvina gene expression Atlas datamatrix | https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 | ||
Multi Experiment Viewer (MeV) | http://mev.tm4.org/#/welcome | ||
Sequence Read Archive (SRA) | https://www.ncbi.nlm.nih.gov/sra | ||
R | https://www.r-project.org/ | ||
EMBOSS Needle (EMBL-EBI) | http://www.ebi.ac.uk/Tools/psa/emboss_needle/ |