PathWhiz is een uitgebreide, online traject tekenprogramma voor het genereren van biochemische en biologische pathways. Het maakt gebruik van publiek toegankelijke databanken en gemakkelijk uit te breiden paletten bestaande uit pre-getekende pathway componenten. Dit protocol beschrijft hoe u nieuwe wegen gemakkelijk op te bouwen, te repliceren en bestaande paden bewerken en verspreiden eerder getekende paden naar verschillende organismen.
PathWhiz is een webserver gebouwd om het creëren van kleurrijke, interactieve, visueel aantrekkelijke route schema's die rijk zijn aan biologische informatie zijn te vergemakkelijken. De paden die door deze online applicatie machinaal leesbaar zijn en volledig compatibel met in hoofdzaak alle webbrowsers en besturingssystemen. Het maakt gebruik van een speciaal ontwikkelde, web-enabled route tekening interface die de selectie en plaatsing van verschillende combinaties van pre-getrokken biologische of biochemische entiteiten toelaat om reacties, interacties, transportprocessen en bindende gebeurtenissen uitbeelden. Dit palet entiteiten omvat chemische verbindingen, eiwitten, nucleïnezuren, cellulaire membranen, subcellulaire structuren, weefsels en organen. Alle visuele elementen in het kan interactief worden aangepast en aangepast. Bovendien, omdat deze tool is een web-server, alle paden en pathway elementen zijn voor het publiek toegankelijk. Dit soort route "crowdsourcing" betekent dat PathWhizbevat al een grote en snel groeiende collectie van eerder getekende paden en pathway-elementen. Hier beschrijven we een protocol voor de snelle en gemakkelijke creatie van nieuwe wegen en de wijziging van de bestaande wegen. Om weg te bewerken en creatie verder te vergemakkelijken, het instrument bevat replicatie en vermeerdering functies. De replicatie functie kan bestaande wegen worden gebruikt als sjablonen maken of nieuwe wegen bewerken. De voortplanting functie maakt het mogelijk om een bestaande route te nemen en automatisch propageren het over verschillende soorten. Pathways gemaakt met deze tool kan worden "re-stijl" in verschillende formaten (KEGG-achtige of text-book dergelijke), gekleurd met verschillende achtergronden, geëxporteerd naar BioPAX, SBGN-ML, SBML of PWML gegevensuitwisseling formats, en gedownload als PNG of SVG-afbeeldingen. De paden kunnen gemakkelijk in online databases worden opgenomen, geïntegreerd in presentaties, posters en publicaties, of uitsluitend gebruikt voor online visualisatie en exploratie. dit protocol is met succes toegepast op meer dan 2.000 pad schema's, die nu zijn te vinden in vele online databases, waaronder HMDB, drugbank, SMPDB en ECMDB te genereren.
Biologische pathway diagrammen zijn als blauwdrukken voor het leven wetenschappers. Ze zijn misschien wel de meest beknopte en informatieve routes voor de beeltenis van biologische processen en de contextuele verbanden tussen genen, eiwitten en metabolieten. Dit komt omdat beelden zijn veel efficiënter verwerkt en vaak veel gemakkelijker te begrijpen door de mens dan tekst 1. De kwaliteit, detail, en de inhoud van de route schema's kan aanzienlijk variëren. Deze verschillen zijn vaak afhankelijk van de bestemming van de route en de vaardigheden van de route kunstenaar. Pathways gemaakt voor educatieve doeleinden zoals wandplaten of schoolboeken worden vaak gemaakt door professionele kunstenaars. Als gevolg van deze route diagrammen veel visueel aantrekkelijk en bieden aanzienlijk meer biologisch detail vol afbeeldingen van metaboliet structuren, subcellulaire componenten, celstructuren, weefsels en organen. Deze 'handboek' voorstellingen bevatten vaak gedetailleerde aantekeningen encommentaren. Anderzijds, weg schema ontworpen voor internettoepassingen moeten vaak kunst en visuele rijkdom offeren vóór vereenvoudigde machineleesbare "bedrading" schema. Deze wireframe diagrammen zijn gemakkelijker-imago in kaart gebracht en hyperlinks. Vereenvoudigde pathway diagrammen zijn de basis om een dergelijke populaire online pathway databases als KEGG 2, MetaCyc 3, WikiPathways 4, en Reactome 5. De opkomst van computer-compatibele pathway databases heeft ook geleid tot het ontstaan van computer-compatibele route tekengereedschappen. Met andere woorden, hoeft men niet om een professionele kunstenaar of een professionele programmeur om bruikbare route schema's te genereren. Bijvoorbeeld, BioCyc's Pathway instrumenten 6 en Wikipathway's PathVisio software 7 kunnen gebruikers vrij te genereren en te delen machine leesbare trajecten in BioPAX 8 and / of HTML-formaat. Daarnaast zijn er een aantal andere stand-alone freeware pakketten en commerciële pakketten die het genereren van verschillende machineleesbare, draadframe paden, zoals Cytoscape 9, GenMAPP 10, PathCase 11 ondersteunen en VisANT 12.
De vereenvoudiging van internet pathway diagrammen grotendeels groeide van het historische beperkingen gevonden in vele web browsers en web-based rendering hulpmiddelen. Echter, hebben aanzienlijke vooruitgang in webtechnologieën geboekt in de afgelopen jaren. Dit suggereerde dat het mogelijk zou kunnen zijn om interactieve, internet-compatibele route schema's die net zo kleurrijk zijn, net zo esthetisch en net zo biologisch compleet als die gevonden in leerboeken te genereren. Dit werk leidde tot de ontwikkeling van PathWhiz. PathWhiz werd uitgevoerd met behulp van een Ruby on Rails (http://rubyonrails.org, versie 4.2.0) web kader enk waarin een MySQL relationele database (https://www.mysql.com versie 5.1.50) om alle data weg, waaronder entiteitsrelaties, externe referenties, beschrijvingen, visualisatie specificaties en chemische structuren beheren. De front-end web client wordt gecontroleerd door Ruby on Rails, gecombineerd met Backbone.js (http://backbonejs.org, versie 1.0.0) als de front-end web framework voor de redactie.
Oorspronkelijk ontwikkeld voor de curation van het menselijk-only Small Molecule Pathway Database (SMPDB) 13, heeft PathWhiz 14 sindsdien uitgebreid tot traject generatie ondersteuning voor vele andere organismen en het functioneren van een algemeen beeld route en kennis database. In het bijzonder, deze webtool zorgt voor de creatie van het volledige scala van biochemische / biologische pathways waaronder metabolische, eiwit interacties, moleculaire signalering, fysiologische, en drugs / ziekte pathways. Deze route tekentool verschilt van de meeste anderepathway genereren gereedschappen in drie belangrijke manieren: 1) het is een webserver plaats van een stand-alone, installeerbare software; 2) ondersteunt de gemakkelijke productie en interactieve visualisatie van chemische verbindingen, eiwitten, nucleïnezuren, cellulaire membranen, subcellulaire structuren, weefsels en organen; en 3) het stelt gebruikers in staat om gemakkelijk te lenen, bouwen of verbeteren op het werk van andere gebruikers, waardoor 'crowd-sourced "pathway generatie. Als een web-server, het heeft een aantal voordelen ten opzichte van downloadbare, platform-specifieke software tools. In het bijzonder is compatibel met elk platform, besturingssysteem en moderne webbrowser. Bovendien is het niet de gebruiker zich laten registreren om te beginnen met het maken van een route (hoewel gebruikers vrij een "privé-account" kunt maken met het oog op te sporen en de controle van de toegankelijkheid van de paden die ze maken). Misschien is de meest aantrekkelijke eigenschap van dit instrument is de hoeveelheid biologische en biochemische details die gemakkelijk kunnen worden samengevoegdelke weg door een palet van vooraf gerenderde beeld en een uitgebreide database van eiwitten en biochemische data. Dit maakt het mogelijk zowel 'non-kunstenaars "en" niet-programmeurs "tot kleurrijke, esthetisch en rijk gedetailleerde routes die web-compatibel en volledig machinaal leesbaar zijn gemakkelijk te maken. Een meer gedetailleerde vergelijking tussen PathWhiz en andere route tekentools wordt gegeven in tabel 1.
Een aantal populaire life science databases hebben al gebruik gemaakt van deze route tekening tool om database-specifieke te maken, online, interactieve weg diagrammen. Bijvoorbeeld, de Escherichia coli metaboloom Database (ECMDB) 15 onlangs bijgewerkt haar pad bibliotheek met meer dan 1650 paden getekend met behulp van web-based tool. Elke route in de ECMDB wordt nu als een rijk gekleurd, volledig hyperlinkafbeelding kaart met gedetailleerde metaboliet en eiwitstructuur afbeeldingen, alsmede een vereenvoudigde zwart-wit KEGG-like draad diagram. Deze grootschalige route bijwerken geleid tot de ontdekking van vele intermediaire metabolieten die niet eerder in andere Escherichia coli metabolische databases. Andere databases, zoals Human metabolome Database (HMDB) 15 niet alleen afhankelijk PathWhiz trajecten af te beelden en te beschrijven metabole en signaalwegen, maar ook voor de metabole veranderingen die betrokken zijn bij ziekten zoals kanker tonen. HMDB omvat momenteel 101 metabole routes, 376 drug actie paden, 233 ziekte-geassocieerde paden en 16 signaalwegen, alle gegenereerde via deze webtool.
Het volgende protocol gedetailleerde beschrijving PathWhiz kan worden gebruikt om eenvoudig, repliceren en propageren biochemische wegen voor verschillende doeleinden en toepassingen.
De hier beschreven voor het instellen van eenvoudige metabole route (de TCA cyclus) protocol kan worden aangepast aan diverse machineleesbare biologisch complexe wegen voor elke soort te creëren. Bovendien is dit protocol beschrijft ook hoe men kan repliceren of propageren bestaande paden die door andere gebruikers. Het construeren van een route met deze functie vereist herhaalde stap voor stap toevoegingen reacties, interacties transportprocessen en sub-trajecten, die elk zijn verbonden door overlappende elementen. Putting al deze bij elkaar maakt het mogelijk om kleurrijke, visueel aantrekkelijke route schema's die aanzienlijke biologische detail en bruikbare biologische context te bieden te creëren. De in dit protocol beschreven stappen zijn relatief eenvoudig, en de tijd die nodig is om een weg diagram bouwen afhankelijk van de grootte en complexiteit van het pad. Met een beetje oefening, kunnen de meeste mensen een hoge kwaliteit pad diagram maken die bestaat uit ongeveer 15-20 reacties of processen eend verschillende cellulaire componenten in ongeveer 15 minuten. Een gloednieuwe gebruiker kan tot 30-40 min naar een route van vergelijkbare omvang en complexiteit te genereren. De tijd nodig om een route te genereren is ongeveer lineair met het aantal reacties / processen die moeten worden gemaakt.
Het creëren van een hoge kwaliteit route via deze web-based tool is afhankelijk van de kwaliteit en de gedetailleerdheid van het bronmateriaal (pathways uit boeken, online databanken, experimentele gegevens, handgetekende schetsen) en de veeleisendheid van het pad "artiest". Degenen die voor het genereren van een hogere kwaliteit pad schema's moet bijzondere aandacht besteden aan secties 1.11, 1.15 en 1.20 van het protocol, aangezien deze delen beschrijven het creëren en bewerken van de reactie-elementen (reagentia / producten, enzymen, randen, afbeeldingen, zoom dozen, etiketten, en membranen). De beste route schema zal op intelligente wijze samensmelten informatie van zo veel van de bestaande voorstellingen van de route mogelijk met inbegrip van die gevonden in books, posters, kranten en online databases. Een andere sleutel tot het genereren van kwalitatief hoogwaardige trajecten is zorgvuldig controleren van de juistheid van de reacties voordat u een reactie (door middel van artikel 1.11 van het protocol). Van tijd en moeite doen om de reactanten, producten en enzymen die betrokken zijn (waarvan vele in PathWhiz de grote database bestaan) worden bij welke soort is erg belangrijk. Het is ook belangrijk te weten of de cellulaire lokalisatie van de reacties en belangrijke cellulaire of subcellulaire componenten bevatten om de correcte biologische context te verschaffen. Dit kan worden gedaan door het controleren en bevestigende de reactie door middel van online databases zoals UniProt. Het hebben van alle benodigde informatie bij de hand, samen met een ruwe, handgetekende schets van de route te creëren zal fouten sterk verminderen en de totale tijd besteed aan tekening of rendering.
Zoals te verwachten, zullen grotere en complexere trajecten langer duren, partic renderengoed vast als de gewenste elementen en processen zijn nog niet in PathWhiz de databank. Bij het werken met grote wegen, is het meestal verstandig het automatisch opslaan over te schakelen naar de handmatige modus, teneinde een lange vertraging tussen acties te voorkomen. Wanneer repliceren een pad, de hoeveelheid tijd die de gebruiker kan wachten tot de route te genereren afhankelijk van het aantal elementen in de route. De meeste trajecten kan worden gerepliceerd in ongeveer 1-2 minuten. Wanneer het propageren van een pad, succesvolle weergave van de nieuw gepropageerd traject hangt af van hoe sterk de twee soorten zijn, zoals PathWhiz gebruikt BLAST 17 sequentie zoekt om homologe enzymen tussen soorten te vinden. Grotere trajecten zal langzamer voortplanten omdat BLAST moeten worden uitgevoerd op een groter aantal enzymen. Proberen trajecten tussen ongelijksoortige aanzienlijk soorten voortplanten (bijvoorbeeld tussen gist en mensen) leiden tot pathways worden gemaakt met een aantal onbekende eiwitten. Deze "verre" propagated trajecten zal het meestal noodzakelijk extra handmatige bewerking. Als gevolg van de sterk visuele karakter van de route schema's en de details die naar een pad kan worden gebracht, is het altijd een goed idee om te werken op een computer met een redelijk groot scherm (> 20 inches of> 50 cm) en een goede internet verbinding (> 5 mbps).
Als er problemen met het teruggeven of het scherm verfrissende worden aangetroffen, kan de gebruiker een kleine hoeveelheid van het oplossen van problemen te doen. Als een groot, complex traject te lang duurt om te werken, kan de gebruiker naar de pagina te vernieuwen. Als een route niet voortplanten zoals verwacht, kan de gebruiker moet een aantal handmatige bewerking doen om alle elementen correct worden weergegeven. Ook, als een meer specifiek voorbeeld, als elementen van een reactie niet worden weergegeven, kan de gebruiker moet ervoor zorgen dat alle elementen of enzymen goed worden geselecteerd en de randen zijn niet verborgen. De "Help" link op de belangrijkste header kan handig zijn als een probleem wordt aangetroffen. Een tutorial isbeschikbaar onder de tab 'Tutorial' en een handleiding is beschikbaar onder de tab "User Guides". Beide verklaren veel van de functies van het gereedschap in detail. De handleiding mag worden gebruikt om de mogelijke beperkingen voor een bepaalde functie, bijvoorbeeld wanneer een gebruiker een pad sloten te lossen of uit te leggen en later wil om het te bewerken.
Zoals wordt benadrukt door dit protocol en door de in de bijgaande figuren voorbeelden, deze tool biedt een aantal unieke functies die niet in een (of de meeste) andere route tekentools (zie tabel 1). Ten eerste is volledig web based en volledig platformonafhankelijk. Ten tweede ondersteunt de rendering en gemakkelijke generatie multicolored, biologisch complex, visueel aantrekkelijk, volledig hyperlink traject diagrammen die ook kan worden omgezet in machineleesbare formaten (BioPAX, SBGN-ML 18, SBML 19, PWML 14). Ten derde, weg diagrammen generated door deze tool kan worden bekeken, doorzocht, geselecteerd en gemakkelijk onderzocht door middel van een eenvoudig te gebruiken online database en het bekijken van interface. Ten vierde, is de webtool ontwikkeld om de gemeenschap pathway bijdragen te ondersteunen, waardoor voor "pathway crowdsourcing 'dat het delen en het genereren van nieuwe wegen en nieuwe route elementen stimuleert.
Pathways die door deze webhulpprogramma kan worden gebruikt voor verschillende toepassingen. Rijk gedetailleerd, volledig hyperlink trajecten kan gemakkelijk worden geïntegreerd in organisme-specifieke databases voor proteomics, metabolomics en systeembiologie applicaties. Internet-toegankelijke paden zijn vooral handig voor het onderwijs en de beroepsopleiding, als die beschikbaar zijn via het web gebaseerde beelden details zijn vaak veel groter dan wat via een statische afbeelding of door middel van een enkel boek of tijdschrift pagina kan worden weergegeven. Deze web-based tool ondersteunt ook de generatie van de route voorstellingen die meer geschikt is voor het drukken en de publicatie zijn.Als gevolg hiervan, veel beelden die door deze web-based tool verschijnen in kranten, posters en diapresentaties. Exporteren trajecten in tekst-gebaseerde data-uitwisseling bestandsformaten (zoals BioPAX en SBML) zorgt voor paden gegenereerd met behulp van deze web-server rechtstreeks in geautomatiseerde analyse moet worden gebruikt voor systeembiologie en metabole modellen toepassingen. Het uitdragen van paden tussen soorten maakt gevolgtrekkingen worden gemaakt over biologische processen, vooral onder die soorten die zeer recent zijn gesequenced. Hoewel niet alle bestaande trajecten bestaan momenteel in PathWhiz, de openbare weg-database blijft groeien, wat leidt tot de opkomst van nieuwe, crowd-sourced pathway collecties. Deze collecties zal niet alleen gemakkelijk uit te breiden tot nieuwe soorten zijn, ze zullen hopelijk leiden tot een beter begrip van hun unieke biologie en biochemie.
The authors have nothing to disclose.
De auteurs willen bedanken de Canadese Institutes of Health Research (CIHR) en Genome Alberta, een divisie van Genome Canada, voor financiële steun.
Computer with colour screen | N/A | N/A | >20 inches or >50 cm |
Internet connection | N/A | N/A | >5 mbps |
Modern web browser | N/A | N/A | Google Chrome (v. 31 and above), Internet Explorer (v. 9 and above), Safari (v. 7 and above), Opera (v. 15 and above) and Firefox (v. 23 and above) |