Summary

Fenómica fagos: enfoques fisiológicos para caracterizar Novela Virales Proteínas

Published: June 11, 2015
doi:

Summary

Here, we present phenomic approaches for the functional characterization of putative phage genes. Techniques include a developed assay capable of monitoring host anabolic metabolism, the Multi-phenotype Assay Plates (MAPs), in addition to the established method of metabolomics, capable of measuring effects to catabolic metabolism.

Abstract

Las investigaciones actuales en las interacciones huésped-fago dependen de extrapolar el conocimiento de (meta) genomas. Curiosamente, el 60 – 95% de todas las secuencias de fagos no comparten ninguna homología con proteínas anotado actuales. Como resultado, una gran proporción de genes de fagos anotados como hipotético. Esta realidad afecta en gran medida la anotación de ambos genes metabólicos estructurales y auxiliares. Aquí presentamos métodos Phenomic diseñados para capturar la respuesta (s) fisiológica de un host seleccionado durante la expresión de uno de estos genes de fagos desconocidos. Multi-fenotipo placas de ensayo (mapas) se utilizan para controlar la diversidad de la utilización de sustratos de acogida y formación de la biomasa posterior, mientras que la metabolómica proporciona un análisis bi-producto mediante el control de la abundancia metabolito y la diversidad. Ambas herramientas se utilizan simultáneamente para proporcionar un perfil fenotípico asociado con la expresión de un marco de lectura abierto putativo fago individual (ORF). Los resultados representativos para ambos métodos se comparan, highlighting las diferencias fenotípicas perfil de un anfitrión que lleva ya sea putativos genes de fagos estructurales o metabólicas. Además, se presentan las técnicas de visualización y de alto rendimiento tuberías computacionales que facilitan el análisis experimental.

Introduction

Se estiman virus que infectan bacterias (bacteriófagos o fagos aka) de existir en más de 10 31 partículas similares a virus (VLPs) a nivel mundial y superan en número a todos los otros organismos en un entorno de 1,2. El primer estudio metagenómica investigar las comunidades virales asociados a ambientes marinos se centró en la cuantificación de la diversidad visto dentro de la fracción viral 3. Además, Breitbart y sus colegas encontraron que más del 65% de las secuencias virales de la comunidad compartió ninguna homología con cualquier secuencias disponibles en bases de datos públicas. Estudios de metagenómica posteriores encontraron pruebas similares: metagenomes de sedimentos marinos en San Diego, California contienen 75% de secuencias virales desconocidas 4; metagenomes de lagos hipersalinos del Mar Salton contienen 98% de secuencias virales desconocidas 5; y metagenomes coral asociadas contienen 95-98% secuencias virales desconocidas 6. Esta acumulación de información unannotated ha dado lugar amaterial genético del fago ser "la materia oscura del universo biológico" 7.

Caracterización genómica de fago se basa en la identificación de similitud de secuencia a través de la comparación con bases de datos de ácidos nucleicos y proteínas existentes. Debido a que la información genética del fago codificada es predominantemente desconocido, los métodos basados ​​en homología son ineficaces. Dentro de su genoma, fagos normalmente codifican tres principales tipos de genes: transcripción y replicación de genes, genes metabólicos, y los genes estructurales. Los genes de transcripción y replicación (clase I / II genes 8) incluyen polimerasas, primasas, endo / exo-nucleasas, y quinasas. Estos genes están muy conservadas debido a su importancia en la infección por fagos, transcribir y replicar material genético del fago. Polimerasas de fagos se identifican fácilmente usando métodos de homología de secuencia tradicionales debido a su conservación global 9 y se ha demostrado para servir como marcadores filogenéticos eficaces 10.Por el contrario, metabólicas fago y los genes estructurales (clase II / III genes 8) son cada vez más divergentes ya menudo anotada como genes hipotéticos.

Genes metabólicos fagos afectan la capacidad metabólica del huésped y no se requieren necesariamente para la replicación viral. Estos genes, a menudo denominados genes metabólicos como auxiliares 11 (AMG), parecen modular el metabolismo de acogida y permitir la progresión óptima de la infección y el éxito de la maduración del virión. AMG se han asociado con la utilización y absorción de nutrientes limitantes o en vías de producción de energía. Algunos ejemplos incluyen genes fotosistema se encuentran en los genomas de diversos cyanophage 12-16, genes conectados a y regulados por el metabolismo del fosfato 17,18, y la utilización de la vía de las pentosas fosfato para la biosíntesis de dNTP fago 18,19. En comparación, los genes estructurales se encuentran entre los mediados a finales de los genes producidos durante la infección y varía en los diferentes fago-hosistemas st. La producción de proteínas estructurales dependen de la disponibilidad de dNTP viral, y las piscinas de energía para su transcripción, traducción y montaje 8. Las proteínas de la cápside y fibra cola estructural se considera como la más divergente de todos los genes que codifican proteínas virales y son necesarios para la producción de viriones éxito. Su divergencia se suele atribuir al papel activo que desempeñan en la conformación de la coevolución virus-huésped 20. Proteínas divergentes, independientemente de la clase de genes, se pasan por alto fácilmente cuando se utilizan técnicas de homología y la secuencia de alineación tradicionales. Un esfuerzo para corregir las limitaciones observadas con estrictas comparaciones de secuencias ha resultado en herramientas bioinformáticas capaces de utilizar características de secuencia para determinar asociación, tales como redes neuronales artificiales 21. Redes neuronales artificiales (RNA) permitir la predicción de genes estructurales y metabólicas, sin embargo, requieren la validación experimental de aguas abajo para caracterizar directamentela función del gen.

El objetivo de este manuscrito es proporcionar protocolos phenomic capaces de controlar tanto el metabolismo catabólico y anabólico de una bacteria huésped durante la expresión de un nuevo gen de fago, predijo funcionalmente a través de RNAs. El campo de la fenómica, la biología asociado con fenotipos celulares, está bien establecida en la biología de sistemas para ayudar en la investigación de proteínas con función desconocida o pleiotrópicos. Herramientas Phenomic se utilizan para vincular la información fenotípica a la información genotípica. Nuestra hipótesis de los genes putativos de fagos que su función (s) se puede determinar a través de la observación de los efectos fisiológicos de acogida durante la expresión de genes del fago. Para investigar esta hipótesis, se seleccionaron dos métodos cuantitativos. Las placas de ensayo Multi-fenotipo (mapas) se usaron para supervisar la utilización de sustrato huésped y la subsiguiente formación de la biomasa mientras que la metabolómica midieron diversidad metabolito anfitrión y abundancia relativa durante el crecimiento en environ específicacondiciones mentales. Proteínas estructurales y metabólicas putativos se sobreexpresa en Escherichia coli y resultados representativos de ambos experimentos se comparan. Se presentan numerosas técnicas visuales y tuberías de procesamiento de alto rendimiento para facilitar la replicación experimental. Por último, la reproducibilidad y exactitud de los métodos presentados se discuten en el contexto de efectos fisiológicos esperados para una proteína de la cápside y anotada proteína metabólica fago, tiorredoxina, además de dos AMGs putativos.

Protocol

1. Preparación de la Multi-fenotipo Ensayo Plate (MAP) Sustratos, Basal Media, Pre-crecimiento Media y Buffer Hacer 50 ml de 1,0 a 1,25% en acciones de sustrato. Disolver 1,0 a 1,25% (w / v) de sustrato sólido en agua estéril (calor si es necesario). Filtra esterilizar soluciones con una unidad de filtro de 0,22 micras y las existencias del almacén a temperatura ambiente. Ejemplos de sustratos utilizados en estos experimentos se proporcionan en la Tabla 2. Hacer 250 ml de medio basal 3x para todas las clases de sustrato (carbono, nitrógeno, azufre y fósforo). Los MOPS (3-morfolinopropano-1-sulfonato) medios basales basadas 22 contiene lo siguiente: 1x MOPS (MOPS 40 mM + 10 mM tricina), 0,4% de glicerol *, 9,5 mM NH 4 Cl *, 0,25 mM NaSO 4 *, 1,0 mM MgSO 4 *, 1.32 mM K 2 HPO 4 *, 10 mM de KCl, 0,5 mM CaCl 2, NaCl 5 mM, 6 M FeCl 3, y 0,1% (w / v) L-arabinosa ** (Tablas 1 y 2) . Nota: * Estos compuestos no se incluyen en función de los medios de comunicación basal. Por ejemplo, 0,4% de glicerol no se utiliza en los medios basales de carbono y el azufre en medios basales 1,0 mM MgSO 4 se sustituye por 1,0 mM de MgCl 2. ** L-arabinosa es específico para la inducción de promotor pBAD vector, pEMB11, que se transformó en un ara – E. coli K-12 cepa (BW 27 784) 23. Añadir cada componente de los medios de comunicación basal a un matraz estéril y traer solución a volumen. Mezclar bien. Con una unidad de filtro de 0,22 micras, cada filtro esterilizar medios basales en un frasco estéril. Hacer 500 ml de medio MOPS pre-crecimiento. MOPS basada medios pre-crecimiento 22 contiene lo siguiente: 1x MOPS (MOPS 40 mM + mM Tricina 10), 0,4% de glicerol, 9,5 mM NH 4 Cl, 0,25 mM NaSO4, 1,0 mM MgSO 4, 1,32 mM de K 2 HPO 4, mM KCl 10, 0,5 mM CaCl 2, NaCl 5 mM, y 6 M FeCl 3. Agregue cadacomponente de los medios de comunicación antes de un crecimiento a un matraz estéril y llevar a volumen. Filtro de esterilizar con una unidad de filtro de 0,22 m, a continuación, añadir ampicilina a una concentración final de 100 mg / ml. Solución de tienda a 4 ° C. Hacer 500 ml de 0.5x Luria-Bertani (LB) placas de agar. A un matraz estéril, añadir componentes LB para hacer una concentración 0.5x (1.25 g de extracto de levadura, 2,5 g de NaCl, 2,5 g de triptona, 7,5 g de agar). Mezclar bien y autoclave para esterilizar. Enfriar el agar, a continuación, añadir 100 mg / ml de antibiótico ampicilina con mezcla. Vierta ~ 25 ml de agar en placas de Petri, permitirá establecer, y se almacena a 4 ° C hasta que se necesite. Hacer 250 ml de Tris 10 mM (pH 7,4) más 10 mM solución tampón MgSO 4. Filtrar esterilizar con una unidad de 0,22 micras filtro, y la solución se almacena a temperatura ambiente. 2. Preparación de la suspensión bacteriana Cell- Preparar colonias frescas. Desde un 12,5% de glicerol congelado, plato fresco E. coli clones sobre agar LB que contenía 0,5 x 100 g / ml de ampicilina. Se incuba a 37 ° C durante 24 horas. Preparar cultivos líquidos: Pipeta 3 ml de medio de pre-crecimiento que contienen 100 mg / ml de ampicilina en tubos de cultivo. Para cada clon, utilice triplicados biológicos. Se inoculan colonias independientes de la sección 2.1 en tubos de cultivo preparados. Incubar a 37 ° C con agitación durante 22 hr. Pellet y lavar las células bacterianas: Transferencia O / N culturas en 1,7 ml tubos de microcentrífuga. Precipitar las células por centrifugación a la velocidad máxima (16.900 xg) durante 2 min en una microcentrífuga. Decantar el sobrenadante y lavar las células mediante re-suspensión en 500 l de 10 mM Tris / 10 mM MgSO tampón 4. Repetir. Re-pellets de células, Decantar el sobrenadante y re-suspender las células en 1 ml de 10 mM Tris / 10 mM MgSO tampón 4. Medir la densidad celular y concentrar células (si es necesario): Diluir las células de la sección 2.3.3 10 veces enel mM Tris 10/10 mM MgSO4 búfer y transferir esta dilución en una cubeta. Medir la densidad óptica (DO 600 nm) de esta dilución y registro. Concéntrese células para alcanzar una concentración final de 0,07 (OD 600 nm) en los mapas (las células se diluyeron 15 veces cuando se añaden a los mapas, por lo tanto, las células necesitan estar en una concentración inicial de OD 600 nm = 1,05). Traslado suspensión celular concentrada en un depósito y guardar (a temperatura ambiente) hasta el paso 3.5 de la preparación de mapas. 3. Preparación de placas de ensayo Multi-fenotipo (MAP) Etiquetar MAP. Label estériles placas de 96 pocillos de microtitulación con una E. número de identificación del clon coli y MAP tipo esquemático. Alícuota de agua estéril en MAP. Transferencia de agua estéril asépticamente en un depósito de líquido. Pipetear 60 l en cada pocillo de la placa de microtitulación usando una pipeta multicanal. Alícuota medios basales into mapas. Transferencia asépticamente 3x medios basales en un depósito de líquido. Pipetear 50 l en cada pocillo de la placa de microtitulación usando una pipeta multicanal. Repita los pasos 3.2 y 3.3 para cada medio basales utilizados en el esquema MAP. Sustratos alícuotas en mapas. Transferir 30 l de cada sustrato en el pozo adecuado de los mapas. Añadir suspensión bacteriana a los mapas. Transferencia de 10 l de células bacterianas de la sección 2.4.2 en cada pocillo de la MAP con una pipeta multicanal. Cambie consejos antes de volver a introducir la pipeta de nuevo en el cultivo madre. Mapas cubren con película adhesiva. Cubrir cada plato con una sola película placa adhesiva. Presione firmemente la película encima de los pocillos de la placa ya lo largo de los bordes para crear un sello uniforme y firme. Eliminar el exceso de película de los bordes de la placa de microtitulación con una cuchilla de afeitar estéril. Medir la densidad óptica de los mapas: Coloque mapas preparados en el manguito "de entrada" de un espectrofotómetro de placas múltipleslector de placas fotómetro. Software de lector de placas Abrir y crear un protocolo que mide la absorbancia (OD 600 nm) cada 30 minutos, para un total de 32 horas, con 60 segundos de agitación entre lecturas. Ajuste la temperatura en el aparato a 37 ° C. Iniciar protocolo vez mapas tienen equilibrada para ajustar la temperatura. Después de 32 horas, eliminar mapas de la manga de "salida" del lector de placas. Etiqueta de cada archivo de texto de datos para incluir: la E. número de identificación del clon coli, fecha en que el MAPA corrió, y el tipo esquemático MAP. 4. Multi-fenotipo placas de ensayo (MAP) Procesamiento y parametrización Evaluar las curvas de crecimiento utilizando un proceso de control de calidad automatizado, por ejemplo, PMAnalyzer 24. Verifique que las curvas de crecimiento tienen OD 600 nm <0,20 en el primero de 2 horas. No utilice la absorbancia en el punto de tiempo inicial (t 0) en el filtro debido a los artefactos de condensación, que típicamente se resuelven ent 1 (30 min). Retire las curvas de crecimiento que violan filtro de control de calidad. Guardar información curva (nombre de la muestra, así, el número y OD 600 valores nm) en un archivo de salida independiente para referencia futura. Continuar con el análisis de si la curva de crecimiento pasa el filtro de control de calidad. Calcular la mediana de las curvas de crecimiento. Uso de replicar los datos, por pocillo, calcular la curva de crecimiento mediana tomando la densidad óptica media (OD 600 nm) valor en cada punto de tiempo. Record resultante curvas de crecimiento medianas en un archivo de salida independiente para uso futuro. Calcular el modelo logístico de mejor ajuste para cada curva de crecimiento utilizando una adaptación de la ecuación propuesta por Zwietering 25. La ecuación logística incluye tres parámetros que describen el crecimiento bacteriano: el tiempo de retardo, λ (h), la tasa máxima de crecimiento, μ max (OD 600 nm 100 -1), y el rendimiento de biomasa final, α (OD 600 nm). Utilizar los datos en el tiempo = 30 min (Y 1) como el valor inicial debido a los artefactos de la condensación. [1] Calcular la tasa de crecimiento máxima mediante una búsqueda directa. Anote la mayor tasa de cambio a lo largo de un intervalo de 90 minutos dentro de los datos. [2] Estimar el rendimiento de biomasa final mediante la búsqueda para el valor asintótico superior de la media móvil más grande sobre una ventana de 90 min. Específicamente, definir como la asíntota de la curva de crecimiento. [3] Uso de la A valores de 4.3.1 y 4.3.2 max μ y, encontrar el valor λ por tratar todos los valores de λ: [4] Use cada valor de λ para calcular una suma de errores cuadrados (SSE). Utilice el más bajo SSE es la SSE (λS): /files/ftp_upload/52854/52854eq5.jpg "/> [5] 5. Fenotipo Análisis de MAP Calcule el nivel de crecimiento (GL) para cada curva de crecimiento para evaluar el crecimiento global por clon por sustrato. Definir GL como la media armónica de los valores logísticos equipado desplazado: [6] Asignar un fenotipo a cada curva de crecimiento basado en los valores GL. Aquí, los cuatro fenotipos utilizados son: crecimiento esperado, no hay crecimiento, ganancia de función y pérdida de función. Determinar fenotipos comparando el crecimiento en todos los clones en un sustrato específico en términos de desviaciones estándar lejos de la media. Utilice esta estadística y un umbral mínimo de crecimiento para designar el fenotipo presentado por la curva de crecimiento (Figura 1 A, B). Figura 1C proporciona ejemplos de asignación de fenotipo. Definir el crecimiento como GL ≥ 0,4 (Figure 1A, B). Definir ganancia de función (Figura 1C, verde) como tener un GL> dos desviaciones estándar por encima de la media y una media> del umbral de crecimiento. La pérdida de la función (Figura 1C, rojo) se define como tener un GL <dos desviaciones estándar por debajo de la media y una media> el umbral de crecimiento. Crear representaciones visuales de la serie de datos sobre la base de fenotipos y curvas de crecimiento. Ver dinámica de crecimiento que retratan OD 600 nm valores como el color para comparar rápidamente las curvas de crecimiento entre varios clones (Figura 2). Ver distribuciones fenotípicas entre todos los clones sobre la base de las condiciones de crecimiento (Figura 3). 6. Construir el aparato de cultivo continuo Construcción de puertos Reactor (Figura 4A, B). Perforar tres 1/4 pulg. Agujeros, separados 3/4 pulg. De distancia, en la tapa del reactor de cultivo continuo. Foα portuarias r: tornillo un panel estilo rosca luer hembra de montaje de 1/16 en la lengüeta de la parte inferior de la tapa con la lengüeta hacia arriba, fuera de la tapa.. Púa seguro con un 1/4 pulg. De montaje en panel tuerca de seguridad. Para β puerto: atornillar un panel estilo rosca luer hembra de montaje de 1/16 de púa con la lengüeta hacia arriba, fuera de la tapa.. Púa seguro con un 1/4 pulg. De montaje en panel tuerca de seguridad. Para γ puerto: Tornillo un panel estilo rosca luer hembra de montaje de 1/16 en la lengüeta de la parte inferior de la tapa de modo que la lengüeta esté apuntando hacia arriba, fuera de la tapa.. Púa seguro con 1/4 pulg. De montaje en panel tuerca de seguridad. Atornille un luer macho con anillo de cierre integral de 1/8 pulg. Manguera de gran diámetro para el montaje en el interior de la tapa de la lengüeta. Para el puerto de salida: perforar un 5/16 en el agujero en la marca de 75 ml del reactor cultivo continuo.. Cortar 3/4 pulg. Del extremo de la tuerca de 1/4 pulg. De montaje mamparo de púas. Enroscar el cuarto en. Mamparo apropiado de púas (junta está en el exterior de la botella y la tuerca está en el interior, Figura 4B). Alimentar la construcción de puertos botella (Figura 4C). Taladre dos 1/4 pulg. Agujeros espaciados 1 pulg. De separación, en la tapa de la botella de alimentación. Para el puerto de δ: atornillar un panel estilo rosca luer hembra de montaje de 1/8 en la lengüeta con la lengüeta hacia arriba, fuera de la tapa.. Púa seguro con un 1/4 pulg. De montaje en panel tuerca de seguridad. Para el puerto de ε: atornillar un panel estilo rosca luer hembra de montaje de 1/16 de púa con la lengüeta hacia arriba, fuera de la tapa.. Púa seguro con un 1/4 pulg. De montaje en panel tuerca de seguridad. Atornille un luer macho con anillo de cierre integral de 1/8 pulg. Manguera de gran calibre a la lengüeta de ajuste, en el interior de la tapa. Alimentar tubos y extensiones de tubo: Corte dos 1 en. Piezas de tubo (1/8 pulg. De diámetro exterior (OD) x 1/16 pulg. De diámetro interior (ID)). Piezas que quepan en los puertos α y γ del reactor cultivo continuo hechas en el apartado 5.2. Cortar un solo 1 en. Trozo de tubing (1/4 pulg. OD x 1/8 pulg. ID). Pieza Fit en Β puerto del reactor cultivo continuo. Cortar un solo 3,5 pulg. Trozo de tubo (1/8 pulg. OD x 1/16 pulg. ID). Coloque esta pieza en el interior de γ portuarias, en el luer macho con anillo de seguridad integral de 1/8 pulg. Manguera de diámetro ancho. Puerto γ es el puerto de muestreo del reactor de cultivo continuo. Cortar un solo 1 en. Trozo de tubo (1/4 pulg. OD x 1/8 pulg. ID). Coloque esta pieza en el puerto δ del biberón. Cortar una sola 11 pulg. Trozo de tubo (1/16 pulg. OD x 1/8 pulg. ID). Coloque esta pieza en el interior de ε puerto del biberón, en el luer macho con anillo de seguridad integral de 1/8 pulg. Manguera de diámetro ancho. Corte dos 18 en. Piezas de tubo (1/8 pulg. OD x 1/16 pulg. ID). Coloque una pieza al puerto ε del biberón. Guarde la otra pieza de la sección 7. 7. Ejecución de las Culturas continuos para Metabolómica Esterilizar materiales: Autoclave los materiales secos para 30 min. Asegúrese de envolver tapa de la botella de alimentación hecha en el apartado 5 en papel de aluminio. Mantenga adjunta recta tubo. Envuelva casquillo del reactor cultivo continuo, realizado en la sección 5, en papel de aluminio. Mantenga adjunta recta tubo. Envuelva en 18. Corte de tubos en la sección 6.3.5 y el más pequeño adaptador de tubo de la bomba peristáltica en papel de aluminio. Mantenga recta tubo. Autoclave en 30 min. Hacer 2 l de caldo LB 0.5x. En el biberón, hacer 0.5x caldo LB. Cubra con papel de la alimentación con biberón. Autoclave en 1 hr. Hacer 70 ml de caldo LB 0.5x. Verter el caldo en el reactor de cultivo continuo. Coloque una barra de agitación en el reactor de cultivo continuo. Cubrir con papel de aluminio y reactor autoclave durante 30 min. Cultura continua puesta a punto: Suspensión de células bacterianas. Desde un 12,5% de glicerol congelado, plato fresco E. clones de E. coli en agar LB que contenía 0,5 x 100 g / ml de ampicilina. Incubara 37 ° C durante 24 horas. Inocular una sola colonia en 3 ml de caldo LB que contienen 100 0.5x mu g / ml de ampicilina. Para cada clon utilizar triplicados biológicos. Incubar a 37 ° C con agitación durante 22 hr. Conecte las piezas juntas. Coloque todos los materiales en autoclave en una cabina de seguridad biológica y encienda la luz ultravioleta mientras los medios de comunicación se enfría. Una vez que los medios de comunicación se ha enfriado, añadir 0,1% de L-arabinosa y 100 mg / ml de ampicilina a todos caldo LB 0.5x. Separar continua casquillo reactor cultura y el tornillo en el reactor. Evite tocar el tubo de muestreo. Separar la tapa de la botella de alimentación y el tornillo en el biberón. Evite tocar el tubo de muestreo. Mantenga el 18 en. Tubo conectado a ε estéril puerto. Un-envolver el 18 pulg. Tubo y adaptador de tubo de la bomba peristáltica. Coloque un extremo libre del 18 pulg. Tubo en un extremo del adaptador de tubo de la bomba peristáltica. Coloque el otro extremo del adaptador de tubo de la bomba peristáltica parael tubo de 18 pulg. conectado al puerto ε del tapón de la botella de alimentación. Tornillo 0,22 micras unidades de filtro en los puertos β y δ del reactor cultivo continuo. Tornillo de una unidad de filtro de 0,22 micras en el adaptador de puerto α. Para la unidad de filtro de 0,22 micras, encajar el extremo libre de la 18 en la tubería.. Inicie el cultivo continuo. En la campana de bioseguridad, inocular el reactor de cultivo continuo con 100 l de la cultura O / N hechas en el apartado 7.2.1.1. Cerrar sistema antes de mover el cultivo continuo en una incubadora a 37 °. En la incubadora tienen una placa de agitación magnética y mini bomba peristáltica establecieron. Montar el tubo de la bomba peristáltica adaptador en la bomba peristáltica. Tubería de la botella de alimentación comienza en la "A" lado y la tubería que conduce al reactor comienza en el lado "Out". Ajuste la bomba peristáltica a: "FAST". Arranque la bomba peristáltica por el cambio a R20; ADELANTE ". Compruebe que los medios de comunicación comienza a fluir a través del tubo. Coloque reactor en la placa de agitación magnética y comenzar a mezclar. Reactor de cultivo continuo debe equilibrar durante 24 horas antes del muestreo. El muestreo de la cultura continua. Atornille a 5 ml jeringa luer lok en γ portuarias y tire hacia arriba 4,5 ml de cultivo. Utilice 500 l de la cultura para medir la densidad (OD 600 nm). Diluir las células para hacer 4 x 1 ml de cultivos en OD 600 nm = 0,35. Alícuota diluida culturas en 1,7 ml tubos de microcentrífuga. Repetir el muestreo cada 12 horas durante 4 días. Preparar muestras para GC-TOFMS: Células de pellets a través de centrifugación a velocidad máxima (16.900 xg) durante 2 min. Decantar el sobrenadante. Lavar las células con 500 l de tampón fosfato salino (PBS). Repita este paso. Decantar el supernadante por última vez, y luego sumergir tubos de microcentrífuga con células sedimentadas en nitrógeno líquido hasta burbujeante paradas. Srasgó muestras en -80 ° C congelador. 8. Ejecución de las Culturas lotes paso en serie de Metabolómica Preparación de suspensión celular bacteriana. Desde un 12,5% de glicerol congelado, plato fresco E. coli clones en agar LB que contenían 0,5 x 100 g / ml ampicilina. Se incuba a 37 ° C durante 24 horas. Inocular las colonias individuales en 3 ml de caldo LB que contenía 0,5 x 100 g / ml ampicilina. Utilice triplicado biológicos para cada clon. Cultivos discontinuos de paso de serie. Subcultivo O / N a partir de 8.1.1 a través de una dilución de 500 veces en 3 ml de caldo LB que contenía 50 mg / ml de ampicilina y 0,1% de L-arabinosa. Subcultura debe tener una DO 600 nm <0,005. Se incuba a 37 ° C con agitación. Compruebe densidad óptica (OD 600 nm) a los 2 y 2,5 hr. Crecer células para lograr OD 600 nm = 0,35. Subcultura a través de un 500 veces dilución en 3 ml de caldo LB que contenía 50 mg / ml de ampicilina y 0,1% de L-arabinosa. Subcultura debe tener una DO 600 nm <0,005. Compruebe densidad óptica (OD 600 nm) a los 2 y 2,5 hr. Crecer células para lograr OD 600 nm = 0,35. Muestreo cultivos discontinuos de paso de serie. El uso de pinzas estériles, coloque un filtro de 0,22 micras de membrana en la parte superior de un colector del filtro. Alícuota 1 ml de tampón fosfato salino (PBS) sobre el papel de filtro y luego encienda la bomba de vacío. Repita adición de 1 ml de PBS. Transferir 1 ml de la subcultura de la sección 8.2.3 sobre el papel de filtro. Desde aquí, actuar con rapidez para obtener muestras en nitrógeno líquido inmediatamente. Complete esta en 1 min. Alícuotas de 1 ml de PBS sobre papel de filtro para lavar la muestra. Lave rápidamente sin derramar la muestra más caras del papel de filtro. Repetir. Con unas pinzas estériles filtro lugar en un tubo de microcentrífuga de 1,7 ml doblando con cuidado la filtro. Sumerja el tubo de microcentrífuga en nitrógeno líquido hasta burbujeante paradas. Muestra de tienda en -80 ° C congelador. 9. metabolitos Análisis y Procesamiento Barco 3 muestras por clon en hielo seco a una instalación de núcleo metabolómica para el procesamiento de muestras, el análisis y la normalización de GC-TOFMS. Para cada muestra determinar la media, mediana, desviación estándar y coeficiente de variación entre los metabolitos, utilizando los datos replicados. Para el análisis estadístico, codificar manualmente una tubería de control de calidad utilizando las sentencias condicionales y ejecuciones repetitivas 26 para eliminar los metabolitos que no siguen las condiciones definidas. Para Condición 1, retire metabolitos en la que más de 2 muestras tienen cero abundancia. Retire las normas internas de los perfiles metabolómicos. Para Condición 2, quite los metabolitos que no se encuentran en las células de interés. En este caso, retire los siguientes metabolitos: 3 acetato de indol, dihydroabiet ácido ic, ácido nonadecanoico, ácido salicílico, salicilaldehído, colesterol, fenol, 1-monoestearina, octadecanol, 1-monopalmitina, dodecano, dodecanol, 1-hexadecanol, 5-metoxitriptamina, ácido benzoico, ácido pentadecanoico, ácido fosfórico, ácido pelargónico, palmítico ácido, ácido cáprico, hidroxilamina, ácido esteárico, ácido mirístico, maleimida, levoglucosano, y ácido 4-hidroxibutírico. Para Condición 3, quitar esos metabolitos cuyo coeficiente de variación es mayor que 1. Captura efectos globales metabolómica examinado abundancias relativas de metabolitos. Crear una representación visual de la abundancia metabolito mediana por clon para cada metabolito (Figura 6). Identificar los valores extremos mediante la observación de las frecuencias de par-clon metabolito. Calcular la puntuación Z para cada valor de la mediana de cada metabolito en un clon. Calcular puntuaciones z utilizando la siguiente ecuación: /52854/52854eq7.jpg "/> [7] Nota: Plazo X MC representa el nivel de abundancia de un metabolito específico para un clon específico. Μ Term C representa la media de todos los clones de un metabolito específico. Σ Term C es la desviación estándar asociada. Crear una representación visual de los datos en los que se destacan los valores atípicos (datos no incluidos).

Representative Results

Todas las muestras utilizadas para determinar los marcos de lectura abierta (ORF) seleccionados en este estudio se obtuvieron de la isla de Starbuck, Sitio 7 (STAR7) y Caroline Atoll, Sitio 9 (CAR9) de las islas del sur de línea. Se recogió un estimado de 100 litros de agua de mar de estos sitios por debajo de las bombas de achique capa límite utilizando coral, como se describió previamente 5. Contenido de las bombas fueron objeto de fraccionamiento a través de grandes filtros con poros para eliminar pequeños eucariotas y posteriormente se concentraron usando 100 kDa filtros de flujo tangencial dejando sólo los microbios y los virus como partículas (VLP). Para separar las VLPs, permaneciendo el agua de mar se pasa a través de filtros de 0,45 micras resultantes en el virome. El cloroformo se introdujo a esta fracción viral para detener el crecimiento de las células restantes y se almacenó a 4 ° C. VLPs fueron purificados utilizando el método del cloruro de cesio, en el que los gradientes de densidad se separan a través de centrifugación y permiten la recuperación de viriones a ~ 1,35 g / ml a 1,5 g / ml 3. El ADN viral fue extraído por medio de un CTAB / fenol: cloroformo protocolo y se amplifica a través de la amplificación de desplazamiento múltiple utilizando reactivos Phi29. La secuenciación del virome se llevó a cabo con la tecnología de pirosecuenciación disponible comercialmente. Bioinformática utilizados en el procesamiento y selección de los ORFs virales para este estudio son los siguientes. Tres etapas de pre-procesamiento se utilizaron en los metagenomes virales CAR9 y STAR7. En primer lugar, software pública se utiliza para eliminar secuencias de etiqueta que resultaron de la amplificación del ADN viral antes de la secuenciación 27. En segundo lugar, los artefactos de secuenciación comunes como los duplicados de secuencia y bajo número de copias se filtraron fuera del conjunto de datos a través de un programa de bioinformática adicional 28. Por último, se llevó a cabo la eliminación de la contaminación secuencia extraña 29 para aquellas secuencias que tenían ≥ 90% de cobertura y ≥ 94% de identidad con las secuencias en las siguientes bases de datos: RefSeq vgenomas irus; Humano – Referencia GRCh37; Humano – Celera Genomics; Humano – Craig Venter (HuRef); Humano – Seong-Jin Kim (Corea); Humano – Cromosoma 7 Versión 2 (TCAG); y Human – James Watson, Yanhuang (YH; asiática), Yoruba (NA18507; Africano) secuencias de referencia 21. A raíz de estos procesos, secuencias de las muestras CAR9 totalizaron 591.600 y secuencias STAR7 totalizaron 939.311. Estas secuencias fueron subidos a MGRAST y ensamblados a través del software ensamblador con la configuración predeterminada. Contigs fueron traducidos al 6 marcos de lectura y los marcos de lectura abierta (putativos pORFs) fueron identificados mediante secuencias de comandos, como se ha descrito previamente 21. Para identificar ORFs desconocidos se llevaron a cabo una serie de búsquedas de similitud basada eliminar ORFs de función conocida. Brevemente, las siguientes búsquedas se realizaron con sus criterios de búsqueda correspondientes 21: Similitud significativa de ≥ 95% de identidad más de ≥40 pares de bases (pb) por MGRAST Blat en la base de datos M5NR. Similitud significativa (e-valor ≤ 0,001) por TBLASTN contra todos metagenomes públicas en mi base de datos de recursos Metagenoma. Similitud significativa (e-valor ≤ 0,001) por BLASTP y TBLASTN contra la base de datos de NR. Similitud significativa (e-valor ≤ 0,001) por RPS-BLAST contra la base de datos de dominio Conservadas. Traducciones de proteínas a partir de una fracción selecto de cada conjunto de datos en comparación contra las estructuras de proteínas resueltas en el Protein Data Bank. Cálculo de frecuencias dinucleotide utilizando paquete Dinucleotide Firmas. Los pORFs resultantes fueron diseñados para la expresión en E. coli utilizando a disposición del público el software de diseño de genes. Back-traducción de las secuencias de amino-ácido empleado una tabla de uso de codones universal diseñada para dar cabida a la expresión en E. coli con un umbral de uso mínimo de 2%. Secuencia de reconocimiento de la enzima de restriccións para BamHI y HindIII fueron excluidos de las secuencias para facilitar la clonación. Una empresa externa sintetiza el gen ingeniería secuencias de 30 y luego ORFs fueron clonados en un promotor número pBAD vector medio-copia, pEMB11, a través de la clonación de enzimas de restricción estándar. Todos los clones se transformaron en E. coli K-12 cepa BW 27784 23. Las placas de ensayo Multi-fenotipo (MAP) Una tubería de alto rendimiento y software robusto fue aprovechado para el análisis de los mapas, la PMAnalyzer 24. El oleoducto fue desarrollado en un entorno de servidor Linux y realiza varias etapas que incluyen: análisis de los archivos de densidad óptica, el formato de datos en archivos de texto legible, pre-procesamiento de las curvas de crecimiento para la garantía de calidad (QA), y la realización de las técnicas de modelado matemático para analizar las curvas de crecimiento . Las secuencias de comandos de modelado primarios fueron desarrollados en Python versión 2.7.5 para hacer uso del módulo PyLab. <p class = "jove_content"> MAP reproducibilidad se evaluó utilizando el error estándar (SE) para los datos replicados (Figura 2A). Curvas de crecimiento primas se compararon con curvas de crecimiento logística para determinar si el programa PMAnalyzer crecimiento clon precisión parametrizada y modelada durante la experimentación (datos no mostrados). Para más información sobre la exactitud y validez de los mapas y PMAnalyzer ver Cuevas et al. 24 Después de la validación del método, los datos MAP se analizó utilizando los parámetros múltiples, como la tasa máxima de crecimiento (μ max) y el nivel de crecimiento (GL), proporcionados por la tubería de proceso. Visualización comparativa de las curvas de crecimiento se utiliza a menudo para la interpretación de los datos de crecimiento; sin embargo, el número de curvas que se puede visualizar en un momento para la comparación tiene limitaciones. Para analizar numerosas curvas de crecimiento al mismo tiempo, mapa de calor parcelas fueron derivados imploraron comparar decenas de clones cultivados en una sola substrate contra de respuesta promedio que las condiciones '(Figura 2B). La influencia colocado por la sobreexpresión de una nueva proteína del fago se observa a través de cambios en parámetros de la curva, específicamente: retardo de fase, la fase exponencial y el rendimiento de biomasa máxima (asíntota). Como un ejemplo, la subida empinada de la fase lag a la fase exponencial modelado en la curva de crecimiento para la proteína de la cápside (Figura 2A) es reproducida por un cambio rápido en la intensidad del color de negro a blanco para el mismo clon en la trama dinámica de la Figura 2B . Para obtener una imagen global de distribución de clon en toda sustratos, clasificaciones fenotípicas derivados de la GL fueron utilizados (Figura 3). Aquí, los cuatro fenotipos están separados en cuatro gráficos, donde la altura de cada barra representa el número de clones que muestran que el fenotipo para un sustrato específico. Los valores atípicos en los datos se reconocen como clones que caen en la "ganancia de funcio "o" pérdida de categoría de función ". Los valores atípicos pueden ser buscados individualmente e investigaron más de cerca experimentalmente. Además, análisis global reconoce sesgos de sustrato en el ensayo. Sustratos tales como fenilalanina, ácido málico, glicina y resultaron en una clasificación "no crecimiento". Los sustratos que caen constantemente en la clasificación hay crecimiento, a través de todos los clones, no se inclinan fuertemente en la caracterización funcional de aguas abajo. Metabolómica Los productos catabólicos de clones que expresan genes de fagos desconocidos se identificaron utilizando la metabolómica. Brevemente, los clones se cultivaron en ya sea un cultivo continuo o paso en serie en medio de cultivo por lotes antes de ser enviado a cabo para el análisis de GC-TOFMS en una instalación de núcleo metabolómica. Para más detalles sobre el procesamiento de muestras, el análisis, y la normalización de GC-TOFMS implementadas por la facilidad de la base elegida ver Fiehn et al. 31 Briefly, se añade 1 ml de disolvente de extracción en frío a cada muestra, después de lo cual las muestras se agitaron en vórtex y se sonicaron en un baño frío durante 5 min. Las muestras se centrifugaron y finalmente media de la muestra se decanta y se secaron para su análisis. Extractos se purifican y pinchos con marcadores de índice de retención interno antes de ser embarcados en el cromatógrafo de gases y luego fue trasladado posteriormente al espectrómetro de masas. Los datos de cada muestra se analiza de manera que se reportan intensidades de señal para todas las señales detectadas en el cromatograma. Para la normalización, la abundancia de picos para cada muestra se resume y la abundancia total de los picos son promediadas entre todas las muestras en el conjunto. Abundancias de metabolitos por muestra se dividen por el pico de abundancia de la muestra y luego se multiplican por la abundancia media de pico de la muestra establecida. Los datos resultantes se utiliza para el análisis de la metabolómica en la investigación discutida. Validación de la metabolómica reproducibilidad estaba obligado adeterminar el tamaño apropiado de la muestra para cada método de cultivo. Para detectar la precisión visto dentro de las muestras y la variación visto a través de tamaños de muestra el error estándar de la media (S M) tanto para n = 3 y n = 6 conjuntos de datos fueron revisados ​​(Figura 5B). Independientemente de la cultura continua (CC) tamaño de la muestra, menos de 1% de los datos tenía una S M ≤ 1,5. La mediana S M s eran 221 y 300, y los valores oscilaron 0-7,55 x 10 5 y 3,74 x 10 5, para n = 3 yn = 6 respectivamente. S M s también se calcularon para cada grupo de muestra de réplicas en el método de cultivo en serie (SC). Una vez más, a menos de 1% de los datos tenía una S M ≤ 1,5, una mediana S M de 137, y un rango de 0 a 3,51 x 10 5. Para comparar las distribuciones S m entre cada conjunto de muestras (CC n = 3 vs . CC n = 6, CC n = 3 vs SC n = 3, y CC n = 6 vs. SC n = 3) se realizó una prueba de permutación. El distriblución de cualquiera de cultivo continuo S M valora el conjunto de datos no fue significativamente diferente de la distribución de los valores de la cultura de serie S M (p-valor = 0,0). Sin embargo, la distribución de los valores S M para cultivo continuo de datos n = 3 fue significativamente diferente de la de los valores S M para el cultivo continuo n = 6 datos (p-valor = 1.908804 x 10 -49). Por último, el coeficiente de variación por metabolito se comparó antes y después de la implementación de una etapa de garantía de calidad (QA) (Figura 5C). En total, 210 metabolitos fueron retirados después de la implementación de la tubería de control de calidad (40% de los datos). Menos de 1% de los datos eliminados tenía una abundancia metabolito de cero, ~ 2% era de datos de patrón interno, ~ 5% fue datos de metabolitos nunca antes observada en E. coli, y los metabolitos restantes (> 30%) tenían un coeficiente de variación mayor que 1. Al igual que con el análisis MAP, observatio mundialns proporciona una comprensión inicial de la profundidad de la metabolómica información ofertas. Para obtener una imagen global, clones fueron agrupados jerárquicamente en función de sus abundancias relativas de metabolitos que proporcionan información sobre los perfiles-clon metabolito, potenciales clones con funciones relacionadas, y los valores atípicos-clon metabolito (Figura 6). Para poner de relieve las funciones de proteínas, metabolitos están separados y agrupados en base a las vías metabólicas comunes. El uso de este análisis con resultados preliminares, era evidente que la metabolómica es capaz de separar genes de diferentes clases (Figura 6, resaltado clones). Además, la identificación de valores atípicos con los datos de la metabolómica se determinó mediante el cálculo de las puntuaciones normalizadas (puntuaciones z) para cada par-clon metabolito. Para asegurar la significación estadística, los valores atípicos se definen como un par-clon metabolito con un valor de puntuación Z de 2, que representa sólo el 5 por ciento de los datos (datos no mostrados). <p class="jove_content" fo:keep-tog ether.within-page = "always"> Figura 1. Definiciones de clasificaciones fenotipo. (A) Relación entre el nivel de crecimiento (GL) y tasa de crecimiento máxima. Los puntos de datos círculo rojo representan las curvas de crecimiento que muestran poca o ninguna utilización de sustratos. (B) Representación Diagrama de caja que define el umbral de crecimiento basado en la distribución de las curvas de crecimiento con una tasa de crecimiento mínimo (<0,15 OD / hr). (C) La varianza y desviación estándar de GL se calcula para sustrato de D-galactosa. Líneas de trazos cortos representan dos desviaciones estándar lejos de la media. Por favor, haga clic aquí para ver una versión más grande de esta figura. highres.jpg "/> Figura 2. Mapas de validación a través de la precisión y la diferenciación. (A) Curvas de crecimiento para clones estructurales (cápsida) y metabólicos (anotados Tiorredoxina), dos clones metabólicas novedosas (EDT2440, EDT2441), y el de respuesta promedio de los clones cultivados en sacarosa, D- galactosa y D-manosa en los mapas. Las líneas azules indican el error estándar visto entre los datos replicadas (n = 3). (B) Las curvas de crecimiento para 47 diferentes clones se representan como mapas de calor para la sacarosa, D-galactosa y D-manosa. El estructural (círculo verde) anotado y clones metabólicos (círculo naranja), dos clones metabólicas novedosas (círculos azules oscuros y claros), y la respuesta promedio (círculo rojo) se destacan. Haga clic aquí para ver una versión más grande de esta figura. pload / 52854 / 52854fig3highres.jpg "width =" 700 "/> Figura 3. Distribución Clone para cada fenotipo a través de múltiples sustratos. El recuento de fenotipo-clon de 47 clones a través de 72 condiciones de crecimiento en carbono específico. Tabla proporciona conteos directos para cada fenotipo. Por favor, haga clic aquí para ver una versión más grande de esta figura. Figura 4. Diagrama que detalla la construcción del aparato de cultivo continuo. (A) pasos utilizados para construir los puertos α-γ del reactor de cultivo continuo, (b) pasos utilizados para construir el puerto de flujo hacia fuera del reactor de cultivo continuo, y (C ) los pasos para construir puertos δ y ε del biberón cultivo continuo. = "Https://www.jove.com/files/ftp_upload/52854/52854fig4highres.jpg" target = "_ blank"> Haga clic aquí para ver una versión más grande de esta figura. Figura 5. Comparación de los métodos Phenomic presentados. (A) Flujo de trabajo para la preparación de las placas Multi-fenotipo de ensayo (MAP), cultivos continuos y culturas de serie. (B) El porcentaje de error estándar de la media (S M) cuenta tanto para n = 3 y n = 6 tamaños de muestra para el cultivo continuo (CC) y la cultura de serie (SC) métodos de preparación para la metabolómica. El eje y es en una escala logarítmica. (C) Las distribuciones de los coeficientes de variación (CV) por metabolito, antes y después de la implementación de la tubería de control de calidad para el método de cultivo continuo (CC).g5highres.jpg "target =" _ blank "> Haga clic aquí para ver una versión más grande de esta figura. Figura 6. perfiles metabolómicos de clones que crecen en cultivo continuo. La abundancia de metabolitos mediana de un conjunto de metabolitos se trazan para 84 clones cultivados en cultivos continuos. Perfiles de metabolitos de clones anotados estructurales (cápside) y metabólicos (Tiorredoxina), dos clones metabólicas novedosas (EDT2440, EDT2441), y la respuesta metabólica media se destacan en rojo. Por favor, haga clic aquí para ver una versión más grande de esta figura. Compuesto Carbono Nitrógeno </strong> Azufre Fósforo Glicerol – 0,40% 0,40% 0,40% Cloruro amónico 9,5 mM – 9,5 mM 9,5 mM El sulfato de sodio 0,250 mM 0,250 mM – 0,250 mM Sulfato de magnesio 1,0 mM 1,0 mM – 1,0 mM Fosfato de potasio 1,32 mM 1,32 mM 1,32 mM – Cloruro de magnesio – – * – Cloruro de potasio 10 mM 10 mM 10 mM 10 mM Cloruro de calcio 0,5 M <td> 0,5 M 0,5 M 0,5 M Cloruro de sodio 5 mM 5 mM 5 mM 5 mM El cloruro férrico 6 M 6 M 6 M 6 M L- arabinosa 0,10% 0,10% 0,10% 0,10% MOPS pH 7,4 1x 1x 1x 1x Tabla 1. Los compuestos y concentraciones de los diferentes medios basales usados ​​en los mapas. * 1,0 mM de cloruro de magnesio está sustituido. 1x MOPS = MOPS 40 mM, 4 mM Tricine. Sustratos de carbono Sustratos de nitrógeno Sustratos de azufre Psustratos hosphorus 2 desoxi-D-ribosa 2-desoxi-D-ribosa Ácido 1-butano-sulfónico adenosina-5-monophoshate Ácido acético 4 hidroxi fenil- acetamida acetil cisteína beta-glicerofosfato ácido acético adenina D-cisteína creatinephosphate adenosina-5-monofosfato adenosina D-metionina D-glucosa-6-fosfato adonitol alantoína dietil-ditiofosfato dietil-ditiofosfato alfa-D-glucosa beta-feniletilamina DL-etionina DL-alfa-glicerofosfato alfa-D-lactosa biuret glutatión fosfato de potasio alfa-D-melebiose citidina ácido isetiónico pirofosfato de sodio ácido cítrico citosina Ácido L-cisteico tiofosfato de sodio D-alanina D-alanina L-cisteína D-arabinosa D-asparagina Ácido L-djenkolic D-arabitol D-aspartato L-metionina D-asparagina D-cisteína sulfato de magnesio D-aspartato D-glucosamina ácido metanosulfónico D-celubiosa Ácido D-glutámico N-acetil-DL-metionina D-cisteína Ácido DL-alfa-amino-N-butírico N-acetil-L-cisteína D-fructosa D-metionina potasio-tetra-thionate </tr> D-galactosa D-serina Tiosulfato de Sodio D-glucosamina D-valina ácido sulfanic D-glucosa ácido gamma-amino-N-butírico taurina D-glucosa-6-fosfato glicina ácido taurocólico D-glutamato guanidina tiourea D-manosa histamina D-rafinosa inosina D-ribosa L-alanina D-salicina L-arginina D-serina L-asparagina D-trehalosa L-citrulina D-xilosa L-cisteína dulcitol Ácido L-glutámico glicerol L-glutamina glicina L-glutatión i-eritritol L-histidina inosina L-isoleucina L-alanina L-leucina L-arabinosa L-lisina L-arabitol L-metionina L-asparagina L-ornitina L-aspartato L-fenil-alanina Ácido L-cisteico L-prolina L-cisteína Ácido L-piro-glutámico L-fucosa L-serina; L-treonina Ácido L-glutámico L-triptófano L-glutamina L-valina L-isoleucina N-acetil-D-glucosamina L-leucina putrescina <tr> L-lisina tiourea L-metionina timidina L-fenilalanina timina Ácido L-piro-glutámico tiramina L-ramnosa tirosina L-serina uridina L-sorbosa L-treonina L-triptófano L-valina L-xilosa lactato lactulosa malato myo-inositol ácido oxálico sorbato de potasio ácido propiónico putrescina ácido quínico piruvato de sodio succinato de sodio </td> sacarosa timidina xilitol Tabla 2. Lista de sustratos utilizados en los experimentos de MAP.

Discussion

A continuación, presentamos los enfoques Phenomic para la caracterización funcional de genes de fagos putativos. Las técnicas incluyen un ensayo desarrollado capaz de metabolismo anabólico monitoreo anfitrión, las placas de ensayo Multi-fenotipo (mapas), además de el método establecido de la metabolómica, capaz de efectos a metabolismo catabólico de medición. Proporcionamos herramientas adicionales para gestionar los grandes conjuntos de datos resultantes de estas tecnologías, lo que permite el procesamiento de alto rendimiento y análisis 24. Por último, a través de la comparación de una proteína de la cápside del fago anotada, tiorredoxina fago, dos genes de fagos metabólicos putativos, y la respuesta experimental promedio proponemos diversas estrategias para interpretar ambos conjuntos de datos y clases de genes, con énfasis en la identificación de las tendencias fenotípicas y la identificación de los valores atípicos.

Como se ha mencionado, ambos enfoques medir cuantitativamente sólo la mitad del metabolismo de host. Para interpretar la función relativa de cualquiera de lasnuevas proteínas que se investigan, se requiere los datos de ambos métodos para proporcionar evidencia de la función. Si bien esto no es un foco de nuestro manuscrito actual, salidas de datos de cada método phenomic se someten a análisis combinatorios que se centran en técnicas de agrupamiento como el bosque al azar y análisis de componentes principales. Por otra parte, las hipótesis resultantes del análisis combinado deben ser posteriormente validados por metodologías genéticos tradicionales.

Por último, los métodos presentados están fuertemente influenciados por la fisiología bacteriana y, por tanto, seguir las mismas normas. Al llevar a cabo cualquiera de los métodos, las consideraciones deben hacerse para asegurar grupos independientes, clonales están experimentado con; se evita la contaminación; una sola variable se está probando; y los controles adecuados se están corriendo al mismo tiempo. El fracaso para tener en cuenta estos puntos dará lugar a resultados poco claros, similar a cualquier ensayo fisiológico.

Las placas de ensayo Multi-fenotipo(MAP)

El desarrollo de MAP ofrece un alto rendimiento y ensayo de adaptación en comparación con las tecnologías disponibles en la actualidad (Figura 5A y Tablas 1,2). El ensayo utiliza suministros, equipos y técnicas fundamentales disponibles en todos los laboratorios de microbiología. La incorporación de un oleoducto computacional, PMAnalyzer 24, para su posterior procesamiento y análisis de datos asegura la interpretación de datos rápida. Además, tanto los aspectos experimentales y analíticos del enfoque se puede ajustar o sintonizados con fines personalizados fácilmente. Por ejemplo, si una gran parte de los datos que no logra pasar el filtrado se indica en la sección 4, se puede tamizar manualmente a través de las curvas de crecimiento para identificar problemas. Si el problema surge debido a estrictos parámetros de filtro, se pueden hacer ajustes en el guión. Alternativamente, si los problemas están asociados con el proceso experimental (es decir, la condensación prolongada; inadecuada transferencia de cel bacterianals, etc.), entonces repeticiones adicionales se pueden repetir fácilmente.

Como se describe en Cuevas et al. 24, el PMAnalyzer es un solo programa bash escrito como un guión envoltorio que ejecuta los scripts de análisis y análisis como, tubería automatizada cohesiva. Todos los guiones son de libre acceso desde un repositorio Git a 25, tomando el valor medio para cada punto de tiempo a través de los datos por triplicado, y posteriormente se parametriza la curva logística para obtener el tiempo de retardo, la tasa de crecimiento máximo, asíntota, y una novela plazo, nivel de crecimiento. El valor de la mediana fue elegido sobre la media en nuestro estudio para reducir el efecto de grandes valores atípicos, sin embargo, la secuencia de comandos se puede adaptar fácilmente para calcular la media de los datos replicados. Debido a la variación reducida (SE) visto a través de los datos replicados (Figura 2A) mantuvimos el uso de la mediana en el PMAnalyzer para el ajuste de una curva logística. Además, el corte para el crecimiento en este estudio (GL ≥ 0,4) fue determined comparando cómo los datos separados en todo nivel de crecimiento y tasa de crecimiento máxima (Figura 1A, B). Dependiendo del sistema de instrumentos y el modelo utilizado este término puede variar, lo que requiere una redefinición de este valor de corte.

Una ventaja importante de nuestro ensayo es la capacidad de comparar fenotipos utilizando un único parámetro que caracteriza el crecimiento microbiano en general, que definimos como nivel de crecimiento (GL). GL es una media armónica, y por lo tanto mitiga los efectos de grandes valores atípicos en los datos. El uso de una media armónica con los valores logísticos equipado desplazado para proporcionar un resumen de crecimiento se llegó a través de ensayo y error. Otros métodos intentaron diferenciar el crecimiento incluye: tiempo que tardó en llegar a los parámetros específicos de la curva (media μ max, μ max, y capacidad de carga), el coeficiente de determinación (R 2), y combinaciones de los R 2 multiplicado por parámetros de la curva específicos. Usando una media armónica con desplazadovalores logística-ajuste para el GL proporcionan el rango mayor en la evaluación de crecimiento, por lo que se convirtió en el método de elección. Una consideración a tener en cuenta es que los patrones de la curva de crecimiento dinámicos tienen el potencial de estar perdido cuando se utiliza un solo parámetro o un modelo ajustado. Por ejemplo, los parámetros de la curva individuales de la curva logística y el GL son incapaces de representar el crecimiento bifásica. En un entorno de carbono solo, este efecto sobre el crecimiento implica la mediación de la proteína viral en cualquiera de conversión del sustrato o cambio en la utilización de sustratos. Efectos adicionales potencialmente perdidos al no considerar múltiples parámetros de crecimiento incluyen: tiempo de latencia prolongada, proponiendo un aumento de la carga viral de la maquinaria o productos; acelerando rápidamente la fase exponencial, lo que sugiere proteínas virales acopladas a acoger las vías de producción de energía; niveles o superiores de formación de la biomasa, lo que implica apoyo viral en la absorción de nutrientes anfitrión y el anabolismo (datos no mostrados). Por lo tanto, el trazado de las curvas de crecimiento nacientes ( <strong> Figura 2A, B) proporciona información sobre tendencias en el tiempo mientras que el GL tiene en cuenta las principales variables del modelo logístico, proporcionando un único número cuantitativa para representar el éxito global de un clon.

Al considerar las diferentes respuestas aportadas por los genes estructurales y metabólicos en los mapas, se observa que las diferentes clases de sustrato en cuestión proporcionan la evidencia más grande para la función de la proteína. Por ejemplo, las proteínas metabólicas están a menudo asociados con la adquisición de nutrientes limitantes, que son inespecíficos para acoger 16,32 metabolismo central. Los experimentos preliminares MAP revelar que los clones que albergan genes putativos de fagos metabólicos tienen un aumento de la fase de retardo cuando se cultivan en fuentes de carbono metabolismo central (Figura 2a). Por el contrario, los clones que llevan genes estructurales putativas, que requieren una gran proporción de las piscinas de energía anfitrión y dNTP, dan lugar a una respuesta positiva falsa en el crecimiento de cientosustratos de carbono metabolismo RAL y de aminoácidos. Esto es probablemente debido a la acumulación de proteínas insolubles resultantes en filamentation huésped y / o cuerpos de inclusión, como se observa a través de microscopía (Figura 2A y datos no mostrados). Si bien se requiere un mayor análisis para validar estos resultados preliminares, los mapas son capaces de recuperar las respuestas fenotípicas que se correlacionan con la hipótesis de las funciones de clases de genes de fagos específicos.

Además de la elucidación de las proteínas virales desconocidos, los mapas son un recurso novedoso para investigar la diversidad funcional y metabólica de una bacteria individuo o una comunidad de bacterias. Componentes del PAM están diseñados para la alteración fácil de apoyar el crecimiento de una gama de bacterias; incluyendo marino, auxotrófica y microbios anaeróbicos. Para facilitar estos esfuerzos la basal y pre-crecimiento de los medios definidos requieren especies químicas adicionales o ajustados antes de que un género bacteriano diferente se puede apoyar en los mapas.Una nota en este uso de los mapas es mantener medios definidos, que prohíbe el uso de ingredientes tales como triptona, extracto de levadura y peptona.

Metabolómica

El campo de la metabolómica es dependiente de las bases de datos de metabolitos, que incluyen metabolitos aislados identificados por espectrometría de masas. La facilidad de la base elegida aquí tiene una de las mayores bases de datos de la metabolómica. Curiosamente, más de la mitad de los metabolitos resultantes de nuestras experimentaciones eran identificables (~ 65%), mientras que otros habían nunca antes se han registrado en nuestro anfitrión, Escherichia coli (ejemplos incluyen: el indol 3 acético 33, ácido salicílico 34, y ácido dihidroabiético 35). Este hecho podría atribuirse a ya sea un fuerte sesgo de la base de datos hacia metabolitos de plantas, o las proteínas específicas bajo investigación. Independientemente, el resultado es un número limitado de metabolitos conocidos disponibles para la representación y el análisis de datos. En el futura, múltiples métodos metabolómica utilizando diversas bases de datos permitiría una mayor cobertura metabolito.

En la actualidad, ambos conocidos y metabolitos desconocidos se utilizan al comparar y contrastar nuestras proteínas virales novedosos. Con este enfoque, la hipótesis de que los clones que albergan proteínas funcionalmente similares compartirán una mayor similitud en su perfil metabolómico completa. El análisis preliminar metabolómica reveló que mientras que los genes estructurales y metabólicas no se separan claramente una de otra, aquellos genes que exhiben efectos similares en el anfitrión cuando se sobreexpresa se ​​correlacionan (Figura 6). Por ejemplo, la cápside grupos de genes anotados en estrecha colaboración con los genes metabólicos putativos de relieve en este estudio, EDT2440 y EDT2441. Las investigaciones utilizando un programa predictor topología transmembrana y péptido señal disponible públicamente mostraron evidencia de que ambos genes metabólicos putativo albergan un único dominio transmembrana. Curiosamente 5 de THe 9 clones en el primer grupo de clústeres (porción del dendrograma más a la izquierda) han pronosticado dominios transmembrana utilizando el mismo programa de topología. Se necesitan más investigaciones, sin embargo, es probable que los metabolitos presentes durante la sobreexpresión de estos clones están asociados con la respuesta al estrés celular resultante de la membrana o cargas estructurales. Esta evidencia apoya que mientras que los datos de la metabolómica posee una mayor cantidad de ruido, el método es capaz de poner de relieve las señales que diferencian a efectos generales de genes, tanto dentro ya través de una clase de genes. Para determinar si el método es capaz de extraer información específica de la función génica, los metabolitos se agruparon en vías metabólicas específicas. El ser hipótesis, si un clon afecta metabolitos específicos a una sola vía, a continuación, el gen sobreexpresado está activo en esa vía. Antes de la creación de nuestra línea de aseguramiento de la calidad metabolómica, los datos preliminares revelaron que más de unad metabolitos menos representados eran típicamente "desconocido", que proporciona poca información sobre las vías que están asociados (datos no mostrados). Metabolómica datos preprocesados, sin embargo, revela que la mayoría de los perfiles de metabolitos son similares y sólo un número selecto de las abundancias de metabolitos desconocidos y conocidos varía en los diferentes clones, por ejemplo putrescina y uracilo (Figura 6). Para proporcionar una mayor resolución de los esfuerzos de la función de proteínas se están realizando para comparar experimentalmente los nuevos genes de fagos contra genes de fagos conocidos, que se pueden utilizar para rellenar los "huecos" de metabolito basados ​​caracterización funcional. Usando esta técnica, la función asignada de genes virales conocidos proporciona una referencia para la función de los genes desconocidos. No obstante, el factor limitante del análisis metabolómica es el tamaño y la relevancia de la base de datos. Para corregir estas limitaciones, bases de datos metabolómicos relacionables a esta investigación deben desarrollarse; talcomo una base de datos de metabolitos y sus abundancias específica a la colección ASKA de E. clones de E. coli en los que un ORF se sobreexpresa 36. La evidencia de la necesidad de este tipo de bases de datos fue proporcionada en 2013 cuando los investigadores del Laboratorio Nacional Lawerence Berkeley compilados la primera base de datos completa de los metabolitos específicos para bibliotecas enteras de bacterias mutantes modelo 37. Esta investigación proporciona una visión novedosa en los genes necesarios para la utilización de los metabolitos específicos, revelando la conexión clara entre fenotipo y genotipo.

Al considerar la metabolómica como una herramienta, es importante definir el régimen de procesamiento siguió en las instalaciones de la base. Un artefacto de la mayoría de los procedimientos experimentales es la varianza del día a día relacionados con los instrumentos de uso. Hasta la fecha todos los análisis GC-MS implementa el uso de las normas internas que se incluyen en cada serie analítica; Sin embargo, la adición de muestras internas específicas del proyecto </ Em> corrieron cada día de la experimentación elimina varianza adicional. Estas consideraciones deben ser abordados con antelación para evitar problemas de normalización y sesgos. Otra solución es procesar todas las muestras en una instalación de núcleo en la misma máquina y como un solo lote, una opción disponible en cualquier tipo de núcleo.

Las diversas herramientas tanto introducen y re-exploran en este manuscrito proporcionar nuevos medios para detectar y caracterizar los genes de fagos funcionalmente desconocidos. La simplicidad y la adaptabilidad de las técnicas experimentales con el uso de tuberías de línea de corriente computacionales asegura estos métodos son aplicables a una amplia gama de esfuerzos de investigación y campos. Nuestro objetivo es que los enfoques Phenomic presentados aquí ayudarán a nuevas investigaciones de las proteínas de fagos nuevos, además de los sistemas que son igualmente funcionalmente definido.

Disclosures

The authors have nothing to disclose.

Acknowledgements

We thank Benjamin Knowles, Yan Wei Lim, Andreas Haas, and members of the Viral Dark Matter consortium for their help and constructive input on this manuscript. This research is funded by the National Science Foundation (DEB-1046413) and is part of the Dimensions: Shedding Light on Viral Dark Matter project.

Materials

0.22µm Sterivex Filter Fisher Scientific SVGP01050 Millipore
0.22µm Millex Filters Fisher Scientific SLGV033RS Millipore
0.22µm SteriCap Filter Fisher Scientific SCGPS02RE Millipore
0.22 µm Omnipore membrane filters Millipore JHWP02500 Millipore
96 well micro-titer plates  VWR 82050-764 Standard F-Bottom 96 well Microplates
2 mL 96 well plate Fisher Scientific
Adhesive Seal Plate Film Sigma-Aldrich Z369667
2 L Nalgene square bottles Cole Parmer T-06040-70
125 mL Nalgene square bottles Cole Parmer T-06040-50
1/4inch Panel Mount Lock Nut, black nylon  Cole Parmer EW-45509-04
Female Luer Thread Style Panel Mount to 200 Series Barb  1/16inch  Cole Parmer EW-45500-30
Female Luer Thread Style Panel Mount to 200 Series Barb, 1/8inch Cole Parmer EW-45500-34
Male Luer Integral Lock Ring to 500 Series Barb, 1/16inch ID tubing Cole Parmer EW-45505-31
Male Luer with Lock Ring x Female Luer Coupler Cole Parmer T-45508-80
Barbed Bulkhead Fittings 1/4inch OD  Fisher Scientific 6149-0002
Sanipure Tubing 1/16inch ID x 1/8inch OD  SaniPure AR400002
Sanipure Tubing 1/4inch OD x 1/8inch ID  SaniPure AR400007
Variable Flow Mini Pump (Peristaltic pump) Fisher Scientific 13-876-1
Magnetic Stirrer Velp Scientifica F203A0160
Forceps Fisher Scientific 14-512-141  Millipore* Filter Forceps 
Multi-plate spectrophotometer plate reader Molecular Devices Analyst GT
Filter manifold Fisher Scientific  XX10 025 02
Software:
Python version 2.7.5 http://www.python.org/
PyLab module http://wiki.scipy.org/PyLab
R version 3.0.1  http://www.r-project.org/
reshape2 library http://had.co.nz/reshape
ggplot2 library http://ggplot2.org/
Gene Composer PSI Tech Portal http://www.genecomposer.net
Services:
West Coast Metabolomics Center UC Davis http://metabolomics.ucdavis.edu
DNA 2.0 https://www.dna20.com

References

  1. Wommack, K. E., Colwell, R. R. Virioplankton: Viruses in Aquatic Ecosystems. Microbiology and Molecular Biology Reviews. 64 (1), 69-114 (2000).
  2. Hendrix, R. W. Recoding in Bacteriophages. Recoding: Expansion of decoding rules enriches gene expression. 24, 249-258 (2010).
  3. Breitbart, M., et al. Genomic analysis of uncultured marine viral communities. Proceedings of the National Academy of Sciences. 99 (22), 14250-14255 (2002).
  4. Breitbart, M., et al. Diversity and population structure of a near-shore marine-sediment viral community. Proceedings. Biological sciences / The Royal Society. 271 (1539), 565-574 (2004).
  5. Dinsdale, E. A., et al. Functional metagenomic profiling of nine biomes. Nature. 452 (7187), 629-632 (2008).
  6. Vega Thurber, R. L., et al. Metagenomic analysis indicates that stressors induce production of herpes-like viruses in the coral Porites compressa. Proceedings of the National Academy of Sciences of the United States of America. 105 (47), 18413-18418 (2008).
  7. Pedulla, M. L., et al. Origins of highly mosaic mycobacteriophage genomes. Cell. 113 (2), 171-182 (2003).
  8. Calendar, R., Abedon, S. T. . The bacteriophages. , (2006).
  9. Breitbart, M., Miyake, J. H., Rohwer, F. Global distribution of nearly identical phage-encoded DNA sequences. FEMS microbiology letters. 236 (2), 249-256 (2004).
  10. Klenk, H. -. P., Palm, P., Zillig, W. DNA-Dependent RNA Polymerases as Phylogenetic Marker Molecules. Systematic and Applied Microbiology. 16 (4), 638-647 (1993).
  11. Breitbart, M., Thompson, L., Suttle, C., Sullivan, M. Exploring the Vast Diversity of Marine Viruses. Oceanography. 20 (2), 135-139 (2007).
  12. Mann, N. H., Cook, A., Millard, A., Bailey, S., Clokie, M. Marine ecosystems: bacterial photosynthesis genes in a virus. Nature. 424 (6950), 741 (2003).
  13. Mann, N. H., et al. The genome of S-PM2, a “photosynthetic” T4-type bacteriophage that infects marine Synechococcus strains. Journal of bacteriology. 187 (9), 3188-3200 (2005).
  14. Lindell, D., et al. Transfer of photosynthesis genes to and from Prochlorococcus viruses. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11013-11018 (2004).
  15. Millard, A., Clokie, M. R. J., Shub, D. A., Mann, N. H. Genetic organization of the psbAD region in phages infecting marine Synechococcus strains. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11007-11012 (2004).
  16. Sullivan, M. B., Coleman, M. L., Weigele, P., Rohwer, F., Chisholm, S. W. Three Prochlorococcus cyanophage genomes: signature features and ecological interpretations. PLoS biology. 3 (5), e144 (2005).
  17. Rohwer, F., et al. The complete genomic sequence of the marine phage Roseophage SIOI shares homology with nonmarine phages. Limnology and Oceanography. 45 (2), 408-418 (2000).
  18. Miller, E. S., et al. Complete genome sequence of the broad-host-range vibriophage KVP40: comparative genomics of a T4-related bacteriophage. Journal of bacteriology. 185 (17), 5220-5233 (2003).
  19. Thompson, L. R., et al. Phage auxiliary metabolic genes and the redirection of cyanobacterial host carbon metabolism. Proceedings of the National Academy of Sciences of the United States of America. 108 (39), E757-E764 (2011).
  20. Paterson, S., et al. Antagonistic coevolution accelerates molecular evolution. Nature. 464 (7286), 275-278 (2010).
  21. Seguritan, V., et al. Artificial neural networks trained to detect viral and phage structural proteins. PLoS computational biology. 8 (8), e1002657 (2012).
  22. Neidhardt, F. C., Bloch, P. L., Smith, D. F. Culture Medium for Enterobacteria. Journal of Bacteriology. 119 (3), 736-747 (1974).
  23. Khlebnikov, A., Datsenko, K. A., Skaug, T., Wanner, B. L., Keasling, J. D. Homogeneous expression of the P(BAD) promoter in Escherichia coli by constitutive expression of the low-affinity high-capacity AraE transporter. Microbiology (Reading, England). 147 (Pt 2), 3241-3247 (2001).
  24. Cuevas, D. A., et al. Elucidating genomic gaps using phenotypic profiles. F1000Research. , (2014).
  25. Zwietering, M. H., Jongenburger, I., Rombouts, F. M., van’t Riet, K. Modeling of the bacterial growth curve. Applied and environmental microbiology. 56 (6), 1875-1881 (1990).
  26. Schmieder, R., Lim, Y. W., Rohwer, F., Edwards, R. TagCleaner: Identification and removal of tag sequences from genomic and metagenomic datasets. BMC bioinformatics. 11, 341 (2010).
  27. Schmieder, R., Edwards, R. Quality control and preprocessing of metagenomic datasets. Bioinformatics (Oxford, England). 27 (6), 863-864 (2011).
  28. Schmieder, R., Edwards, R. Fast identification and removal of sequence contamination from genomic and metagenomic datasets. PloS One. 6 (3), e17288 (2011).
  29. Welch, M., et al. Design parameters to control synthetic gene expression in Escherichia coli. PloS One. 4 (9), e7002 (2009).
  30. Fiehn, O., et al. Quality control for plant metabolomics: reporting MSI-compliant studies. The Plant journal: for cell and molecular biology. 53 (4), 691-704 (2008).
  31. Zeng, Q., Chisholm, S. W. Marine viruses exploit their host’s two-component regulatory system in response to resource limitation. Current biology: CB. 22 (2), 124-128 (2012).
  32. Shindy, W. W., Smith, O. E. Identification of plant hormones from cotton ovules. Plant physiology. 55 (3), 550-554 (1975).
  33. Lee, H. I., Leon, J., Raskin, I. Biosynthesis and metabolism of salicylic acid. Proceedings of the National Academy of Sciences of the United States of America. 92 (10), 4076-4079 (1995).
  34. Chappell, J. The Biochemistry and Molecular Biology of Isoprenoid Metabolism. Plant Physiology. 107 (1), 1-6 (1995).
  35. Kitagawa, M., et al. Complete set of ORF clones of Escherichia coli ASKA library (a complete set of E. coli K-12 ORF archive): unique resources for biological research. DNA research: an international journal for rapid publication of reports on genes and genomes. 12 (5), 291-299 (2005).
  36. Baran, R., et al. Metabolic footprinting of mutant libraries to map metabolite utilization to genotype. ACS chemical biology. 8 (1), 189-199 (2013).

Play Video

Cite This Article
Sanchez, S. E., Cuevas, D. A., Rostron, J. E., Liang, T. Y., Pivaroff, C. G., Haynes, M. R., Nulton, J., Felts, B., Bailey, B. A., Salamon, P., Edwards, R. A., Burgin, A. B., Segall, A. M., Rohwer, F. Phage Phenomics: Physiological Approaches to Characterize Novel Viral Proteins. J. Vis. Exp. (100), e52854, doi:10.3791/52854 (2015).

View Video