Nosso ponto de mudança Bayesiana (BCP) algoritmo baseia-se no estado-da-arte avanços em modelagem de mudanças de pontos através de modelos ocultos de Markov e os aplica a cromatina imunoprecipitação seqüenciamento (ChIPseq) análise de dados. BCP executa bem em tipos de dados ampla e pontuada, mas supera em identificar com precisão robustos, ilhas reproduzíveis de enriquecimento histona difusa.
ChIPseq é uma técnica amplamente utilizada para investigar interacções DNA-proteína. Ler a densidade perfis são gerados usando a próxima sequência de ADN ligado à proteína e alinhando a curto leituras para um genoma de referência. Regiões enriquecidas são revelados como picos, o que muitas vezes diferem dramaticamente de forma, dependendo da proteína alvo 1. Por exemplo, factores de transcrição ligam frequentemente em um local e modo específico da sequência e tendem a produzir picos puntiformes, enquanto que modificações de histonas são mais difusas e caracterizam-se por grandes difusas, ilhas de enriquecimento 2. Confiável identificação dessas regiões foi o foco do nosso trabalho.
Algoritmos de análise de dados ChIPseq empregaram várias metodologias, de heurísticas 3-5 aos mais rigorosos modelos estatísticos, por exemplo, modelos ocultos de Markov (HMM) 6-8. Nós procuramos uma solução que minimizasse a necessidade de difíceis de definir, parâmetros ad hoc, que muitas vezescomprometer resolução e diminuir a possibilidade de utilização intuitiva da ferramenta. Com relação aos métodos baseados em HMM, buscamos reduzir os procedimentos de estimação e de parâmetros simples, classificações de estado finito que são frequentemente utilizados.
Além disso, a análise de dados convencional ChIPseq envolve categorização do esperado ler perfis de densidade como quer punctata ou difusa seguido de posterior aplicação da ferramenta apropriada. Nós ainda como objetivo substituir a necessidade de estes dois modelos distintos com um único modelo mais versátil, que pode competentemente abordar todo o espectro de tipos de dados.
Para atingir estes objectivos, o primeiro construído um quadro estatístico que naturalmente modelados estruturas ChIPseq de dados usando um avanço de ponta em HMMs 9, que utiliza apenas fórmulas explícitas-uma inovação crucial para suas vantagens de desempenho. Modelos mais sofisticados, em seguida, heurísticas, nossa HMM acomoda infinitos estados ocultos através de umModelo Bayesian. Nós aplicamos a identificação de pontos de mudança razoável na densidade de ler, que ainda definir segmentos de enriquecimento. Nossa análise revelou como nosso Bayesiana mudar o ponto algoritmo (BCP) teve uma complexidade computacional reduzido evidenciado por um tempo de execução abreviada e consumo de memória. O algoritmo BCP foi aplicado com sucesso tanto o pico punctata e identificação ilha difusa com precisão robusto e limitados parâmetros definidos pelo usuário. Isto ilustrado tanto a sua versatilidade e facilidade de uso. Conseqüentemente, acreditamos que pode ser implementada facilmente em intervalos amplos de tipos de dados e usuários finais de uma forma que pode ser facilmente comparados e contrastados, tornando-se uma grande ferramenta para ChIPseq análise de dados que pode ajudar na colaboração e corroboração entre grupos de pesquisa. Aqui, demonstramos a aplicação do factor de transcrição de BCP existente 10,11 e 12 epigenéticas dados para ilustrar a sua utilidade.
Nós nos propusemos a desenvolver um modelo de análise de dados que possam identificar ChIPseq ambas as estruturas puntiformes e difusos dados igualmente bem. Até agora, as regiões de enriquecimento, as regiões particularmente difusas, que refletem a expectativa pressuposto de tamanho grande ilha, têm sido difíceis de identificar. Para resolver esses problemas, foram utilizados os mais recentes avanços na tecnologia de HMM, que possuem muitas vantagens sobre os modelos heurísticos existentes e HMMs menos inovado…
The authors have nothing to disclose.
STARR prêmio fundação (MQZ), NIH concessão ES017166 (MQZ), NSF concessão DMS0906593 (HX).
Name of the reagent | Company | Catalogue number | Comments (optional) |
Linux-based workstation |