Journal Club/Metagenomics

Материал из Институт биоинформатики
Перейти к: навигация, поиск

Метагено́мика — это раздел молекулярной генетики, в котором изучается набор генов всех микроорганизмов, находящихся в образце среды, — метагеном. Метагеномный анализ позволяет определить состав микробного сообщества исследуемого образца без необходимости выделения и культивирования микроорганизмов[1].

Основным преимуществом использования метагеномного подхода является учет не только культивируемых микроорганизмов, но и некультивируемых. Метагеномика позволяет детально изучить разнообразие сообществ, а значит и выяснить механизмы их функционирования, определить метаболические взаимосвязи.

Широкое развитие метагеномики обусловлено распространением NGS, которые позволяют получить последовательности практически всех генов каждого микроорганизма сообщества. Так как цена на секвенирование ДНК падает с каждым днём, такой анализ становится всё более доступным.

Bayesian mixture analysis for metagenomic community profiling[2]

Цель статьи - научиться хорошо выявлять виды в метагеномных данных. Это может быть важно для выявления патогенов в пробах, например, кишечной микробиоты.

Проблемы:

  • Короткие риды могут принадлежать сразу нескольким организмам
  • Неполнота существующих баз данных - многие риды остаются неклассифицируемыми
  • Разные виды представлены разным количеством ридов. Патогены в малых количествах, эндосимбионты - представлены большим количеством.

Существует 2 основных подхода к классификации: 2 подхода: composition-based (ГЦ-состав, Анализ рестрикционных фрагментов) и similarity-based (работает аналогично BLAST) — очень чувствительный, но также и зависим от ошибок в ридах. Есть гибридные подходы, использующие и то, и то. В данной статье использовались similarity based методы.

Авторы статьи написали R-пакет MetaMix[3]. Для его создания авторы применили стратегию, основанная на обучении Монте-Карло цепей Маркова (MCMC), с использованием параллельных вычислений для ускорения вывода. Все детали работы алгоритма можно посмотреть в презентации #1[4] или в самой статье. Данный инструмент умеет выявлять редкие патогены, встречающиеся в клинических образцах. При сравнении с другими существующими утилитами (Pathoscope, MEGAN) дают хороший результат.

Работа представленного алгоритма была провалидрована на искусственном датасете FAMeS — там уже известно, сколько каких видов содержится. Metamix нашел 113 из 116 видов. Pathoscope и Megan нашли виды гораздо менее точно. А затем взяли РНК-сек из ткани больного ребенка и нашли там астровирус. И потом биологическими методами подтвердили присутствие вируса.

Fast and sensitive taxonomic classification for metagenomics with Kaiju[5]

В данной статье также используются similarity-based подходы. Для анализа используются классификаторы использующие информацию о к-мерах. Такой подход страдает, потому что у него невероятно плохой recall, поэтому многие риды не классифицируются. Поэтому авторы создали свой классификатор с высокой чувствительностью. Особенность этого алгоритма в том, что риды предварительно транслируются в белковую последовательность, так получается точнее и выше устойчивость к ошибкам. Также данный алгоритм хорошо работает с памятью, что позволяет достичь высокой производительности(несколько млн ридов обрабатываются за минуты). Подробности работы и результаты тестирования алгоритма можно почитать в самой статье или посмотреть презентацию #2[4] докладчиков. Алгоритм был также протестирован на реальных данных в сравнении с известными программами KRAKEN и CLARK. И, разумеется, показал более высокие результаты.

Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota[6]

С развитием метагеномики были найдены ассоциации со многими хроническими заболеваниями человека и изменениями в составе его микробиоты. Однако, в этих исследованиях не проводился контроль режима лечения и эти ассоциации могут быть объяснены эффектом от лекарств на микробиоту.

Авторы статьи провели свой мета-анализ. Данные были отбраны так, чтобы лечение было схожим. Работали с данными китайцев, шведов и датчан. Рассматривали диабет 1-го и 2-го типов. По всем имеющимся метагеномам построили distance matrix натравили PCA. Выделили три компоненты - больные(принимающие лекарства и нет) и здоровые люди. Далее провели исследование действия метаформина. Метформин снижает концентрацию глюкозы в крови путём угнетения образования глюкозы (глюконеогенеза) в печени.

Получилась очень интересная картина - под воздействием метаформина состав микробиоты смещается и происходит улучшение контроля уровня глюкозы в крови. Вот только непонятно, где курица, а где яйцо)) Наглядно результаты можно посмотреть в презентации #3[4] авторов доклада.

Plankton networks driving carbon export in the oligotrophic ocean[7]

Авторы статьи -участники экспедиции TARA Oceans,которая собирала пробы воды в Мировом Океане по ходу своего следования. Кроме проб воды также фиксировали гидрографические данные, содержание питательных веществ в фотической зоне (зоне фотосинтеза), кислорода и профиль видимости под водой, то есть содержание частиц размером > 250 μm.

Что было проанализировано в статье:

  • 68 точек забора воды
  • ~40 млн неповторяющихся генов
  • 2.3 млн эукариотических 18S rDNA,
  • 5,476 вирусных ‘популяций’

Анализ проводился с помощью Weighted Gene Correlation Network Analysis(WGCNA), который

  1. Строит сеть, в которой свойства - это узлы (в данном случае, виды планктона или функции генов), а связи показывают частоту совместной встречаемости.
  2. Затем WGCNA кластеризует сеть в подсети, которые можно анализировать на предмет значимых взаимоотношений.
  3. После этого выделяются ключевые узлы сети.

Авторы показали, что специфические планктонные сообщества коррелируют с экспортом углерода на 150-метровой глубине. Как наиболее ассоциированные с экспортом углерода в субтропических, бедных питательными веществами регионах неожиданно выявляются новые таксоны, такие как, например, Radiolaria и паразиты-альвеолярии, Synechococcus и их фаги. Также по присутствию некоторых бактериальных и вирусных генов можно предсказывать уровень экспорт углерода в данных регионах. Подробнее посмотреть о методах, выводах и просто картиночки можно в презентации #4[4]

Ссылки

  1. Метагеномика https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%B0%D0%B3%D0%B5%D0%BD%D0%BE%D0%BC%D0%B8%D0%BA%D0%B0
  2. Bayesian mixture analysis for metagenomic community profiling http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4565032/
  3. CRAN http://cran.r-project.org/web/packages/metaMix
  4. 4,0 4,1 4,2 4,3 Презентации 9й недели https://drive.google.com/folderview?id=0B_me217Elj19T3Z1WFZJc3c4ajA&usp=sharing
  5. Fast and sensitive taxonomic classification for metagenomics with Kaiju http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4833860/
  6. Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4681099/
  7. Plankton networks driving carbon export in the oligotrophic ocean http://www.ncbi.nlm.nih.gov/pubmed/26863193