Journal Club/Metagenomics
Метагено́мика — это раздел молекулярной генетики, в котором изучается набор генов всех микроорганизмов, находящихся в образце среды, — метагеном. Метагеномный анализ позволяет определить состав микробного сообщества исследуемого образца без необходимости выделения и культивирования микроорганизмов[1].
Основным преимуществом использования метагеномного подхода является учет не только культивируемых микроорганизмов, но и некультивируемых. Метагеномика позволяет детально изучить разнообразие сообществ, а значит и выяснить механизмы их функционирования, определить метаболические взаимосвязи.
Широкое развитие метагеномики обусловлено распространением NGS, которые позволяют получить последовательности практически всех генов каждого микроорганизма сообщества. Так как цена на секвенирование ДНК падает с каждым днём, такой анализ становится всё более доступным.
Содержание
- 1 Bayesian mixture analysis for metagenomic community profiling[2]
- 2 Fast and sensitive taxonomic classification for metagenomics with Kaiju[5]
- 3 Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota[6]
- 4 Plankton networks driving carbon export in the oligotrophic ocean[7]
- 5 Ссылки
Bayesian mixture analysis for metagenomic community profiling[2]
Цель статьи - научиться хорошо выявлять виды в метагеномных данных. Это может быть важно для выявления патогенов в пробах, например, кишечной микробиоты.
Проблемы:
- Короткие риды могут принадлежать сразу нескольким организмам
- Неполнота существующих баз данных - многие риды остаются неклассифицируемыми
- Разные виды представлены разным количеством ридов. Патогены в малых количествах, эндосимбионты - представлены большим количеством.
Существует 2 основных подхода к классификации: 2 подхода: composition-based (ГЦ-состав, Анализ рестрикционных фрагментов) и similarity-based (работает аналогично BLAST) — очень чувствительный, но также и зависим от ошибок в ридах. Есть гибридные подходы, использующие и то, и то. В данной статье использовались similarity based методы.
Авторы статьи написали R-пакет MetaMix[3]. Для его создания авторы применили стратегию, основанная на обучении Монте-Карло цепей Маркова (MCMC), с использованием параллельных вычислений для ускорения вывода. Все детали работы алгоритма можно посмотреть в презентации #1[4] или в самой статье. Данный инструмент умеет выявлять редкие патогены, встречающиеся в клинических образцах. При сравнении с другими существующими утилитами (Pathoscope, MEGAN) дают хороший результат.
Работа представленного алгоритма была провалидрована на искусственном датасете FAMeS — там уже известно, сколько каких видов содержится. Metamix нашел 113 из 116 видов. Pathoscope и Megan нашли виды гораздо менее точно. А затем взяли РНК-сек из ткани больного ребенка и нашли там астровирус. И потом биологическими методами подтвердили присутствие вируса.
Fast and sensitive taxonomic classification for metagenomics with Kaiju[5]
В данной статье также используются similarity-based подходы. Для анализа используются классификаторы использующие информацию о к-мерах. Такой подход страдает, потому что у него невероятно плохой recall, поэтому многие риды не классифицируются. Поэтому авторы создали свой классификатор с высокой чувствительностью. Особенность этого алгоритма в том, что риды предварительно транслируются в белковую последовательность, так получается точнее и выше устойчивость к ошибкам. Также данный алгоритм хорошо работает с памятью, что позволяет достичь высокой производительности(несколько млн ридов обрабатываются за минуты). Подробности работы и результаты тестирования алгоритма можно почитать в самой статье или посмотреть презентацию #2[4] докладчиков. Алгоритм был также протестирован на реальных данных в сравнении с известными программами KRAKEN и CLARK. И, разумеется, показал более высокие результаты.
Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota[6]
С развитием метагеномики были найдены ассоциации со многими хроническими заболеваниями человека и изменениями в составе его микробиоты. Однако, в этих исследованиях не проводился контроль режима лечения и эти ассоциации могут быть объяснены эффектом от лекарств на микробиоту.
Авторы статьи провели свой мета-анализ. Данные были отбраны так, чтобы лечение было схожим. Работали с данными китайцев, шведов и датчан. Рассматривали диабет 1-го и 2-го типов. По всем имеющимся метагеномам построили distance matrix натравили PCA. Выделили три компоненты - больные(принимающие лекарства и нет) и здоровые люди. Далее провели исследование действия метаформина. Метформин снижает концентрацию глюкозы в крови путём угнетения образования глюкозы (глюконеогенеза) в печени.
Получилась очень интересная картина - под воздействием метаформина состав микробиоты смещается и происходит улучшение контроля уровня глюкозы в крови. Вот только непонятно, где курица, а где яйцо)) Наглядно результаты можно посмотреть в презентации #3[4] авторов доклада.
Plankton networks driving carbon export in the oligotrophic ocean[7]
Авторы статьи -участники экспедиции TARA Oceans,которая собирала пробы воды в Мировом Океане по ходу своего следования. Кроме проб воды также фиксировали гидрографические данные, содержание питательных веществ в фотической зоне (зоне фотосинтеза), кислорода и профиль видимости под водой, то есть содержание частиц размером > 250 μm.
Что было проанализировано в статье:
- 68 точек забора воды
- ~40 млн неповторяющихся генов
- 2.3 млн эукариотических 18S rDNA,
- 5,476 вирусных ‘популяций’
Анализ проводился с помощью Weighted Gene Correlation Network Analysis(WGCNA), который
- Строит сеть, в которой свойства - это узлы (в данном случае, виды планктона или функции генов), а связи показывают частоту совместной встречаемости.
- Затем WGCNA кластеризует сеть в подсети, которые можно анализировать на предмет значимых взаимоотношений.
- После этого выделяются ключевые узлы сети.
Авторы показали, что специфические планктонные сообщества коррелируют с экспортом углерода на 150-метровой глубине. Как наиболее ассоциированные с экспортом углерода в субтропических, бедных питательными веществами регионах неожиданно выявляются новые таксоны, такие как, например, Radiolaria и паразиты-альвеолярии, Synechococcus и их фаги. Также по присутствию некоторых бактериальных и вирусных генов можно предсказывать уровень экспорт углерода в данных регионах. Подробнее посмотреть о методах, выводах и просто картиночки можно в презентации #4[4]
Ссылки
- ↑ Метагеномика https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%B0%D0%B3%D0%B5%D0%BD%D0%BE%D0%BC%D0%B8%D0%BA%D0%B0
- ↑ Bayesian mixture analysis for metagenomic community profiling http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4565032/
- ↑ CRAN http://cran.r-project.org/web/packages/metaMix
- ↑ 4,0 4,1 4,2 4,3 Презентации 9й недели https://drive.google.com/folderview?id=0B_me217Elj19T3Z1WFZJc3c4ajA&usp=sharing
- ↑ Fast and sensitive taxonomic classification for metagenomics with Kaiju http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4833860/
- ↑ Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4681099/
- ↑ Plankton networks driving carbon export in the oligotrophic ocean http://www.ncbi.nlm.nih.gov/pubmed/26863193