Облака спасают жизни и восстанавливают здоровье

Алиса Кандеева
опубликовано:
Что общего между облаками, Big Data и онкологией? Как облачные технологии могут помочь в борьбе с серьезными заболеваниями? Оказывается, связь есть: использование облачных решений в процессе секвенирования генома позволяет вовремя выявить опасность заболевания и принять нужное решение.


Облачные технологии утратили флер таинственности, превратившись в обычный инновационный инструмент, без которого сложно представить современный бизнес. Конечно, человечество еще далеко не в полной мере оценило преимущества использования облаков и не всегда способно определить, чем они могут быть полезны. Однако прикладная ценность облачных решений недавно обрела еще один очень наглядный пример – борьба с тяжелыми заболеваниями и, в первую очередь, с онкологией. Попробуем разобраться, чем связаны медицина и облачные технологии и каковы перспективы этого альянса.


НЕСКОЛЬКО СЛОВ О ГЕНОМИКЕ
Начнем с естественных наук. Как известно (а кому неизвестно – Google подскажет и пруфами снабдит))), более пятнадцати лет назад сбылась мечта всех генетиков, медиков и визионеров-идеалистов всего мира: в 2001 году, согласно опубликованному исследованию американского генетика Крейга Вентера (Craig Venter), произошла долгожданная расшифровка человеческого генома. Дальше – больше: в 2003 году в рамках крупнейшего международного биоинформационного проекта «Человеческий геном» (The Human Genome Project, HGP) была прочитана последовательность 92% нуклеотидов (до сих пор лишь малая часть, от 4% до 9% генома остается нерасшифрованной). И это открыло путь для диагностики состояния организма на уровне генного анализа.

Что это означает? Что с помощью специальной технологии вы можете узнать, есть ли у вас генетическая восприимчивость или, наоборот, непереносимость каких-либо медикаментов или веществ (анестетиков, антибиотиков, определенных белков, алкалоидов и т.д.). Вы можете получить ответ на вопрос, почему у вас именно такое телосложение и почему одни диеты не приносят желаемого результата, а другие обладают почти магическим действием. Наконец, вы можете просчитать вероятность развития у вас наследственных заболеваний, основываясь на анализе ДНК и выбрать оптимальный способ лечения. Например, знаменитая звезда Голливуда Анджелина Джоли (Angelina Jolie) в 2013 году воспользовалась технологией секвенирования ДНК и, получив результаты, приняла решение о сложной операции, превентивной двойной мастэктомии: в ее геноме обнаружился мутированный ген BRCA1, приводящий к онкологическому заболеванию, причем вероятность появления опухоли у Энджи превысила 87%. Кстати, ее пример вдохновил многих людей на проведение генного секвенирования в целях получения точной информации о состоянии организма, а сама Анджелина стала символом пробуждения сознательного отношения к своему будущему.

Предиктивная медицина (основанная на прогнозе вероятности развития заболевания) – наиболее известная прикладная сфера, где уже применяют анализ секвенированного генома, но и ею уже не ограничиваются. Секвенированный геном пациента позволяет выяснить эффективность действия применяемого лечения и воздействия лекарственных препаратов на организм. Бывает так, что человек годами борется с заболеванием, применяя различные средства и методы терапии, но все безрезультатно. Так произошло с Эриком Дишманом (Eric Dishman), руководителем исследовательской программы «Все мы» (All of Us) при Национальном институте здравоохранения США (National Institutes of Health, NIH): в возрасте 19 лет он узнал, что болен редкой формой рака почек, и согласился участвовать в экспериментальном лечении. Двадцать лет мужчина тщетно боролся с онкологией, послушно сменяя одно неэффективное лечение другим таким же. За это время стоимость секвенирования генома постепенно снижалась и наконец достигла уровня, доступного Эрику. Получив результаты расшифровки своей ДНК, он был поражен: как оказалось, 92% лекарств, которые применялись в ходе его терапии, на него просто не действовали, а врачи этого не знали и не могли предвидеть – до того, как геном пациента был наконец расшифрован. Ныне Эрик Дишман – один из наиболее ярых сторонников развития технологии секвенирования, активно популяризирует ее в мировом сообществе и выступает за дальнейшее снижение стоимости этой довольно еще дорогостоящей процедуры, чтобы сделать ее доступной каждому.


ПОЧЕМУ КУСАЕТСЯ ЦЕНА
Итак, в 2001 году был расшифрован геном одного человека. Несмотря на повышенный интерес к новым возможностям, открытым технологией секвенирования, число счастливчиков, кто постиг свою «глубинную суть», записанную в нуклеотидных цепочках ДНК, расти не торопилось – второй случай полного секвенирования генома был зафиксирован лишь в 2007 году. Покойный ныне основатель Apple Стив Джобс решил секвенировать часть своих генов после того, как ему поставили онкологический диагноз, став всего лишь двадцатым человеком в мире, чей геном прочитали. К сожалению, в его случае расшифровка ДНК опухоли и лечение на ее основе оказались бессильны.

В чем же причина того, что очень перспективная технология не получала широкого распространения? С одной стороны, дело в банальном: цена кусается.

см. график "Снижение средней стоимости секвенирования генома"; источник: https://www.genome.gov/

На графике видно, как резко за последнее десятилетие упала средняя стоимость секвенирования: еще в начале века она составляла более 100 млн долларов (по другим данным, в 2003 году стоимость была 2,7 млрд долларов), до 2007 года снизилась на порядок, но уже к концу 2008 года резко сократилась до 500 тысяч долларов и продолжила снижение практически по экспоненте. Зато сейчас, по состоянию на конец 2017 года, расшифровать ваш геном можно уже за 1 тысячу долларов. Иными словами, если десять лет назад расшифровка ДНК стоила сравнимо с хорошим внедорожником (а еще раньше – буквально, как личный самолет), то сейчас – всего лишь, как iPhone X. И смелые прогнозы некоторых производителей заставляют верить, что в ближайшие пару лет снижение стоимости будет продолжаться.

Впрочем, резкое снижение стоимости – лишь одна сторона медали. Так же радикально выросла скорость операции секвенирования: на своем начальном этапе технология поглощала массу времени из-за огромного массива данных, подлежащих анализу. Расшифровка длилась годами. Как уже говорилось выше, в 2007 году один из открывателей структуры ДНК Джеймс Уотсон (James Watson) стал лишь вторым в мире человеком, чей геном секвенировали полностью. Еще в 2013 году в большом и увлекательном очерке, посвященном теме геномики, английская журналистка и писательница Кэрол Кэдуоладр (Carole Cadwalladr) поделилась личным опытом: ждать результатов прочтения ее ДНК ей пришлось почти год. Сейчас на секвенирование уходит еще меньше времени – до пары дней.

Множество стартапов и крупных компаний ринулись в соревнование, кто создаст самый быстрый и доступный по цене секвенатор. В чем же причина роста скорости анализа ДНК и снижения стоимости? И тут мы подходим к самому интересному. Да, именно облака и использование инструментария анализа Big Data способствуют этому. Благодаря интеграции подходов к искусственному интеллекту, большим данным и облачным вычислениям с передовыми методиками анализа ДНК, секвенирование генома теперь завершается с меньшими затратами и более быстрыми темпами, чем когда-либо прежде.


ЭТИ БОЛЬШИЕ-БОЛЬШИЕ ДАННЫЕ…
Они действительно большие. Очень большие:

В каждом геноме насчитывается 6,4 миллиарда пар оснований.
Результаты расшифровки полного генома «весят» от 200 гигабайт до полтерабайта.
The Cancer Genome Atlas содержит примерно 5 петабайт данных – это результаты исследования парных образцов из 14,5 тысяч случаев.
В крупнейшей базе данных BRCA Exchange, где содержится информация о мутациях генов BRCA1 и BRCA2 (вызывают, соответственно, рак молочной и предстательной желез), находятся 17 800 вариантов генома.
На симпозиуме, посвященном проблемам секвенирования ДНК, который проводила компания Illumina, бесспорный лидер на рынке производства секвенаторов, в 2013 году, была приведена любопытная статистика аналитики BigData в процессе работы над анализом генома: компания выявила на тот момент 1 600 болезнетворных генов, которые в геномах 47 человек, присутствовавших на мероприятии и прошедших процедуру секвенирования, находились в 1 221 вариации; затем исследователи компании оценили 23 144 варианта возможных поведенческих ролей генов в заданных условиях, и пришли к выводу, что 65, вероятно, будут патологическими вариантами, которые могут играть определенную роль в возникновении болезни.

Масштаб этих цифр заставляет задуматься над тем, какими средствами можно с ними работать. Разумеется, для этих данных нужно и хранилище – надежное, безопасное, закрытое от угроз конфиденциальности и при этом доступное для обмена данными внутри аналитической группы. Семнадцать лет назад обеспечить такие вычислительные мощности, объем СХД, защитные механизмы ИТ-безопасности и соответствующий трафик было, с одной стороны, еще невозможно технически, с другой стороны, использование максимально «продвинутых» технологий стоило, как… ну да, как самолет :) Точнее, как строительство целого аэродрома – со всеми его ВПП, башнями, ангарами, метеостанциями и прочей инфраструктурой.

Действительно, локальный анализ даже на суперкомпьютере в каком-то научном центре затянет процесс на долгое время и будет стоить чересчур дорого.

Перенеся же данные в облако, можно достичь сразу нескольких целей:

- надежное хранение всех данных по проекту;
- ускорение обработки данных отдельного генома и сопоставление его со статистикой;
- гибкая конфигурация (в процессе секвенирования большую роль играет оперативная память, а число ядер процессора практически не имеет решающего значения);
- использование вычислительных мощностей именно в тот момент, когда это требуется (в отличие от суперкомпьютеров в научном центре, где ученым приходится ждать своей очереди на вычисление);
- взаимодействие проектной группы вплоть до международных масштабов;
- доступ в любое время из любой точки планеты к проекту.

Плюс – с облаком решаются вопросы стоимости оборудования и поддержания его в надлежащем виде. Активное использование функционалов PaaS, IaaS, SaaS позволяют масштабировать проект в тех направлениях, которые необходимы на том или ином этапе. Например, для обработки статистических данных по мутациям некоторых генов и просчета вероятности патогенного развития, требуется специализированное ПО, которое достаточно просто интегрируется в облако.


КУДА ПЛЫВУТ ОБЛАКА?
Работа с базой данных расшифрованных геномов тоже упрощается с использованием облаков. Чем большей будет эта база, тем лучше исследователям удастся изучить факторы возникновения многих тяжелых заболеваний и разработать новые методы профилактики и лечения. По словам СЕО компании Illumina Джея Флэтли (Jay T. Flatley), для достижения успеха в изучении такого сложного заболевания, как рак, необходимо проанализировать сотни тысяч геномов, и с помощью современных технологий это становится возможным.

Это не фантастика – это наша с вами реальность. Так работает множество компаний. У AWS даже есть отдельный функционал, разработанный именно для команд, занимающихся геномикой (например, Broad Institute в Кембридже и Институт геномной медицины Национального медицинского университета Сеула), и Amazon активно развивает это направление, создавая свои собственные решения, основанные на анализе взаимодействия с подобными проектами. Возможна даже интеграция проектов и их частей, размещенных в разные облака.

Использование облаков, больших данных, ИИ, генного анализа уже в обозримом будущем приведут человечество к созданию персонализированной медицины, когда основная масса болезней будет устранена еще до появления. Помимо геномных исследований, огромный потенциал востребованности этих технологий у таких отраслей, как биоинформатика, биохимия, фармакология, биотехнологии и др.

Приятно на этом фоне звучит новость, озвученная компанией Illumina почти год назад, в январе 2017 года, на конференции по биотехнологиям в Сан-Франциско, что новое оборудование линейки секвенаторов NovaSeq позволит в течение ближайшего десятилетия снизить стоимость расшифровки генома с 1 000 долларов на порядок – всего лишь до 100 долларов за процедуру. По сравнению со своими предшественниками, они делают всего 8 шагов при анализе вместо 38, позволяют контролировать быстро корректность загрузки данных и выполняют процедуру анализа в шесть раз быстрее.

То есть через десять лет проблема секвенирования генома перестанет быть финансовой и перейдет в категорию сознательности каждого. В конце концов, забота о своем здоровье – ответственность персональная.

Но даже уже сейчас мы можем с уверенностью сказать, что облачные технологии действительно меняют мир и улучшают качество жизни. Даже больше. Вряд ли будет преувеличением сказать, что облака на самом деле спасают жизни и заботятся о здоровье человечества. Пожалуй, это лучшая иллюстрация потенциала технологии.



*** При подготовке материала использовались ресурсы:

http://mygenome.su
https://www.theguardian.com
http://www.informationweek.com
https://biomolecula.ru
http://www.dataversity.net
http://igr.com.ua
https://scientificrussia.ru
https://geektimes.ru
http://www.remedium.ru
https://aws.amazon.com
https://www.popmech.ru
https://futurist.ru
https://www.genome.gov
https://aeon.co

Автор: Алиса Кандеева