Использование графических процессоров для моделирования экспериментов атомной силовой микроскопии

In vitro – in silico
Современные технологии, предназначенные для изучения одиночных молекул, такие как атомно-силовая микроскопия (АСМ) и оптические пинцеты, широко используются для экспериментального изучения механических свойств одиночных белков, белковых волокон и белковых образований. Экспериментальная установка представляет собой площадку с адсорбированным субстратом и очень чувствительным кронштейном. Кронштейн или кантилевер заканчивается иглой-зондом, диаметр конца которой имеет размер порядка 10 нм. В процессе эксперимента кронштейн совершает периодические движения вверх и вниз, соприкасаясь с поверхностью и удаляясь от нее. При удачном эксперименте, единичная молекула субстрата адсорбируется на зонде, приподнимается с поверхности и денатурирует в процессе движения зонда вверх. Освещаемый лазером кронштейн при этом сгибается и отражаемый лазерный луч смещается. По этому смещению можно определить отклонение кронштейна и, зная его коэффициент упругости, силу, действующую насубстрат.
Таким образом можно получить зависимость силы от растяжения белка и характеризовать его механические свойства.
Результатами экспериментов атомной силовой микроскопии являются зависимости силы от растяжения, при этом информацию о процессах, происходящих внутри самого белка получить не удается. К тому же, анализ экспериментальных данных усложняется тем, что необходимо отобрать удачные замеры от неудачных, учесть погрешность экспериментальной установки, изменение внешних условий и т.п..
Избежать возможных ошибок в настолько чувствительном эксперименте действительно сложно, и анализ результатов зачастую строится на знаниях о кристаллической структуре исследуемого белка без учета возможных динамических изменений в нем. Для того, чтобы дополнить данные натурного эксперимента (in vitro), ученые все чаще прибегают к эксперименту численному (in silico), поскольку использованием молекулярного моделирования можно получить детальную информацию о поведении системы, вплоть до перемещения единичных атомов.
На доли секунды
Наиболее популярным классическим подходом моделирования биологических молекул является молекулярная динамика: за структурные единицы берутся атомы молекулы, а ковалентные и нековалентные взаимодействия описываются потенциальной функцией, включающей в себя вибрации длины ковалентных связей, углов между смежными связями, торсионных углов, электростатических взаимодействий и взаимодействий Ван-дер-Ваальса. Скорость расчета молекулярной динамики ограничивают два фактора. Первый – количество степеней свободы моделируемой системы. Действительно, даже небольшой белок размером ~ 90 аминокислот содержит в себе ~ 1500 атомов, а при явном добавлении водного растворителя, количество элементарных структурных единиц в системе увеличится примерно в 10 раз за счет атомов воды. Теоретически данное ограничение можно обойти с помощью высокопараллельных расчетов. Расчет сил, действующих на все атомы в системе, может производиться независимо. Второе ограничение является более существенным. В силу малых размеров структурных единиц системы (атомы) и во избежание численной нестабильности, вычисления приходится производить с очень коротким временным шагом в 1-2 пс. То есть даже получение динамики длинной в микросекунды потребует численного решения уравнений движения на протяжении 109 шагов, что попросту недосягаемо для среднестатистической научной группы, не имеющей доступа к высокопроизводительным вычислительным мощностям.
 Сквозь призму кристалла
Чтобы обойти перечисленные ограничения, можно использовать упрощенные методы молекулярного моделирования. В этом случае группа атомов объединяется в одну структурную единицу, за счет этого существенно сокращается количество степеней свободы. Наряду с очевидными достоинствами данного подхода (меньше степеней свободы, более длинный шаг по времени) существует и ряд недостатков. Во-первых, чем грубее упрощение (чем больше атомов объединено в одну структурную единицу), тем сложнее параметризировать систему.Кроме того, при слишком грубом упрощении модель может вообще потерять предсказательную способность, а ее полезность будет весьма сомнительной. Самый популярный подход к упрощению белковых молекул заключается в переходе на уровень аминокислот (Cα-модели или модели типа Gō). К сожалению, многочисленные попытки параметризовать взаимодействия двух типов аминокислот оказались не очень удачными – такая аппроксимация позволяет получать адекватные результаты для ограниченного набора белков и оказывается совсем не пригодной для других белков.
Дело в том, что из-за сложности молекулярной геометрии на атомарном уровне, важно не только взаимное расположение аминокислот, но также их взаимная ориентация и близость к поверхности белка. Поэтому единственным зарекомендовавшим себя способом параметризации является подход, основанный на кристаллической структуре белка. В этом случае считается, что аминокислоты, находящиеся близко в кристаллической структуре, взаимодействуют притягательно, остальные – отталкиваются. Это ведет ко второму ограничению для использования упрощенных моделей – необходимо наличие кристаллической структуры моделируемого белка. Также стоит отметить, что упрощенные модели не очень универсальны, а скорее узкоспециализированы. Так, отдельно существуют упрощенные модели, разработанные для объяснения механических свойств белка, расчета энергии взаимодействия белок-белковых комплексов или объяснения кинетики сворачивания белка.
Тысяча и один размер
Данные эксперимента и компьютерного моделирования хорошо дополняют друг друга, а сравнительный анализ лучше учитывает погрешность эксперимента in vitro и неточности используемой in silico математической модели.
Для проведения подобного сравнительного анализа необходимо, чтобы эксперимент и моделирование были проведены в одинаковых условиях, что довольно проблематично. Действительно, из-за наличия погрешности в эксперименте и конечного разрешения экспериментальных установок, удобнее работать с большими системами на длинном временном интервале. С другой стороны, чем больше система, тем сложнее ее моделировать, а большие временные интервалы требуют большого количества шагов интегрирования по времени.
Выбор того или иного подхода к моделированию должен определяться вычислительными возможностями, длительностьюисследования, а также доступными экспериментальными данными. В каждом случае лучше использовать наиболее точный метод. При этомнеобходимо учитывать условия и временные рамки, максимально приближенные к эксперименту, что не всегда просто. Например, время одного экспериментального замера в атомной силовой микроскопии составляет ~ 1 секунду. Проведение молекулярной динамики длиной в 1 секунду потребует численного решения уравнений движения на протяжении 1015 шагов при шаге по времени в 1 пс, что невозможно дажедля маленьких белков с использованием самых современных вычислительных систем. А что, если требуется промоделировать поведение капсулы вируса, размером в 100000 аминокислот? Или хотя бы такого белка как фибриноген, размером в 2000 аминокислот? Для систем такого размера выбор в пользу упрощенной методики моделирования очевиден, только данная методика позволяет использовать в эксперименте in silico условия, идентичные используемым в эксперименте in vitro. Для моделирования эксперимента атомной силовой микроскопии хорошо подходит модель самоорганизующегося полимера (SOP от англ. Self Organized Polymer), которая уже была успешноприменена для объяснения микромолекулярного механизма целого ряда белков. В силу большого размера системы (~2000 аминокислот) использование даже такой простой модели только на одном вычислительном ядре не представляется возможным – моделирование одной траектории денатурации фибриногена заняло бы больше года компьютерного времени. Поэтому встала необходимость привлеченияаппаратного ускорения современных графических процессоров.
Вектор потока
На графических процессорах (ГП) большое количество логических элементов отведено для вычислений, а модули контроля процедур и кеша уменьшены. Благодаря этому плотность арифметических логических устройств (АЛУ) на ГП существенно выше, чем на ЦП. Для того, чтобы загрузить все АЛУ вычислениями, ГП должен выполнять множество операций одновременно. Это осуществляется при помощи вычислительных потоков, каждый из которых выполняет те же самые арифметические операции, но на разных элементах массива данных. Например, на ЦП сложение двух векторов размерности M необходимо осуществлять в цикле. При этом все элементы складываются последовательно один за другим. На ГП подобная процедура может быть выполнена в M-независимых потоках, каждый из которых получает один элемент результирующего вектора. Таким образом, все элементы суммы могут быть получены одновременно, и время подобной операции соответствует времени выполнения одного сложения против M-сложений на ЦП. Это в теории. На практике количество вычислительных единиц на ГП ограничено. На новейших ГП от компании NVidia общее число АЛУ достигает 512, а пиковая производительность может достигать 1 ТФлопса. Для того чтобы достигнуть подобной производительности, численный алгоритм должен быть хорошо параллелизуемым и вычислительно емким.
В биомолекулярном моделировании с использованием молекулярной динамики или упрощенных моделей, взаимодействия между частицами описываются при помощи потенциальной функции (силового поля). Функциональная часть силового поля одинакова для всех частиц в системе, а уравнения движения всех частиц могут быть численно проинтегрированы независимо друг от друга. Благодаря такому соответствию между архитектурой ГП и вычислительными процедурами молекулярной динамики, численные алгоритмы последней могут быть успешно реализованы на ГП.
В результате адаптации модели SOP для работы на графических процессорах, удалось получить скорости вычислений на 2 порядка превосходящие аналогичный показатель на центральном процессоре. То есть вычисления, которые бы занимали год, можно производить за 3-4 дня, что позволило впервые промоделировать механическую денатурацию больших белков в условиях идентичных экспериментальным за короткое время.
Удачный симбиоз упрощенной модели и аппаратного ускорения графических процессоров позволил впервые произвести молекулярное моделирование механической денатурации белка фибриногена.
Вычислительный микроскоп
Фибрин – основная структурная единица сгустка крови – получается из фибриногена путем удаления блокирующих полимеризацию пептидов. Уникальные механические свойства кровяного сгустка позволяют организму эффективно останавливать кровотечение, а ихнарушения могут привести как к возникновению тромбов, инсультам и инфарктам, так и к повышенному кровотечению. Являясь основной структурной единицей кровяного сгустка, фибрин во многом определяет его механические свойства. Молекулярное моделирование механизмов денатурации димера и мономера фибриногена, а также его отдельных элементов, позволило получить структурную информацию о механике фибрина. Уникальность данного исследования еще и в том, что анализ результатов эксперимента in silico проводилсяодновременно с анализом данных эксперимента in vitro. При этом в отличие от эксперимента in vitro, в котором единственной доступной информацией были графики зависимости силы от растяжения, моделирование выполняло роль «вычислительного микроскопа», который позволил детально проанализировать происходящие в молекуле микромолекулярные процессы.
Возможности полученной программной реализации не ограничиваются размером исследуемой системы в 2000 аминокислот.Реализация упрощенной модели SOP на ГП позволила детально изучить микромеханику капсулы вируса HK97, размером в ~115000 аминокислот. В процессе моделирования был использован как протокол, достаточно близкий к АСМ-экспериментам, так и тот, в котором внешнее воздействие прилагалось быстрее. Полученные результаты показали, что ответ вируса на внешнее воздействие сильно зависит и от скорости движения воздействующего зонда, и от его геометрии (радиуса зонда). В процессе моделирования наблюдался спектр всевозможных реакций капсулы на внешнее воздействие – от быстрого вминания и равномерного продавливания при малых силах до механического разрыва при больших. Это показывает, насколько важно учитывать механизм внешнего воздействия и параметрыэкспериментальной установки при анализе результатов эксперимента.
Кроме перечисленных результатов, программа SOP-GPU была применена для объяснения механических свойств синаптотагмена (Syt1) человека, ведутся исследования механических свойств целого ряда вирусов, инкапсулина, микротрубочек. В перспективе, модель может быть дополнена боковыми радикалами аминокислот, что позволит изучать кинетику сворачивания белков.
Ярослав ХОЛОДОВ,
Артем ЖМУРОВ
Вы можете оставить комментарий, или ссылку на Ваш сайт.

1 комментарий к записи “Использование графических процессоров для моделирования экспериментов атомной силовой микроскопии”

  1. Вопрос.Используется ли графен и углеродные нанотрубки в экспериментах атомной силовой микроскопии для иглы зонда?
    У них очень маленький поперечный размер(толщина).
    Например у нанотрубок диаметр от 1 до 5 нанометров.
    У графена тольщина слоя 0.34 нанометра.

    Поэтому использование иглы зонда измерительного прибора с размерами на порядок меньше позволит точнее определить некоторые параметры аминокислот.

    По вычислениям.

    Какие интересно нужно ресурсы вычислительные на графических картах, чтобы провести расчет, указанный в сообщении? Например, достаточно ли процессора Xeon 1660 и 4 графических карт типа R9 280 X и оперативной памяти 32 Гб?

Оставить комментарий к записи Дмитрий