С момента появления мРНК-вакцин против COVID-19 стало очевидно: это не просто технология для пандемий, а фундамент нового поколения медицины. Однако, несмотря на успех, у мРНК есть слабое место – короткая продолжительность действия и низкая эффективность экспрессии белка. Для лечения хронических заболеваний, таких как анемия или рак, этого недостаточно. Однако, количество потенциально последовательностей мРНК так велико, что даже для одного белка можно составить миллиарды вариантов кодирующей последовательности (CDS) и нетривиальных регуляторных участков (UTR), и большинство из них будут работать плохо. Традиционные методы оптимизации, основанные на правилах (например, выбор самых частых кодонов) слишком примитивны. Они не учитывают контекст, структуру РНК и скрытые биологические закономерности.
Когда ИИ начинает "понимать" генетический язык
Группа ученых из Raina Biosciences и MIT предложила принципиально иной подход. Они разработали GEMORNA – генеративную модель на основе архитектуры трансформера, которая не просто анализирует, а создает новые мРНК с нуля. Идея проста: если нейросети умеют генерировать текст, почему бы не применить их к "тексту" жизни – последовательностям РНК?
Для создания кодирующей последовательности (CDS) модель обучали переводчика: белок – это "исходный язык", мРНК – "целевой". Она усвоила миллионы естественных пар "белок–мРНК" от 115 видов млекопитающих и научилась воспроизводить сложные паттерны, включая использование редких кодонов, стабильность пар кодонов и вторичную структуру. Для нетранслируемых участков (UTR), где нет жестких ограничений, использовалась другая архитектура – авторегрессивный декодер, способный генерировать последовательности "с листа".
Для создания кодирующей последовательности (CDS) модель обучали переводчика: белок – это "исходный язык", мРНК – "целевой". Она усвоила миллионы естественных пар "белок–мРНК" от 115 видов млекопитающих и научилась воспроизводить сложные паттерны, включая использование редких кодонов, стабильность пар кодонов и вторичную структуру. Для нетранслируемых участков (UTR), где нет жестких ограничений, использовалась другая архитектура – авторегрессивный декодер, способный генерировать последовательности "с листа".
Что делает GEMORNA лучше других?
Ключевое преимущество – многофакторная оптимизация. Вместо того чтобы гнаться за одним показателем (например, высоким содержанием GC), GEMORNA балансирует десятки параметров: частоту кодонов, стабильность мРНК, вероятность "зацикливания" рибосомы, взаимодействие между 5′ и 3′ UTR. Несмотря на то, что модель обучалась на естественных последовательностях, она смогла выйти за рамки природы, создавая последовательности, которые биологически "естественны", но функционально превосходят природные аналоги.
Одним из самых сильных предикторов эффективности оказалась оценка естественности – метрика, заимствованная из обработки естественного языка. Она показывает, насколько последовательность "похожа" на типичную для генома млекопитающих. Оказалось, что чем выше значение этой метрики, тем выше экспрессия и стабильность мРНК в клетках.
Одним из самых сильных предикторов эффективности оказалась оценка естественности – метрика, заимствованная из обработки естественного языка. Она показывает, насколько последовательность "похожа" на типичную для генома млекопитающих. Оказалось, что чем выше значение этой метрики, тем выше экспрессия и стабильность мРНК в клетках.
Практические результаты: от лаборатории к терапии
Эксперименты показали впечатляющие результаты. Матричные РНК, предложенные алгоритмом GEMORNA, продемонстрировали в 41 раз более высокую экспрессию люциферазы в клетках по сравнению с коммерческими аналогами. Для эритропоэтина (терапевтический белок) прирост составил до 15 раз, а также, в качестве бонуса, в ряде случаев наблюдалась пролонгированная экспрессия.
На вакцине против COVID-19 GEMORNA подтвердила свою универсальность. Новые мРНК вызывали значительно более высокие титры антител у мышей, чем как оригинальная вакцина BNT162b2, так и другие оптимизированные конструкции.
На вакцине против COVID-19 GEMORNA подтвердила свою универсальность. Новые мРНК вызывали значительно более высокие титры антител у мышей, чем как оригинальная вакцина BNT162b2, так и другие оптимизированные конструкции.
circРНК и CAR-T: выход за пределы линейных молекул
Особенно интересен успех GEMORNA в проектировании круговых РНК (circRNA). Эти молекулы устойчивы к разрушению и могут работать неделями. Используя упрощенную конструкцию (без сложных оптимизированных UTR), ученые создали circRNA с кодонами, сгенерированными ИИ. Такие молекулы показали в 13,8 раз более высокую накопленную экспрессию эритропоэтина и в 121 раз выше уровень белка in vivo.
В перспективной области CAR-T-терапии, где Т-клетки "программируют" для уничтожения рака, GEMORNA создала circRNA, кодирующую химерный антигенный рецептор (CD19 CAR). Эти клетки в 5,6 раз эффективнее убивали опухолевые клетки, чем те, что получили запатентованную конструкцию. При этом экспрессия CAR сохранялась более 5 дней (а не 3, как ранее), что критично для терапевтического эффекта.
В перспективной области CAR-T-терапии, где Т-клетки "программируют" для уничтожения рака, GEMORNA создала circRNA, кодирующую химерный антигенный рецептор (CD19 CAR). Эти клетки в 5,6 раз эффективнее убивали опухолевые клетки, чем те, что получили запатентованную конструкцию. При этом экспрессия CAR сохранялась более 5 дней (а не 3, как ранее), что критично для терапевтического эффекта.
Что дальше?
GEMORNA способна генерировать мРНК и circRNA для любых белков, с высокой эффективностью и стабильностью. Хотя модель пока остается "черным ящиком", ее практическая польза очевидна. В ближайшем будущем такие ИИ-системы могут стать стандартом для разработки мРНК-лекарств, сокращая путь от идеи к клиническому применению.
Дата публикации: 2025.09.05
Первоисточник:
Zhang H. et al. Deep generative models design mRNA sequences with enhanced translational capacity and stability. Science. 2025 Aug 28:eadr8470. doi: 10.1126/science.adr8470. Epub ahead of print. PMID: 40875799.
https://pubmed.ncbi.nlm.nih.gov/40875799/
Zhang H. et al. Deep generative models design mRNA sequences with enhanced translational capacity and stability. Science. 2025 Aug 28:eadr8470. doi: 10.1126/science.adr8470. Epub ahead of print. PMID: 40875799.
https://pubmed.ncbi.nlm.nih.gov/40875799/