Новости

AlphaGenome: искусственный интеллект расшифровывает «темную материю» генома

Последовательность человеческого генома собрана почти полностью, но функции большей части его некодирующих участков остаются загадкой. Эти регионы, составляющие ~98% ДНК, управляют активностью генов через регуляцию хроматина, сплайсинга РНК и других процессов. Однако интерпретация генетических вариантов в этих областях — сложная задача, требующая анализа их влияния на молекулярные фенотипы.
От белков к ДНК: новый инструмент от DeepMind
Компания DeepMind, известная разработкой AlphaFold для предсказания структуры белков, представила AlphaGenome — модель глубокого обучения, которая связывает последовательность ДНК с 11 категориями молекулярных данных (модальностями). К ним относятся:

· Экспрессия генов,
· Связывание транскрипционных факторов,
· Модификации гистонов,
· Трехмерные контакты хроматина (Hi-C карты),
· Сплайсинг РНК
· и другие...

AlphaGenome анализирует участки ДНК длиной до 1 мегабазы с разрешением в одну пару оснований. Модель обучена на данных геномов человека и мыши, что позволяет прогнозировать, как мутации в некодирующих регионах повлияют на клеточные процессы.
Тестирование и преимущества
В экспериментах AlphaGenome продемонстрировала высокую точность. Например, при оценке клинически значимых вариантов вблизи онкогена TAL1 модель превзошла специализированные алгоритмы, такие как Orca (для анализа хроматиновых контактов). По данным авторов, AlphaGenome лидирует в 22 из 24 задач предсказания геномных треков и 24 из 26 задач оценки эффектов мутаций.
Ограничения и перспективы
Несмотря на успехи, модель имеет ограничения:

1. Точность падает при прогнозировании влияния последовательностей, удаленных от гена более чем на 100 тыс. пар оснований.
2. Обучение проводилось только на данных человека и мыши, что ставит под вопрос применимость к другим организмам.

Как отмечает Аншул Кундадже, эксперт по вычислительной геномике из Стэнфорда, AlphaGenome пока не достигла уровня AlphaFold в предсказании структур белков, но уже стала важным шагом в изучении регуляции генов.
Применение и доступность
AlphaGenome доступна для некоммерческих исследований через API. Разработчики планируют расширить функционал, включив новые типы данных и организмы. Это может ускорить поиск терапевтических мишеней, интерпретацию клинических вариантов и понимание эволюции генома.
Значение работы
Модель DeepMind открывает эру системной интерпретации «темной материи» генома, связывая генетические варианты с их молекулярными последствиями. Это ускорит диагностику генетических заболеваний и разработку персонализированных методов лечения.
Дата публикации: 03.07.2025

Первоисточник:
Avsec Z. et al. AlphaGenome: advancing regulatory variant effect prediction with a unified DNA sequence model (preprint 25.06.2025)

https://storage.googleapis.com/deepmind-media/papers/alphagenome.pdf