Визуализация эволюционной траектории: применение редуцированных аминокислотных алфавитов и встраивание Word2Vec
Аннотация:
Анализ эволюции вируса является ключевым элементом эпидемиологического надзора и контроля. Одним из основных инструментов, широко используемых для иллюстрации эволюционной истории, является филогенетическое дерево. Недавно мы предложили альтернативную визуализацию филогенетического дерева с использованием эволюционной траектории его таксонов. Эволюционная траектория — это путь, начинающийся от таксона и заканчивающийся корнем дерева. В этой статье мы предлагаем встраивание узлов дерева путем кодирования их генетической последовательности с использованием сокращенного аминокислотного алфавита и использования каркаса Word2Vec. Предложенная визуализация поддерживает филогенетические отношения между узлами, а их близость в трехмерном пространстве зависит от трех факторов: типа редуцированного аминокислотного алфавита; генетические шаблоны фиксированной длины, используемые в Word2Vec; и эффект соседства соседних подписей. Результаты наших экспериментов показали, что большую часть эволюционной истории можно описать во встроенном пространстве. Более того, они предполагают потенциальное применение нашего подхода в качестве объяснительного инструмента при изучении различных аспектов: эволюционной динамики; эволюционное отклонение вирусных вариантов; и филогенетические характеристики, такие как образование новых клад. Помимо обычного локального анализа точечных мутаций, разработанная структура позволяет изучать эти аспекты на основе более полного глобального контекста, включая соседние эффекты, генетические сигнатуры.
Форгани Маджид Али, , orcid.org/0000-0002-9443-3610, Институт математики и механики им. Н.Н. Красовского УрО РАН; Уральский государственный университет