Мастерская цифровых инноваций «АРТ21» в ответ на постоянно возникающие новые мутации коронавируса взялась за амбициозный проект – создать уникальную систему прогнозирования эволюционного развития генома SARS-CoV-2 на основе технологий искусственного интеллекта и математического моделирования. Таким образом, разработанная литовцами технология сможет предсказывать ход и тенденции генома этого вируса, используя данные, собранные в базах данных. Только что завершился этап «обучения» системы, после которого результаты обнадеживают — точность достигает 99%. Если после второй разработки технологии результаты останутся не менее 80%, Литва сможет гордиться созданием передовой технологии борьбы с вирусом Covid-19.
«Разрабатываемая нами технология позволит более эффективно контролировать динамику развития пандемии. На основе полученных результатов разработчики тестов и вакцин смогут внести коррективы в их производство и избежать потери эффективности из-за появления новых мутаций в вирусном геноме. Это особенно актуально в процессе тестового производства. Например, может случиться так, что человек заразится коронавирусом и продолжит его переносить, потому что тесты не смогут его обнаружить и дадут ложноотрицательные результаты. Поэтому эта технология, основанная на искусственном интеллекте и больших данных, особенно актуальна до тех пор, пока вирус не будет полностью локализован. Кроме того, это отличный пример того, как открытые данные позволяют создавать передовые решения даже в таких сложных процессах, как профилактика заболеваний», — сказал Аугустас Алешюнас, основатель и директор компании, разрабатывающей инновацию, ART21.
По словам представителей компании, в мире существует всего несколько попыток создать подобную технологию, но в этой гонке они сильно отстают от литовцев. Уникальность и сложность генератора прогнозирования очков состоит из нескольких аспектов.
Фармацевтические компании реагируют на изменения в режиме реального времени, проводя исследования и замечая изменения, поэтому существует временной разрыв, прежде чем будут внесены коррективы в производство тестов или вакцин. При этом создатели разрабатываемой инновации готовятся предоставить обоснованные статистические прогнозы будущего. Поэтому можно будет заранее подготовиться к будущим мутациям. Еще одним сложным фактором, который удерживает других разработчиков от финансовых рисков, связанных с такими проектами, являются невероятно длинные и плотные последовательности данных. В одной строке такой последовательности содержится около 30 тысяч. разные знаки, а таких строк десятки тысяч. Это не только требует специалистов особой компетенции, но и требует очень много времени.
«На основе существующих баз данных генома COVID-19 мы строим набор данных пар мутаций. Последовательности генома сравниваются, очищаются, строятся различные филогенетические деревья вируса, исследуем весь геном COVID-19 и важнейший белок S (спайк) отдельно. Полученные данные о парах мутаций указывают на (возможное) направление мутации вируса «родительский» — «дочерний» и позволяют обучать сложную нейронную сеть — генератор мутаций. Мы тестируем полученную модель, используя постоянно возникающие мутации вируса, и надеемся, что в будущем сможем надежно предсказывать мутации в будущем. Первые результаты многообещающие и положительные, но предстоит еще долгий, финансовый и трудоемкий путь для полного обучения, тестирования и проверки системы», — сказал один из специалистов по обработке данных, работающий с ней, доктор. Валдас Рапшевичюс.