Исследователи USC и Prime Intellect представили METAGENE-1: трансформер с 7 млрд параметров, обученный на более чем 1.5 трлн пар оснований ДНК и РНК.

 Researchers from USC and Prime Intellect Released METAGENE-1: A 7B Parameter Autoregressive Transformer Model Trained on Over 1.5T DNA and RNA Base Pairs

Введение

В условиях глобальных угроз здоровью, таких как пандемии, возрастает необходимость в современных системах бионаблюдения и обнаружения патогенов. Традиционные методы геномного анализа часто не справляются с задачами масштабного мониторинга здоровья.

Проблема

Сложность заключается в выявлении геномного разнообразия в таких средах, как сточные воды, содержащие разнообразные микробные и вирусные ДНК и РНК. Быстрые достижения в биологических исследованиях подчеркивают важность точных и интерпретируемых моделей для анализа больших объемов метагеномных данных.

Решение: METAGENE-1

Исследователи из Университета Южной Калифорнии и Prime Intellect разработали METAGENE-1 — метагеномную модель с 7 миллиардами параметров. Эта модель предназначена для анализа метагеномных последовательностей и обучена на данных, содержащих более 1.5 триллиона пар оснований ДНК и РНК из образцов сточных вод.

Преимущества METAGENE-1

  • Разнообразие данных: Модель обучена на последовательностях от десятков тысяч видов, что отражает микробное и вирусное разнообразие.
  • Стратегия токенизации: Использование токенизации BPE позволяет эффективно обрабатывать новые последовательности нуклеиновых кислот.
  • Инфраструктура обучения: Современные распределенные системы обучения обеспечивают стабильность при работе с большими наборами данных.
  • Применение: METAGENE-1 поддерживает задачи, такие как обнаружение патогенов, выявление аномалий и классификация видов.

Результаты и выводы

METAGENE-1 продемонстрировала выдающиеся результаты в различных тестах. В тесте на обнаружение патогенов модель достигла коэффициента корреляции 92.96, значительно превзойдя другие модели. Также она показала высокую эффективность в задачах по выявлению аномалий.

Заключение

METAGENE-1 представляет собой интеграцию искусственного интеллекта и метагеномики. Модель предлагает практические решения для бионаблюдения и подготовки к пандемиям. Открытый доступ к модели способствует сотрудничеству и инновациям в области геномных наук.

Как использовать ИИ в вашем бизнесе

Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, следуйте этим шагам:

  • Проанализируйте, как ИИ может изменить вашу работу.
  • Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
  • Подберите подходящее решение из множества доступных вариантов ИИ.
  • Внедряйте ИИ постепенно, начиная с небольших проектов и анализируя результаты.

Получите помощь

Если вам нужны советы по внедрению ИИ, пишите нам.

Попробуйте ИИ-ассистента в продажах, который помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект