Использование искусственного интеллекта в патологии
Для диагностики и лечения рака крайне важно проведение патологического исследования тканей. Цифровые версии старых гистологических слайдов, используемых для световой микроскопии, постепенно заменяются цельными изображениями слайдов (WSI). Это позволяет вычислительной патологии перейти от использования в основном в качестве академических доказательств к становлению рутиноными инструментами в клинической практике.
Применение искусственного интеллекта в патологии
Искусственный интеллект используется для диагностики, характеристики и понимания заболеваний в сочетании с цифровыми WSI. Первая система патологии искусственного интеллекта, получившая одобрение FDA, была представлена в 2021 году. Новые исследования направлены на расшифровку обычных WSI для ранее неизвестных результатов, таких как прогнозирование и реакция на терапию, благодаря значительным успехам в области компьютерного зрения, области искусственного интеллекта, сосредоточенной на изображениях.
Построение крупномасштабных нейронных сетей
Одним из ключевых компонентов улучшения производительности моделей компьютерного зрения является создание крупномасштабных глубоких нейронных сетей, часто называемых фундаментальными моделями. Для развития фундаментальных моделей используется класс алгоритмов, называемый самообучением, который не требует кураторских меток и обучается на массивных наборах данных, порядки величины больших, чем традиционно используемые в вычислительной патологии.
Значение обобщения от больших наборов данных
Обобщение от больших наборов данных имеет большое значение для редких типов опухолей и менее распространенных диагностических задач, таких как прогнозирование конкретных геномных изменений, клинических результатов или реакции на терапию. Эта модель имеет потенциал для широкого спектра важных задач, включая прогнозирование рака (как обычного, так и редкого), субтипирование, количественную оценку биомаркеров, подсчет клеточных экземпляров, прогнозирование реакции на терапию, при условии, что она обучена на достаточном количестве цифровых WSI в области патологии.
Значение масштабирования фундаментальных моделей
Исследования показывают, что производительность фундаментальных моделей зависит от размера набора данных и самой модели. Для обучения моделей с сотнями миллионов и миллиардами параметров используются современные наборы данных, такие как ImageNet, JFT-300M и LVD-142M, среди других. Несмотря на трудности собрать специфические для патологии крупномасштабные наборы данных, некоторые исследования использовали наборы данных с 30 000 до 400 000 WSI для обучения фундаментальных моделей с 28 миллионами до 307 миллионов параметров.
Исследование Virchow2 и Virchow2G
Virchow2 и Virchow2G обучены с использованием крупнейшего известного набора данных цифровой патологии, который включает данные более чем 3,1 миллиона цельных изображений (2,4PB данных), представляющих более 40 тканей от 225 000 пациентов в 45 странах. Virchow2 имеет 632 миллиона параметров, а Virchow2G – 1,85 миллиарда параметров. Исследователи предлагают модификации алгоритма обучения DINOv2, играющего важную роль в обучении моделей для достижения передовой производительности по сравнению с лучшими конкурирующими моделями.
Команда тщательно оценила производительность этих фундаментальных моделей на двенадцати задачах, охватывающих области применения вычислительной патологии. Предварительные результаты показывают, что Virchow2 и Virchow2G отлично справляются с обнаружением мельчайших деталей в архитектуре и форме клеток, а также в предсказании активности генов.