Моделирование для мульти-модального обучения: новый подход и возможности

 NYU Researchers Propose Inter- & Intra-Modality Modeling (I2M2) for Multi-Modal Learning, Capturing both Inter-Modality and Intra-Modality Dependencies

“`html

Новый подход к мульти-модальному обучению

Практическое применение и ценность

В обучении с учителем мульти-модальной системы данные из различных источников связываются с целевой меткой при помощи информации о границах между разными модальностями. Это важно в таких областях, как автономные транспортные средства, здравоохранение, робототехника и другие. Однако эффективность мульти-модального обучения зависит от конкретной задачи. В некоторых случаях мульти-модальная модель работает лучше, чем уни-модальная. В других ситуациях она может быть менее эффективной или даже проигрывать комбинации только двух модальностей. Эти противоречивые результаты подчеркивают необходимость разработки направляющего фреймворка для объяснения различий в производительности мульти-модальных моделей и установления стандартной процедуры создания моделей, которые лучше используют мульти-модальные данные.

Исследователи из Университета Нью-Йорка, Genentech и CIFAR предлагают новый, более принципиальный подход к мульти-модальному обучению, используя уникальную вероятностную перспективу и механизм, который генерирует данные и исследует проблему мульти-модального обучения.

Предлагаемая парадигма предполагает, что метки являются основным источником данных для модальностей. Она также определяет связь между меткой, процессом выбора и различными модальностями. Мульти-модальная система должна имитировать меж- и внутри-модальные зависимости, так как важно знать, насколько сильны эти зависимости относительно конечной цели.

I2M2 метод основан на мульти-модельной генеративной модели и предлагает модифицированный подход к мульти-модальному обучению, который успешно справляется с проблемами более традиционных методов.

Результаты исследования показывают, что I2M2 не просто превосходит другие методы, но и представляет собой перелом в подходе к мульти-модальному обучению, подтверждая свою эффективность на различных наборах данных.

Работы в здравоохранении и задачи связи зрения со словами также демонстрируют потенциал I2M2. Метод успешно справляется с различной силой зависимостей на разных наборах данных, что подтверждает его универсальность и эффективность.

Больше информации доступно в исследовании и на GitHub.

Для дополнительной консультации по внедрению ИИ свяжитесь с нами.

“`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект