Nexa AI представила OmniVision-968M: самый маленький языковая модель для визуальных данных с уменьшением токенов в 9 раз для крайних устройств.

 Nexa AI Releases OmniVision-968M: World’s Smallest Vision Language Model with 9x Tokens Reduction for Edge Devices

Проблемы и решения в области Edge AI

Edge AI сталкивается с трудностями в обеспечении эффективности и производительности. Развертывание моделей Vision Language (VLM) на устройствах с ограниченными ресурсами затруднено из-за их большого размера и высоких вычислительных требований. Это приводит к повышенному расходу батареи и медленным реакциям.

Потребность в легких моделях

С увеличением использования технологий, таких как дополненная реальность и умные домашние помощники, растет спрос на легкие и эффективные модели. Эти приложения требуют быстрого обработки визуальных и текстовых данных.

Запуск OmniVision-968M от Nexa AI

OmniVision-968M – это самая маленькая модель Vision Language в мире с уменьшением количества токенов в 9 раз для устройств Edge. Эта модель была разработана с улучшенной архитектурой и оптимизирована для работы на устройствах с ограниченными ресурсами.

Ключевые компоненты OmniVision-968M

  • Базовая языковая модель: Qwen2.5-0.5B-Instruct для обработки текстовых данных.
  • Визуальный энкодер: SigLIP-400M, который генерирует эмбеддинги изображений.
  • Проекционный слой: Многослойный перцептрон, который уменьшает количество токенов изображения в 9 раз.

Преимущества OmniVision-968M

Модель значительно снижает задержки и вычислительные затраты, что критически важно для устройств Edge. OmniVision-968M использует оптимизацию предпочтений для уменьшения ошибок, что делает её надежной для реальных приложений.

Преимущества для бизнеса

Запуск OmniVision-968M представляет собой важный шаг вперед. Уменьшение количества токенов снижает вычислительные ресурсы, необходимые для работы модели. Это делает OmniVision-968M идеальным решением для разработчиков и компаний, работающих в ограниченных условиях, таких как носимые устройства и IoT.

Эффективность и надежность

Предварительные тесты показывают, что OmniVision-968M снижает время вывода на 35% по сравнению с предыдущими моделями, сохраняя или улучшая точность. Это открывает новые возможности для использования в таких отраслях, как здравоохранение и умные города.

Заключение

OmniVision-968M от Nexa AI решает давнюю проблему в индустрии ИИ: необходимость в высокоэффективных моделях, которые могут работать на устройствах Edge. Эта модель приближает нас к будущему, где умные устройства могут выполнять сложные задачи локально без постоянной поддержки облака.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект