Новая технология “Магнус” для более эффективного обслуживания языковых моделей как услуги.

 This AI Paper from China Propose ‘Magnus’: Revolutionizing Efficient LLM Serving for LMaaS with Semantic-Based Request Length Prediction

“`html

Transformer-based Generative Large Language Models (LLMs) for Natural Language Processing (NLP)

Модели большого языка на основе трансформаторов (LLM) показали значительные успехи в широком спектре задач обработки естественного языка (NLP). Множество приложений получают выгоду от их широкой применимости. Однако для большинства разработчиков стоимость обучения и внедрения этих моделей часто является препятствием. Для этого ведущие компании в области искусственного интеллекта, такие как OpenAI, Google и Baidu, предлагают модель языка как сервис (LMaaS), предоставляя доступ к своим LLM через API.

Применение LLM в LMaaS

Разработчики приложений предоставляют сервису LLM пользовательские сообщения и конкретные инструкции. Для обеспечения более высокого качества обслуживания и поддержки большего числа клиентов, поставщики услуг стремятся сократить время ответа и увеличить пропускную способность. Однако существуют неэффективности в том, как текущие системы, такие как TensorFlow Serving и Triton Inference Server, обрабатывают запросы.

Проблемы и предложенные решения

Предлагается использовать непрерывное формирование пакетов для более эффективной обработки запросов. Команда исследователей из Китая предложила систему Magnus, которая использует информацию о семантике на уровне приложения и пользователя в сочетании с длиной ввода пользователя для правильного прогнозирования длины генерации запроса. Magnus показал значительные улучшения в тестах с использованием экземпляров ChatGLM-6B на графических процессорах NVIDIA V100.

Применение ИИ в бизнесе

Если вы хотите использовать ИИ для развития своей компании, оптимизации процессов и улучшения обслуживания клиентов, обратитесь к нам для консультаций и решений, которые помогут вам достичь ваших целей.

“`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект