Улучшенная открытая версия DeepSeek-V2-0628: выпущена!

 DeepSeek-V2-0628 Released: An Improved Open-Source Version of DeepSeek-V2

“`html

DeepSeek-V2-0628: Улучшенная открытая версия DeepSeek-V2

DeepSeek недавно выпустил свою последнюю открытую модель на платформе Hugging Face, DeepSeek-V2-Chat-0628. Этот релиз является значительным прорывом в области генерации текста и технологий чат-ботов, утверждая позицию DeepSeek на передовом крае отрасли.

Улучшения DeepSeek-V2-Chat-0628

DeepSeek-V2-Chat-0628 представляет собой улучшенную версию предыдущей модели DeepSeek-V2-Chat. Эта новая версия была тщательно отточена для достижения превосходных результатов по различным критериям. Согласно рейтингу LMSYS Chatbot Arena Leaderboard, DeepSeek-V2-Chat-0628 заняла впечатляющее 11-е место, опередив все другие открытые модели. Это достижение подчеркивает приверженность DeepSeek к развитию искусственного интеллекта и предоставлению ведущих решений для приложений чат-ботов.

Импровизации в DeepSeek-V2-Chat-0628

Улучшения в DeepSeek-V2-Chat-0628 касаются различных критически важных аспектов функциональности модели. В частности, модель демонстрирует значительные улучшения в нескольких тестах:

  • HumanEval: оценка улучшилась с 81,1 до 84,8, увеличившись на 3,7 пункта.
  • MATH: заметный скачок с 53,9 до 71,0, означающий улучшение на 17,1 пункта.
  • BBH: результат вырос с 79,7 до 83,4, что является улучшением на 3,7 пункта.
  • IFEval: значительный прирост с 63,8 до 77,6, улучшение на 13,8 пункта.
  • Arena-Hard: продемонстрировал самое значительное улучшение, результат возрос с 41,6 до 68,3, увеличившись на 26,7 пункта.
  • JSON Output (Internal): улучшение с 78 до 85, что является приростом на 7 пунктов.

Кроме того, модель DeepSeek-V2-Chat-0628 также обладает оптимизированными возможностями следования инструкциям в области “системы”, что значительно улучшает пользовательский опыт. Это оптимизация благоприятно влияет на задачи, такие как иммерсивный перевод и Retrieval-Augmented Generation (RAG), обеспечивая пользователям более интуитивное и эффективное взаимодействие с ИИ.

Требования к развертыванию модели

Для развертывания DeepSeek-V2-Chat-0628 потребуется 80 ГБ * 8 видеокарт для вывода в формате BF16. Пользователи могут использовать библиотеку Transformers от Huggingface для вывода модели, импортировав необходимые библиотеки и настройку модели и токенизатора с соответствующими конфигурациями.

Также рекомендуется использовать vLLM для вывода модели, что предлагает упрощенный подход к интеграции модели в различные приложения.

Модель DeepSeek-V2-Chat-0628 доступна под лицензией MIT для кодового репозитория, а сама модель подпадает под Модельную Лицензию. Это позволяет коммерческое использование серии DeepSeek-V2, включая базовые и чат-модели, делая их доступными для бизнеса и разработчиков, стремящихся интегрировать передовые возможности ИИ в свои продукты и услуги.

Вывод

Выпуск DeepSeek-V2-Chat-0628 подчеркивает постоянное стремление DeepSeek к инновациям в области искусственного интеллекта. С впечатляющими показателями производительности и улучшенным пользовательским опытом, эта модель готова установить новые стандарты в области чат-ботов.

Посмотрите карточку модели и API. Вся заслуга за эту исследовательскую работу принадлежит исследователям этого проекта.

“`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект