Mistral AI представляет Mathstral 7B и базовую настройку Math: достигнуто 56,6% по MATH и 63,47% по MMLU, структурируя математическое открытие
Новая модель Mathstral разработана специально для математического рассуждения и научных открытий. Эта модель имеет 7 миллиардов параметров и окно контекста из 32 000 токенов, опубликована под лицензией Apache 2.0.
Mathstral поможет в решении сложных математических задач, требующих многократного логического рассуждения. Она предназначена для областей STEM (наука, технологии, инженерия и математика) и обеспечивает ультразвуковые возможности рассуждения, демонстрируя 56,6% по MATH и 63,47% по MMLU.
Mathstral является частью стратегии Mistral AI в области развития и поддержки научных исследований, а также решения сложных математических задач. Она предоставляет отличную производительность и отличный баланс скорости при разработке моделей для конкретных целей.
Применение Mathstral
Мы призываем использовать и настраивать Mathstral, предоставляя исчерпывающую документацию и размещая веса модели на HuggingFace. Это позволяет исследователям и разработчикам адаптировать Mathstral для различных приложений, улучшая ее полезность в научных и математических усилиях.
Сотрудничество в разработке
Разработка и выпуск Mathstral были совместным усилием, с заметным вкладом профессора Пола Бурдона, который курировал проблемы тестирования GRE по математике, используемые в оценке модели. Этот коллективный подход подчеркивает важность партнерств и обмена экспертизой в развитии технологий ИИ.
Заключение
С выпуском Mathstral Mistral AI создает стратегический инструмент для математического рассуждения, способствуя прорывам в различных научных областях и способствуя более общей цели научных открытий и инноваций.