Улучшение предварительной подготовки языковой модели с помощью обучения с учителем на нескольких задачах

 Microsoft AI Release Instruct Pre-Training: Enhancing Language Model Pre-Training with Supervised Multitask Learning

“`html

Концепция Инструкционного Предварительного Обучения (InstructPT)

Инструкционное предварительное обучение (InstructPT) – это совместное усилие Microsoft Research и Университета Цинхуа. Этот метод использует надзорное многозадачное обучение для предварительного обучения языковых моделей. Традиционные методы предварительного обучения, называемые Ванильным Предварительным Обучением, полагаются на безнадзорное обучение на основе сырых корпусов. Однако Инструкционное Предварительное Обучение дополняет этот подход, включая пары инструкция-ответ, сгенерированные из сырого текста, что улучшает способность модели к обобщению на различные задачи.

Каркас Инструкционного Предварительного Обучения

Инструкционное Предварительное Обучение обогащает сырой текст синтезированными парами инструкция-ответ перед предварительным обучением языковых моделей. Этот процесс включает инструкционный синтезатор, который преобразует сырые корпуса в инструкционно-обогащенные корпуса. Инструкционный синтезатор донастраивается на разнообразных данных, что позволяет ему генерировать соответствующие и разнообразные пары инструкция-ответ из невидимых сырых текстов.

Экспериментальные результаты

Эксперименты, проведенные в рамках этого исследования, демонстрируют эффективность Инструкционного Предварительного Обучения. При предварительном обучении с нуля модели, предварительно обученные с использованием Инструкционного Предварительного Обучения, последовательно превосходили те, которые использовали Ванильное Предварительное Обучение. Например, модель с 500 миллионами параметров, предварительно обученная на 100 миллиардах токенов с использованием Инструкционного Предварительного Обучения, соответствовала производительности модели с 1 миллиардом параметров, предварительно обученной на 300 миллиардах токенов с использованием традиционных методов.

Преимущества Инструкционного Предварительного Обучения

Улучшенное обобщение: Инструкционное предварительное обучение значительно улучшает способности обобщения языковых моделей, включая разнообразные задачи, сформулированные через естественно-языковые инструкции. Это особенно полезно для моделей, которые должны хорошо справляться с различными и невидимыми задачами.

Эффективность в предварительном обучении: инструкционный синтезатор, построенный на моделях с открытым исходным кодом с примерно 7 миллиардами параметров, является экономически эффективным и масштабируемым. Эта эффективность генерирует большой объем высококачественных синтетических данных, что делает процесс предварительного обучения более ресурсоэффективным.

Улучшение производительности задач: модели, предварительно обученные с использованием инструкционно-обогащенных данных, показывают превосходную производительность на различных бенчмарках как в нулевом, так и в малом количестве обучающих примеров. Это указывает на то, что включение пар инструкция-ответ помогает моделям лучше понимать и выполнять сложные задачи.

Варианты InstructPT

Каркас Инструкционного Предварительного Обучения был адаптирован для создания нескольких вариантов, каждый из которых адаптирован к конкретным областям и задачам.

Заключение

Инструкционное Предварительное Обучение, интегрирующее надзорное многозадачное обучение в процесс предварительного обучения, улучшает базовую производительность языковых моделей и значительно улучшает их способность к обобщению на различные задачи. Успех этого метода, как продемонстрировано производительностью Llama3-8B и других вариантов, подчеркивает его потенциал для стимулирования будущих инноваций в области искусственного интеллекта и обработки естественного языка.

“`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект