Эффективный вызов функций в маломасштабных LLM: прорыв для задач AI-рассуждений

 Efficient Function Calling in Small-Scale LLMs: A Game-Changer for AI Reasoning Tasks

Эффективный вызов функций в маломасштабных LLM: прорыв для задач логического мышления ИИ

Недавние достижения в области больших языковых моделей (LLM) продемонстрировали выдающиеся возможности понимания и генерации естественного языка. Эти модели могут выполнять функции вызова для программных API, что подтверждается запуском функций плагинов GPT-4.

Практические решения и ценность

Модели LLM интегрированы с такими инструментами, как веб-браузеры, системы перевода и робототехника. Однако, несмотря на обещающие результаты в сложных задачах, LLM сталкиваются с трудностями в математических задачах и логическом мышлении. Для решения этих проблем были предложены методы, позволяющие LLM выполнять предоставленные функции, начиная от простых инструментов, таких как калькуляторы, до более сложных.

Проблемы больших моделей: использование крупных LLM требует значительных вычислительных мощностей и связано с высокими затратами на обучение. Это подчеркивает необходимость создания меньших, специализированных LLM, которые сохраняют основную функциональность и уменьшают операционные расходы.

Новый подход к обучению маленьких LLM

Исследователи представили новый метод обучения небольших языковых моделей, который основывается на способности к вызову функций больших моделей для решения конкретных логических и математических задач. Этот метод включает агента, который задает вопросы LLM, вводя описания и примеры используемых функций, создавая набор данных с правильными и неправильными ответами.

Процесс включает четыре этапа:

  1. Определение задач и проблем для оценки способностей LLM.
  2. Настройка функций для каждой задачи, что позволяет LLM решать шаги логического мышления.
  3. Выбор предобученной большой модели для генерации набора данных с правильными и неправильными ответами.
  4. Тонкая настройка меньшей модели с использованием алгоритма DPO.

Результаты экспериментов

В результате экспериментов была подтверждена значительная улучшение производительности маломасштабной модели в задачах FOL и математике. Модель достигла почти идеальной точности в большинстве случаев благодаря использованию библиотеки Microchain, которая облегчает запросы LLM с предопределенными функциями.

Заключение

Предложенный метод позволяет улучшить способности к вызову функций маломасштабных LLM и повысить их производительность в логических и математических задачах. В будущем есть возможность расширения применения данного подхода для более широкого спектра задач и типов функций.

Используйте возможности ИИ в вашей компании

Если вы хотите, чтобы ваша компания развивалась с использованием ИИ, проанализируйте, как ИИ может изменить вашу работу. Определите ключевые показатели эффективности (KPI), которые вы хотите улучшить с помощью ИИ. Выберите подходящее решение, начните с малого проекта, анализируйте результаты и расширяйте автоматизацию. Если вам нужны советы по внедрению ИИ, пишите нам.

Узнайте, как ИИ может изменить ваши процессы с решениями от Flycode.ru.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект