Apple Researchers предлагают усовершенствованную модель языка с обучением с подкреплением (LLaRP): искусственный интеллект, способный адаптироваться к визуальным задачам. Это важный шаг для создания общеприменимых моделей в сфере передвижения и визуализации. #AI #AppleResearch
Развитие искусственного интеллекта достигло нового уровня с появлением крупных языковых моделей (LLM). Модели, такие как GPT-3, обладают уникальными способностями распознавания языка, так как они были обучены на огромных объемах текстового материала. Они демонстрируют выдающуюся квалификацию в таких областях, как вопросно-ответные системы, разработка кода, визуальное восприятие и даже управление роботами.
Несмотря на то, что многие из этих способностей появляются без необходимости специализированных данных для обучения, они показывают, насколько широко и общо они понимают предмет. Кроме того, LLM могут обрабатывать задачи, требующие входных и выходных данных, которые не всегда легко выразить языком. Они также способны выдавать команды для роботов и воспринимать изображения в качестве входных данных.
В области воплощенного искусственного интеллекта цель заключается в разработке агентов, способных принимать решения, которые могут быть применены и обобщены для других задач. Предлагается новый подход, называемый Large Language Model Reinforcement Learning Policy (LLaRP), который позволяет использовать LLM в качестве универсальных политик для воплощенных визуальных задач. Для этого используется заранее обученная фиксированная модель, которая обрабатывает текстовые команды и визуальные наблюдения, чтобы генерировать действия в реальном времени внутри среды. LLaRP обучается взаимодействуя с окружающей средой через обратную связь и вознаграждение.
Основные результаты исследования представлены командой в следующем виде:
– Устойчивость к сложным перефразировкам: LLaRP проявляет исключительную устойчивость к сложно сформулированным инструкциям. Он способен выполнять инструкции, сформулированные разными способами, сохраняя при этом запланированное поведение.
– Обобщение на новые задачи: LLaRP обладает способностью обобщаться на новые задачи, требующие полностью нового и идеального поведения. Он демонстрирует свою разнообразность и адаптивность, приспосабливаясь к задачам, с которыми он не сталкивался во время обучения.
– Впечатляющий процент успеха: LLaRP продемонстрировал поразительный процент успеха – 42% на наборе из 1000 невидимых задач. По сравнению с другими широко используемыми базовыми моделями обучения или нулевыми примерами применения LLM, этот процент успеха в 1,7 раза выше. Это говорит о лучшей производительности и обобщаемости подхода LLaRP.
– Публикация нового бенчмарка: Чтобы помочь научному сообществу лучше понять языковые задачи, связанные с воплощенным искусственным интеллектом, исследовательская команда опубликовала новый бенчмарк под названием ‘Language Rearrangement’. Этот бенчмарк включает в себя значительный объем тренировочных и тестовых задач для языковой перестановки. Он является отличным инструментом для исследователей, которые хотят больше узнать и развивать эту область ИИ.
LLaRP – это невероятный подход, который адаптирует заранее обученные LLM для воплощенных визуальных задач и обладает выдающейся производительностью, устойчивостью и обобщаемостью.
Если вам нужны рекомендации по управлению искусственным интеллектом в бизнесе, свяжитесь с нами по адресу hello@flycode.ru.
Посмотрите практический пример решения на основе искусственного интеллекта:
– Познакомьтесь с ботом для продаж от flycode.ru/aisales, созданным для автоматизации общения с клиентами и управления взаимодействием на всех этапах пути клиента.