Ученые из Стэнфорда предлагают метод TRANSIC для переноса политик из симуляции в реальные задачи с контактным взаимодействием.

 Researchers at Stanford Propose TRANSIC: A Human-in-the-Loop Method to Handle the Sim-to-Real Transfer of Policies for Contact-Rich Manipulation Tasks

«`html

Искусственный интеллект (ИИ) в решении задач манипуляции

Использование физических симуляций для обучения роботов и последующего применения полученной политики в реальном мире представляет потенциальный подход к созданию универсальных роботов и решению сложных задач принятия решений. Однако основной вызов заключается в преодолении разрыва между симуляцией и реальностью (sim-to-real). Требуется большое количество данных для обучения решению этих задач, и сбор данных в реальном времени с физическими роботами становится сложным из-за неограниченной требовательности к обучению через современные симуляции. Поэтому важно плавно переносить и применять политики управления роботами в реальном мире с использованием обучения с подкреплением (RL).

Обучение роботов через перенос из симуляции в реальность

Физические симуляции используются для развития навыков роботов в манипуляциях, таких как работа на столе и передвижение, хотя разрывы полностью не устранены. Текущий подход включает в себя идентификацию системы, случайную доменную адаптацию, адаптацию к реальному миру и расширение симулятора. Успешный перенос из симуляции в реальность включает передвижение, непрехватывающие манипуляции и помогает в улучшении производительности. Еще один метод, обучение роботов с участием человека, является распространенной моделью, которая внедряет знания человека в автономные системы. В этом методе используются различные обратные связи от человека для решения последовательных задач принятия решений.

Исследователи из Стэнфордского университета предложили метод TRANSIC, основанный на данных, чтобы обеспечить успешный перенос из симуляции в реальность политик с использованием модели с участием человека. Это позволяет людям улучшать симуляционные политики для решения нескольких неучтенных разрывов между симуляцией и реальностью с помощью вмешательства и онлайн-коррекции. Коррекции помогают в обучении остаточных политик и интегрируются с симуляционными политиками для автономного выполнения. Также успешно достигается перенос из симуляции в реальность в сложных задачах манипуляции с использованием TRANSIC, и этот метод обладает хорошими свойствами, такими как масштабирование с усилиями человека.

Для устранения разрывов между симуляцией и реальностью с помощью TRANSIC созданы 5 различных пар симуляция-реальность, и специально созданы большие разрывы для каждой пары. TRANSIC достигает средней успешности 77% для всех 5 пар с разрывами между симуляцией и реальностью и превосходит лучший базовый метод IWR, который может достигнуть только среднюю успешность 18%. Некоторые возможности TRANSIC включают обучение многоразовых навыков для обобщения объектов на уровне категорий, работу в полностью автономной среде после обучения механизма управления, учет частичных облаков точек и данных коррекции, а также обучение постоянных визуальных характеристик между симуляцией и реальностью.

Исследователи доказали, что TRANSIC превосходит лучший базовый метод IWR в масштабируемости данных человека. При увеличении размера данных коррекции с 25% до 75% предложенный метод достигает относительного улучшения средней успешности на 42%, превосходя IWR, который достигает только 23% относительного улучшения. Более того, производительность IWR становится постоянной на ранней стадии и начинает уменьшаться при наличии большего количества данных человека. IWR не способен моделировать поведенческие режимы людей и обученных роботов, но TRANSIC преодолевает эти вызовы путем обучения остаточных политик с учетом коррекции человека.

В заключение, исследователи из Стэнфордского университета представили метод TRANSIC, основанный на участии человека, для обработки переноса политик из симуляции в реальность для задач манипуляции. Для достижения успеха хорошая базовая политика, выученная из симуляции, интегрируется с ограниченными данными из реального мира. Предложенный метод решает проблему эффективного использования данных коррекции человека для преодоления разрыва между симуляцией и реальностью. Однако некоторые ограничения этого метода заключаются в том, что: (a) текущие задачи ограничены только сценарием на столе с мягким параллельным захватом; (b) в фазе сбора данных коррекции требуется участие человека; (c) сложно обучиться самостоятельно, поэтому TRANSIC нуждается в симуляционных политиках с разумной производительностью.

Посмотрите статью и проект. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter. Присоединяйтесь к нашему каналу в Telegram, каналу в Discord и группе в LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему 42k+ ML SubReddit.

Источник: MarkTechPost

«`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект

Новости

  • Itinai.com it company office background blured photography by a4b45723 df9d 4684 b150 bb2c5790acc8 3

    Улучшение многоязычного мышления в моделях обработки языка

    Понимание языковых моделей с рассуждениями (RLMs) Языковые модели с рассуждениями (RLMs) — это продвинутые инструменты ИИ, разработанные для решения проблем, разбивая их на более простые шаги. Они генерируют структурированные цепочки рассуждений, что улучшает…

  • Itinai.com it company office background blured photography by 392d7806 596c 4c64 a1ae 56d85025c3f2 1

    Переосмысляем токсичные данные в обучении LLM для повышения управляемости и детоксикации

    Практические бизнес-решения для улучшения языковых моделей Эффективность больших языковых моделей (LLMs) зависит от качества их обучающих данных. Удаление токсичных данных может снизить количество вредного контента, но важно найти баланс между безопасностью и производительностью…

  • Itinai.com it company office background blured photography by 93e48de1 e0a4 4327 bf1a 5249ee257f75 2

    Агентный ИИ: Стратегия для Автономных Систем

    Agentic AI: Преобразование бизнес-операций Введение в Agentic AI Agentic AI представляет собой новую эволюцию в автоматизации бизнеса, позволяя системам принимать автономные решения и взаимодействовать с контекстом. Это меняет подход организаций к функционированию, переходя…

  • Itinai.com it company office background blured photography by 12fe5e49 d0a5 47b8 a36f 0071089d22c3 3

    Улучшение использования инструментов ИИ в бизнесе с помощью обучения с подкреплением

    Практические бизнес-решения для улучшения больших языковых моделей Интеграция внешних инструментов с большими языковыми моделями (LLMs) становится все более популярной в сфере ИИ. Это открывает новые возможности для бизнеса. Вот как можно улучшить бизнес-процессы…

  • Itinai.com it company office background blured photography by c2deb05c 8496 4a4d 8cab 2bb3d57fc0f0 1

    Развертывание MCP-сервера на базе Firecrawl для бизнес-приложений

    Внедрение полностью интегрированного сервера MCP на базе Firecrawl Данное руководство поможет вам настроить полностью функциональный сервер Model Context Protocol (MCP) с использованием Smithery для конфигурации и VeryaX для оркестрации в реальном времени. Следуя…

  • Itinai.com it company office background blured photography by 12fe5e49 d0a5 47b8 a36f 0071089d22c3 0

    Внедрение LLM-агента с доступом к инструментам с использованием MCP-Use

    Практические бизнес-решения с использованием LLM-агента Внедрение LLM-агента с доступом к инструментам через MCP-Use может значительно улучшить бизнес-процессы и повседневную жизнь. Вот как это может помочь: Улучшение взаимодействия с клиентами Создание чат-бота позволяет автоматизировать…

  • Itinai.com it company office background blured photography by 0b545732 d29f 4839 a448 751a77ba1563 2

    Улучшение ИИ: Объединение Размышлений и Проверки с Помощью RLV

    Практические бизнес-решения для улучшения работы с ИИ Понимание обучения с подкреплением в языковых моделях Большие языковые модели (LLM) значительно улучшили свои способности к рассуждению благодаря методу обучения с подкреплением (RL). Этот подход вознаграждает…

  • Itinai.com it company office background blured photography by 93e48de1 e0a4 4327 bf1a 5249ee257f75 0

    Запуск HealthBench: Новый стандарт оценки ИИ в здравоохранении

    Введение в HealthBench HealthBench — это опенсорсная платформа для оценки производительности ИИ в здравоохранении, разработанная OpenAI. Она позволяет улучшить взаимодействие между ИИ и медицинскими работниками, обеспечивая более точные и безопасные результаты. Проблемы в…

  • Itinai.com it company office background blured photography by c2deb05c 8496 4a4d 8cab 2bb3d57fc0f0 1

    Продвижение многомодального ИИ: практические бизнес-решения

    Понимание многомодального ИИ Искусственный интеллект (ИИ) значительно расширился за пределы традиционных систем обработки языка. Сегодня существуют модели, которые могут обрабатывать различные типы входных данных, включая текст, изображения, аудио и видео. Эта область, известная…

  • Itinai.com it company office background blured photography by d266ecb7 1141 4fd8 a45e d7242fbf1e9e 0

    Создайте и опубликуйте свой AI-блог с Lovable.dev и интеграцией GitHub

    Практические бизнес-решения с использованием искусственного интеллекта Как это улучшает бизнес и реальную жизнь Создание блога с помощью Lovable.dev позволяет компаниям быстро и эффективно запустить онлайн-присутствие. Это улучшает видимость бренда, привлекает клиентов и увеличивает…

  • Itinai.com it company office background blured photography by 41bad236 c948 453e 803a 7165a764e0bf 1

    StreamBridge: Преобразование Видео-LLMs для Реального Времени

    Бизнес-Трансформация с помощью Искусственного Интеллекта Понимание Ограничений Video-LLMs Video-LLMs предназначены для анализа записанных видео. Однако, такие отрасли, как робототехника и автономное вождение, требуют понимания видео в реальном времени. Это создает значительные трудности, так…

  • Itinai.com it company office background blured photography by b78d385e b261 4424 829c 8c380ea5040f 1

    Запуск INTELLECT-2: Децентрализованная модель рассуждений с 32 миллиардами параметров

    Проблемы централизованного обучения ИИ Традиционные методы централизованного обучения сталкиваются с ограничениями из-за высокой стоимости вычислительных кластеров и нехватки ресурсов. Это затрудняет эксперименты и сотрудничество в исследованиях. Децентрализованные решения Переход к децентрализованным методам обучения…

  • Itinai.com it company office background blured photography by 392d7806 596c 4c64 a1ae 56d85025c3f2 1

    AG-UI: Революция в Реальном Времени для Взаимодействия AI и Front-End Приложений

    AG-UI: Упрощение Взаимодействия с ИИ в Реальном Времени Современные достижения в области искусственного интеллекта значительно улучшили автоматизацию задач, таких как суммирование, миграция данных и планирование. Однако, чтобы повысить эффективность бизнеса, необходимо внедрить решения,…

  • Itinai.com it company office background blured photography by 392d7806 596c 4c64 a1ae 56d85025c3f2 1

    Аудио-SDS: Новый Подход к Синтезу Звука с Использованием ИИ

    Понимание Audio-SDS: Новый подход к синтезу аудио Введение в модели диффузии аудио Модели диффузии аудио значительно продвинулись в создании качественной речи, музыки и звуковых эффектов. Однако их основная сила заключается в генерации образцов,…

  • Itinai.com it company office background blured photography by 342dc52c d1e8 48a5 a450 02825b0d4c2b 0

    Эффективный размер состояния: новая метрика для оптимизации памяти в последовательных моделях

    Практические бизнес-решения с использованием Effective State-Size (ESS) Использование метрики Effective State-Size (ESS) в последовательных моделях может значительно улучшить производительность бизнеса и повысить эффективность работы. Вот шаги, которые помогут внедрить эту метрику в вашу…

  • Itinai.com it company office background blured photography by b78d385e b261 4424 829c 8c380ea5040f 2

    Запуск GTE-ModernColBERT-v1: Продвинутый Семантический Поиск для Длинных Документов

    Практические бизнес-решения Для компаний, стремящихся внедрить решения на основе ИИ, рассмотрите следующие шаги: 1. Определите возможности автоматизации Ищите процессы, которые можно автоматизировать для повышения эффективности. Это может включать в себя обработку запросов клиентов,…

  • Itinai.com it company office background blured photography by 12fe5e49 d0a5 47b8 a36f 0071089d22c3 3

    Ускорение аннотирования активного обучения с Adala и Google Gemini

    Использование ИИ для классификации медицинских симптомов Введение Компании могут использовать фреймворк Adala и Google Gemini для создания эффективного процесса активного обучения, который поможет в классификации медицинских симптомов. Это улучшит процессы аннотирования данных и…

  • Itinai.com it company office background blured chaos 50 v b3314315 0308 4954 a141 47b85163297e 2

    PrimitiveAnything: Инновационная AI-платформа для 3D-реконструкции форм

    Практические бизнес-решения с использованием PrimitiveAnything Преобразование 3D-форм через простые геометрические фигуры открывает новые возможности для повышения эффективности в различных секторах. Вот как можно внедрить эти технологии в бизнес. Шаг 1: Понимание абстракции форм…