Исследователи CMU предлагают веб-агентов на базе API: новый подход к ИИ, позволяющий использовать API вместе с традиционными методами веб-серфинга.

 CMU Researchers Propose API-Based Web Agents: A Novel AI Approach to Web Agents by Enabling them to Use APIs in Addition to Traditional Web-Browsing Techniques

Искусственный интеллект для веб-навигации

Искусственные агенты стали необходимыми инструментами для работы в интернете, включая онлайн-шопинг, управление проектами и просмотр контента. Эти агенты имитируют действия человека, такие как клики и прокрутка, на веб-сайтах, созданных для визуального взаимодействия. Однако такой подход имеет свои ограничения, особенно при работе с сложными интерфейсами.

Проблемы традиционного веб-навигации

Агенты часто сталкиваются с трудностями, такими как необходимость выполнять множество шагов для получения информации. Это связано с тем, что веб-задачи должны быть единообразно спроектированы для машин. Платформы часто не имеют прямых точек доступа для машин, что приводит к неэффективности и снижению точности.

Новые решения от Carnegie Mellon University

Исследователи разработали два новых типа агентов для улучшения производительности веб-задач:

  • Агент с вызовом API: выполняет задачи через API, взаимодействуя с данными в форматах JSON или XML, что исключает необходимость в имитации действий человека.
  • Гибридный агент: сочетает вызовы API и традиционное веб-серфинг, что позволяет эффективно извлекать данные и адаптироваться к различным задачам.

Преимущества гибридного подхода

Гибридный агент оптимизирует извлечение данных, позволяя обходить традиционные последовательности навигации. Он может переключаться между API и графическим интерфейсом, что особенно полезно на сайтах с непостоянной поддержкой API.

Результаты тестирования

В тестах гибридный агент показал значительно лучшие результаты по сравнению с традиционными агентами, достигнув средней точности 35.8% и улучшив уровень успеха на более чем 20% в сложных задачах.

Ключевые выводы

  • Увеличение эффективности: гибридный подход позволяет ускорить выполнение задач более чем на 20% на платформах с поддержкой API.
  • Адаптивность: агент может работать с структурированными и неструктурированными данными, снижая зависимость от сложных последовательностей навигации.
  • Высокая точность: гибридный агент установил новый стандарт для агентов, работающих в различных онлайн-средах.
  • Снижение вычислительной нагрузки: обходя ненужные шаги, агент становится более экономичным и быстрым.
  • Широкая применимость: этот подход поддерживает множество задач, от простого извлечения данных до сложных многопроцессных действий.

Заключение

Исследование подчеркивает значительный прогресс в области навигации с помощью ИИ, сочетая традиционное веб-серфинг с подходами на основе API. Гибридный модель демонстрирует, что комбинированная стратегия обеспечивает превосходную производительность и адаптивность по сравнению с агентами, работающими только по принципу веб-серфинга.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект