Искусственный интеллект для веб-навигации
Искусственные агенты стали необходимыми инструментами для работы в интернете, включая онлайн-шопинг, управление проектами и просмотр контента. Эти агенты имитируют действия человека, такие как клики и прокрутка, на веб-сайтах, созданных для визуального взаимодействия. Однако такой подход имеет свои ограничения, особенно при работе с сложными интерфейсами.
Проблемы традиционного веб-навигации
Агенты часто сталкиваются с трудностями, такими как необходимость выполнять множество шагов для получения информации. Это связано с тем, что веб-задачи должны быть единообразно спроектированы для машин. Платформы часто не имеют прямых точек доступа для машин, что приводит к неэффективности и снижению точности.
Новые решения от Carnegie Mellon University
Исследователи разработали два новых типа агентов для улучшения производительности веб-задач:
- Агент с вызовом API: выполняет задачи через API, взаимодействуя с данными в форматах JSON или XML, что исключает необходимость в имитации действий человека.
- Гибридный агент: сочетает вызовы API и традиционное веб-серфинг, что позволяет эффективно извлекать данные и адаптироваться к различным задачам.
Преимущества гибридного подхода
Гибридный агент оптимизирует извлечение данных, позволяя обходить традиционные последовательности навигации. Он может переключаться между API и графическим интерфейсом, что особенно полезно на сайтах с непостоянной поддержкой API.
Результаты тестирования
В тестах гибридный агент показал значительно лучшие результаты по сравнению с традиционными агентами, достигнув средней точности 35.8% и улучшив уровень успеха на более чем 20% в сложных задачах.
Ключевые выводы
- Увеличение эффективности: гибридный подход позволяет ускорить выполнение задач более чем на 20% на платформах с поддержкой API.
- Адаптивность: агент может работать с структурированными и неструктурированными данными, снижая зависимость от сложных последовательностей навигации.
- Высокая точность: гибридный агент установил новый стандарт для агентов, работающих в различных онлайн-средах.
- Снижение вычислительной нагрузки: обходя ненужные шаги, агент становится более экономичным и быстрым.
- Широкая применимость: этот подход поддерживает множество задач, от простого извлечения данных до сложных многопроцессных действий.
Заключение
Исследование подчеркивает значительный прогресс в области навигации с помощью ИИ, сочетая традиционное веб-серфинг с подходами на основе API. Гибридный модель демонстрирует, что комбинированная стратегия обеспечивает превосходную производительность и адаптивность по сравнению с агентами, работающими только по принципу веб-серфинга.