AutoDroid-V2: Использование малых языковых моделей для автоматического управления мобильным интерфейсом

 AutoDroid-V2: Leveraging Small Language Models for Automated Mobile GUI Control

AutoDroid-V2: Автоматизация управления мобильным интерфейсом с помощью малых языковых моделей

Большие языковые модели (LLM) и модели зрения языка (VLM) значительно изменили автоматизацию управления мобильными устройствами с помощью естественных команд. Это предлагает решения для сложных задач пользователей.

Проблемы традиционных методов

Традиционный метод «пошаговых GUI-агентов» сталкивается с серьезными проблемами, так как требует мощных облачных моделей, таких как GPT-4. Это поднимает вопросы о безопасности и конфиденциальности, а также увеличивает потребление трафика и затраты на серверную инфраструктуру, что затрудняет масштабное развертывание.

Ключевые преимущества AutoDroid-V2

Исследователи из Тsinghua University предложили AutoDroid-V2, который использует скриптовый подход для создания и выполнения многоэтапных скриптов на основе инструкций пользователя. Он решает два главных ограничения традиционных подходов:

  • Эффективность: Генерация одного скрипта для серии действий снижает частоту запросов и потребление ресурсов.
  • Способности: Скриптовые агенты зависят от кодирования, что уже проявило эффективность в существующих исследованиях.

Архитектура AutoDroid-V2

Система состоит из двух этапов: офлайн и онлайн. На офлайн-этапе создается документ приложения, который служит основой для генерации скриптов. Во время онлайн-этапа специальный локальный LLM генерирует многоэтапный скрипт, который выполняется интерпретатором.

Результаты и достижения

AutoDroid-V2 продемонстрировала значительные улучшения, достигнув высокой степени завершенности задач и значительного снижения вычислительных затрат. Тестирование показало стабильные результаты с коэффициентом успешности от 44.6% до 54.4%.

Заключение

AutoDroid-V2 представляет собой значительный шаг вперед в автоматизации мобильных задач. Система обеспечивает высокую точность, сопоставимую с облачными решениями, при этом сохраняя уровень конфиденциальности. Однако она сталкивается с ограничениями при работе с приложениями, не имеющими структурированных текстовых представлений интерфейса.

Практические рекомендации для внедрения ИИ

Если вы хотите развивать свою компанию с помощью ИИ:

  • Проанализируйте, как ИИ может улучшить вашу работу.
  • Определите, какие KPI вы хотите улучшить.
  • Выберите подходящее решение и постепенно внедряйте ИИ.
  • Основывайтесь на данных и опыте для расширения автоматизации.

Для получения советов по внедрению ИИ, свяжитесь с нами.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект