Оптимизация вычислительных рабочих процессов для приложений искусственного интеллекта
Создание вычислительных рабочих процессов для приложений искусственного интеллекта, таких как чат-боты и помощники по кодированию, является сложным из-за необходимости управления многочисленными гетерогенными параметрами. Ошибки после внедрения требуют ручных обновлений, что увеличивает сложность. Исследование исследует проблемы оптимизации, направленные на автоматизацию проектирования и обновления этих рабочих процессов.
Практические решения и ценность
Microsoft Research и исследователи Университета Стэнфорда предлагают рамочное решение под названием Trace для автоматизации проектирования и обновления систем искусственного интеллекта, таких как помощники по кодированию и роботы. Trace обрабатывает вычислительный рабочий процесс как граф, подобный нейронным сетям, и оптимизирует гетерогенные параметры с помощью оптимизации с использованием Trace Oracle (OPTO). Этот подход повышает эффективность оптимизации в различных областях, превосходя специализированные оптимизаторы в задачах, таких как оптимизация подсказок, настройка гиперпараметров и проектирование контроллеров роботов.
Существующие рамочные решения, такие как LangChain, Semantic Kernels, AutoGen и DSPy, позволяют создавать и оптимизировать вычислительные рабочие процессы, в основном используя скалярную обратную связь и методы поиска в черном ящике. В отличие от них, Trace использует отслеживание выполнения для автоматической оптимизации, обобщая вычислительный граф для соответствия различным рабочим процессам. OPTO-рамочное решение поддерживает совместную оптимизацию подсказок, гиперпараметров и кодов с обратной связью и динамически адаптируется к изменениям в структуре рабочего процесса.
OPTO является основой для Trace, определяя графовое абстрактное представление для итеративной оптимизации. Вычислительный граф представляет собой DAG, где узлы представляют объекты, а ребра обозначают входно-выходные отношения. В OPTO оптимизатор выбирает параметры, и Trace Oracle возвращает обратную связь трассировки, состоящую из вычислительного графа и ввода на выходе. Эта обратная связь может включать оценки, градиенты или подсказки на естественном языке. Оптимизатор использует эту обратную связь для итеративного обновления параметров. В отличие от черных ящиков, трассировка выполнения предоставляет ясный путь к выходу, обеспечивая эффективное обновление параметров. Trace использует OPTO для оптимизации различных рабочих процессов, абстрагируя дизайн и компоненты, специфичные для области.
Оптимизационный алгоритм на основе LLM OptoPrime разработан для решения OPTO. Он использует возможности кодирования и отладки LLM для обработки подграфов трассировки выполнения. Эксперименты показывают эффективность OptoPrime в числовой оптимизации, управлении трафиком, оптимизации подсказок и задачах управления роботами с долгим горизонтом. OptoPrime демонстрирует превосходное качество по сравнению с другими оптимизаторами, особенно при использовании информации о трассировке выполнения и памяти.
Trace преобразует проблемы оптимизации вычислительных рабочих процессов в проблемы OPTO, что эффективно демонстрируется с помощью оптимизатора OPTO, OptoPrime. Это является первым шагом к новой парадигме оптимизации с различными направлениями развития в будущем.