Salesforce AI Research представила новую систему оценки для RAG-систем на основе охвата под-вопросов.

 Salesforce AI Research Introduces a Novel Evaluation Framework for Retrieval-Augmented Generation (RAG) Systems based on Sub-Question Coverage

Системы генерации с дополненной выборкой (RAG)

Системы RAG объединяют процессы выборки и генерации, чтобы эффективно отвечать на сложные вопросы. Они используют релевантные документы для создания ответов с дополнительным контекстом, что позволяет получать более полные и информативные ответы.

Преимущества RAG систем

  • Богатый контекст: Ответы содержат больше информации, что полезно в таких областях, как юридические исследования и академический анализ.
  • Разнообразные перспективы: Системы RAG могут предоставлять ответы с разных точек зрения, что важно для глубокого понимания вопроса.

Проблемы оценки эффективности

Оценка RAG систем сталкивается с трудностями, так как они часто отвечают на вопросы, требующие многослойного подхода. Традиционные метрики не всегда могут отразить полноту ответов.

Новый подход к оценке

Исследователи из Georgia Institute of Technology и Salesforce AI Research предложили новую методику оценки RAG систем, основанную на покрытии под-вопросов. Это позволяет более точно оценивать качество ответов.

Методика оценки

  1. Разделение сложных вопросов на под-вопросы, классифицированные по важности.
  2. Оценка, насколько хорошо RAG системы извлекают релевантный контент для каждого под-вопроса.

Результаты исследования

Исследование показало, что системы RAG не всегда обеспечивают полное покрытие под-вопросов. Например, You.com охватывает 42% основных под-вопросов, в то время как Perplexity AI — 54%. Однако все системы продемонстрировали низкое покрытие фоновых под-вопросов.

Основные выводы

  • Покрытие основных под-вопросов: В среднем системы RAG упускают около 50% основных под-вопросов.
  • Точность систем: Perplexity AI показала 71% точности в связывании извлеченного контента с ответами.
  • Важность фоновой информации: Покрытие фоновых под-вопросов было низким, от 14% до 20%.
  • Потенциал для улучшения: Все системы RAG имеют значительные возможности для повышения качества ответов.

Заключение

Это исследование подчеркивает, что для оценки RAG систем необходимо использовать метрики, ориентированные на под-вопросы. Это поможет улучшить качество ответов и расширить возможности систем для решения сложных задач.

Как внедрить ИИ в вашу компанию

  • Изучите, как ИИ может изменить вашу работу.
  • Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
  • Выберите подходящее ИИ решение и начните с небольшого проекта.
  • Анализируйте результаты и расширяйте автоматизацию на основе полученных данных.

Если вам нужны советы по внедрению ИИ, пишите нам.

Попробуйте ИИ ассистент в продажах, который помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект