Фреймворк искусственного интеллекта Baidu для повышения надежности и отслеживаемости систем RAG

 Baidu AI Presents an End-to-End Self-Reasoning Framework to Improve the Reliability and Traceability of RAG Systems

“`html

Улучшение надежности и возможности отслеживания систем RAG с помощью самопреподавания

Модель извлечения-улучшенного языковой модели (Retrieval-Augmented Language Model, RALM) улучшает LLM, интегрируя внешние знания во время вывода, что уменьшает фактические неточности. Однако RALM сталкиваются с проблемами в надежности и возможности отслеживания. Шумное извлечение может привести к бесполезным или неправильным ответам, а отсутствие правильных ссылок усложняет проверку результатов модели. Усилия по улучшению устойчивости извлечения включают использование моделей естественного языка и суммаризации документов, что добавляет сложности и затраты. Оптимизация и выбор этих вспомогательных моделей остается значительной проблемой для эффективной реализации.

Самопреподавание: повышение надежности RALM

Исследователи из Baidu Inc., Китай, предлагают самопреподавательную рамку для улучшения надежности и возможности отслеживания RALM. Эта рамка генерирует траектории самопреподавания через три процесса: процесс, учитывающий актуальность, процесс выборочного учета доказательств и процесс анализа траектории. Она направлена на улучшение точности ответа, обучая модель рассуждать с использованием извлеченных документов. Оцененный на четырех общедоступных наборах данных, этот метод превосходит существующие модели и сопоставим с производительностью GPT-4, используя всего 2000 обучающих образцов. Рамка улучшает интерпретируемость и отслеживаемость, не требуя внешних моделей.

Применение внешней информации для улучшения LLM

Многие исследования направлены на улучшение LLM путем интеграции внешней информации. Подходы включают предварительное обучение с извлеченными отрывками, включение цитирования и использование систем, извлекающих доказательства и генерирующих ответы без изменения весов модели. Некоторые методы динамически инструктируют или дообучают LLM для использования инструментов извлечения, в то время как другие фокусируются на улучшении фактической точности через извлечение и редактирование. Техники, такие как фильтрация нерелевантных документов, сжатие документов и коррекция ошибок, были изучены для улучшения устойчивости. Подход, напротив, выделяет ключевые предложения и ссылается на соответствующие документы в рамках системы end-to-end, избегая необходимости внешних моделей и предлагая эффективность без использования специальных токенов или обширных образцов обучения.

Проблема генерации с самопреподаванием и рассуждением

Проблема генерации с самопреподаванием и рассуждением заключается в определении процесса, при котором LLM генерирует ответы на основе траекторий рассуждений. Учитывая запрос и корпус документов, модель генерирует ответы, состоящие из утверждений и токенов, при этом каждое утверждение цитирует соответствующие документы. Подход включает обучение LLM генерировать траектории рассуждений и ответы за один проход. Процесс разделяется на три этапа: оценка актуальности документов, выбор и цитирование ключевых предложений и анализ рассуждений для получения окончательного ответа. Данные генерируются и контролируются по качеству с использованием автоматизированных инструментов и методов фильтрации для обеспечения точности перед обучением модели на этих расширенных данных.

Эффективность самопреподавательной рамки

Были проведены обширные эксперименты на двух наборах данных короткой формы QA, одном наборе данных длинной формы QA и одном наборе данных проверки фактов для оценки рамки SELF-REASONING. Эффективность рамки была оценена с использованием различных off-the-shelf извлекателей и метрик, настроенных на каждую задачу, включая точность, точное соответствие воспоминанию, воспоминание цитат и точность. По сравнению с базовыми и извлеченными LLM, подход SELF-REASONING продемонстрировал превосходные показатели, особенно в задачах длинной формы QA и проверки фактов. Он превзошел большинство базовых моделей, включая те, требующие дополнительных обучающих данных или внешних инструментов, при этом достигая высокого воспоминания цитат и точности с меньшим количеством обучающих образцов и уменьшенным потреблением ресурсов.

Попробуйте использовать инновационные решения искусственного интеллекта в вашем бизнесе и оставайтесь в числе лидеров на рынке!

Присоединитесь к нашему Telegram каналу, чтобы получать советы по внедрению и использованию ИИ в бизнесе и узнать об инновационных решениях от Flycode.ru!

“`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект