SalesForce AI Research представила LlamaRank: передовой реранкер для улучшенного поиска документов и кода, превосходящий Cohere Rerank v3 и Mistral-7B QLM по точности.

 SalesForce AI Research Introduced LlamaRank: A State-of-the-Art Reranker for Enhanced Document Retrieval and Code Search, Outperforming Cohere Rerank v3 and Mistral-7B QLM in Accuracy

Продвинутое решение для ранжирования документов и поиска кодов от Salesforce AI Research

Проблемы ранжирования документов остаются одними из самых важных в развитии информационного поиска и обработки естественного языка. Для улучшения производительности поисковых систем, систем вопросов и ответов, а также систем RAG требуется эффективное ранжирование документов. Традиционные модели ранжирования зачастую сталкиваются с проблемой поиска баланса между точностью результатов и вычислительной эффективностью, особенно при работе с большими объемами данных и множеством типов запросов.

Практическое решение LlamaRank

Salesforce AI Research представила передовую модель реранкера под названием LlamaRank. Эта модель значительно улучшает ранжирование документов и поиск кодов на различных наборах данных.

LlamaRank основан на архитектуре Llama3-8B-Instruct и объединяет передовые линейные и откалиброванные механизмы оценки для достижения скорости и интерпретируемости.

Модель обучена на высококачественных синтезированных данных из Llama3-70B и Llama3-405B, а также на данных, размеченных людьми, охватывая области от поиска на основе тем и ответов на вопросы до поиска кода.

Архитектура LlamaRank построена на базе Llama3-8B-Instruct, а тренировочные данные включают как синтетические данные, так и обучающие примеры, что позволяет модели успешно выполнять различные задачи, от общего поиска документов до более специализированного поиска примеров кода.

LlamaRank был успешно продемонстрирован на нескольких общедоступных наборах данных и показал выдающиеся результаты в оценке производительности, подчеркивая таким образом его универсальность и эффективность в обработке широкого спектра типов документов и сценариев запросов.

Преимущества и технические характеристики

Модель поддерживает до 8 000 токенов на документ, обеспечивая низкую задержку выполнения и линейную калибровку оценок релевантности, что делает ее более точной и интерпретируемой для пользователей.

Кроме того, LlamaRank наслаждается масштабом модели и высокой производительностью, что делает его значимым продвижением в технологии реранки, способным существенно улучшить эффективность систем RAG в различных областях применения.

Для получения дополнительной информации и попробовать LlamaRank, обратитесь к исследователям проекта.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект