Система CodexGraph: Искусственный интеллект, объединяющий агентов LLM с графическими интерфейсами баз данных, извлеченными из репозиториев кода

 CodexGraph: An Artificial Intelligence AI System that Integrates LLM Agents with Graph Database Interfaces Extracted from Code Repositories

“`html

Как CodexGraph может улучшить ваш бизнес с помощью искусственного интеллекта

Крупные языковые модели (LLM) продемонстрировали исключительную производительность на изолированных задачах кода, таких как HumanEval и MBPP, но сталкиваются с серьезными трудностями при работе с целыми репозиториями кода. Основная сложность заключается в неспособности LLM управлять вводами с длинным контекстом и выполнять сложное рассуждение по сложным структурам кода в больших проектах. Эта проблема усугубляется необходимостью моделям понимать и навигировать зависимости и структуры проектов в кодовой базе. Решение этой проблемы является ключевым для развития автоматизированной разработки программного обеспечения, особенно в обеспечении возможности LLM обрабатывать задачи разработки программного обеспечения в реальном мире, требующие глубокого понимания крупных репозиториев.

Преимущества CodexGraph

Методы, направленные на улучшение взаимодействия LLM с репозиториями кода, обычно полагаются на поиск на основе сходства или ручные инструменты и API. Однако эти методы имеют ограничения, которые подчеркивают необходимость более продвинутых подходов, способных эффективно поддерживать LLM в навигации и понимании больших репозиториев кода.

Команда исследователей из Национального университета Сингапура, Alibaba Group и Университета Сиань Цзяотун предлагает CODEXGRAPH, систему, которая интегрирует LLM с интерфейсами графовых баз данных, извлеченных из репозиториев кода. Этот подход использует структурные свойства графовых баз данных, в сочетании с гибкостью языков запросов к графам, чтобы обеспечить точный поиск контекста, связанного со структурой кода, и навигацию. CODEXGRAPH создает универсальный интерфейс, повышающий способность LLM эффективно извлекать соответствующую информацию из кодовой базы.

Оценка CODEXGRAPH

CODEXGRAPH был оценен на трех уровнях репозиториев: CrossCodeEval, SWE-bench и EvoCodeBench. Результаты демонстрируют, что этот подход достигает конкурентоспособной производительности на всех уровнях, особенно в сочетании с продвинутыми LLM, такими как GPT-4o, DeepSeek-Coder-V2 и Qwen2-72b-Instruct. Например, на наборе данных CrossCodeEval Lite (Python) с использованием GPT-4o, CODEXGRAPH достиг точного совпадения (EM) в 27,9%, превосходя другие методы. Результаты также показывают, что CODEXGRAPH особенно эффективен в сложных задачах, требующих глубокого рассуждения, демонстрируя свой потенциал в сценариях разработки программного обеспечения в реальном мире.

Заключение

CODEXGRAPH представляет собой передовой подход, который решает ограничения существующих методов Retrieval-Augmented Code Generation (RACG) путем интеграции LLM с интерфейсами графовых баз данных. Этот метод улучшает способность LLM навигировать и извлекать соответствующую информацию из больших репозиториев кода, значительно улучшая производительность в академических и практических задачах разработки программного обеспечения.

“`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект