Google AI представляет CardBench: комплексный бенчмарк с более чем 20 реальными базами данных и тысячами запросов для революционизации оценки кардинальности.

 Google AI Introduces CardBench: A Comprehensive Benchmark Featuring Over 20 Real-World Databases and Thousands of Queries to Revolutionize Learned Cardinality Estimation

“`html

Оценка кардинальности в базах данных

Оценка кардинальности (CE) играет важную роль в оптимизации производительности запросов в реляционных базах данных. Это предсказание количества промежуточных результатов, влияющее на выбор планов выполнения запросов оптимизаторами запросов. Точные оценки кардинальности важны для выбора эффективных порядков соединения таблиц, определения использования индекса и выбора наилучшего метода соединения. Недостоверные оценки могут привести к плохим планам выполнения и существенному замедлению производительности базы данных, что делает CE фундаментальным аспектом управления базами данных, требующим постоянных исследований для повышения точности и эффективности.

Ограничения методов оценки кардинальности

Традиционные методы CE полагаются на эвристики и упрощенные модели, но требуют точных предсказаний кардинальностей, особенно в сложных запросах с участием нескольких таблиц и фильтров. Изученные модели CE представляют собой многообещающую альтернативу, но сталкиваются с препятствиями в применении на практике из-за высоких требований к обучению, необходимости больших наборов данных и отсутствия систематической оценки их производительности в различных базах данных.

CardBench: новый подход к оценке кардинальности

Исследователи из Google Inc. представили CardBench, обширный бенчмарк, включающий тысячи запросов в 20 реальных базах данных. Это позволяет более тщательно оценить модели CE в различных условиях, предлагая три ключевых сценария: модели, обученные на одном наборе данных; модели, предварительно обученные на нескольких наборах данных и затем протестированные на невидимом наборе данных; и модели с тонкой настройкой, предварительно обученные и затем настроенные на небольшом количестве данных из целевого набора данных.

Практическое применение CardBench

Оценки производительности с использованием CardBench показывают перспективные результаты, особенно для моделей с тонкой настройкой. Такие модели способны значительно улучшить производительность даже с небольшим количеством запросов, что делает их пригодными для практических применений, где тренировочные данные могут быть ограничены.

CardBench представляет значительное достижение в области изучения оценки кардинальности. Этот бенчмарк позволяет систематически оценивать и сравнивать различные модели CE, обеспечивая практические решения для приложений в реальном мире, где стоимость обучения новых моделей может быть запретительной.

Если ваша компания заинтересована в развитии с помощью ИИ, обратитесь к нам для консультации и применения современных решений ИИ.

“`

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект