Фреймворк CogniDual для языковых моделей: развитие от обдуманных рассуждений к интуитивным ответам через самообучение

 CogniDual Framework for LLMs: Advancing Language Models from Deliberate Reasoning to Intuitive Responses Through Self-Training

Искусственный интеллект (ИИ) и практические решения

Когнитивная психология стремится понять, как люди обрабатывают, хранят и вспоминают информацию, первая система, которая работает интуитивно и быстро, и вторая система, которая включает осознанное и сложное мышление. Модели языка (LM), особенно те, которые используют архитектуры трансформера, такие как GPT-4, сделали значительные успехи в области искусственного интеллекта. Однако главная проблема заключается в том, смогут ли модели языка постоянно генерировать эффективные и точные выводы без явного подталкивания к цепочке рассуждений (CoT). Это указывало бы на развитие интуитивного процесса, подобного мышлению человеческой системы 1.

Улучшение возможностей рассуждения LM

Несколько попыток было предпринято в целях улучшения способностей рассуждения LM. Подталкивание CoT является популярным методом, который помогает моделям разбивать сложные проблемы на более мелкие шаги. Однако этот подход требует явного подталкивания и может требовать много ресурсов. Другие подходы сосредоточились на тонкой настройке моделей с дополнительными данными обучения или специализированными наборами данных, но эти методы не полностью преодолели вызов развития интуитивных возможностей рассуждения. Целью остается создание моделей, способных генерировать быстрые и точные ответы без полаганиясь на обширное подталкивание или дополнительные данные обучения.

Инновационный подход CFLLMs

Исследователи из нескольких университетов предложили инновационный подход CFLLMs. Этот подход исследует, могут ли модели языка эволюционировать от осознанного рассуждения к интуитивным ответам через самостоятельное обучение, отражая когнитивное развитие человека. CFLLMs выделяют когнитивные механизмы за генерацией ответов LM и обеспечивают практические преимущества, уменьшая вычислительные затраты во время вывода. Более того, исследователи доказали значительные различия в точности ответов между подходами CoT и не CoT.

Эксперименты и результаты

Эксперименты проведены с целью определения, проявляют ли эти модели характеристики, аналогичные когнитивной структуре человека, и является ли самостоятельная практика без руководства CoT взводом их рассуждательных способностей. Кроме того, эксперимент исследует, обобщаются ли улучшенные рассуждательные способности на различные задачи рассуждения.

Заключение

CFLLMs продемонстрировали существенные улучшения производительности без подталкивания CoT, особенно для задач, связанных с выводом естественного языка. В целом, большие модели требовали меньше примеров, чтобы достичь своей емкости Системы 1, показывая их большую способность использования ограниченных данных для улучшения.

Развитие AI в вашем бизнесе

Если вы хотите использовать искусственный интеллект в своем бизнесе, продумайте, где он может быть применен, определите ключевые показатели эффективности, выберите подходящее решение, внедряйте постепенно, и анализируйте результаты.

Попробуйте использовать ИИ ассистент в продажах для улучшения работы с клиентами и снижения нагрузки на персонал компании.

Если вам нужны советы по внедрению ИИ, обратитесь к нам для получения дополнительной информации.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект