Многоуровневая классификация текста с помощью активного обучения
Многоуровневая текстовая классификация (MLTC) присваивает несколько релевантных меток тексту. Глубокие модели обучения показывают отличные результаты, но требуют много размеченных данных, что дорого и занимает много времени. Активное обучение оптимизирует этот процесс, выбирая наиболее информативные неремеченные образцы для аннотации, что снижает затраты на разметку.
Проблемы существующих методов
Большинство существующих методов активного обучения разработаны для традиционных моделей с одной меткой и не применимы к глубоким многоуровневым моделям. Сложность многоуровневых задач и высокая стоимость аннотаций требуют создания методов активного обучения, адаптированных для глубоких моделей MLTC.
Метод BEAL
Исследователи из Института автоматизации Китайской академии наук и других учреждений предложили метод BEAL — глубокое активное обучение для MLTC. BEAL использует байесовское глубокое обучение с дроп-аутом для оценки распределения предсказаний модели и вводит новую функцию приобретения, основанную на ожидаемой уверенности, для выбора неопределенных образцов.
Преимущества BEAL
Эксперименты с моделью MLTC на основе BERT показывают, что BEAL улучшает эффективность обучения, достигая сходимости с меньшим количеством размеченных образцов. Этот метод можно расширить на другие задачи многоуровневой классификации и значительно сократить потребность в размеченных данных по сравнению с существующими методами.
Процесс активного обучения
Методология вводит фреймворк активного обучения в пакетном режиме для глубокого MLTC. Начинается с небольшой размеченной выборки, фреймворк итеративно выбирает неремеченные образцы для аннотации на основе функции приобретения. Эта функция выбирает образцы с наименьшей ожидаемой уверенностью, измеряемой предсказанной неопределенностью модели.
Результаты исследования
Авторы оценили метод BEAL, используя два эталонных набора данных: AAPD и StackOverflow. Результаты показывают, что BEAL превосходит другие методы, выбирая наиболее информативные образцы, что снижает потребность в размеченных данных. BEAL достигает наилучших результатов с меньшим количеством размеченных образцов: всего 64% на AAPD и 40% на StackOverflow.
Заключение
Метод BEAL представляет собой активное обучение для глубоких моделей MLTC. Он использует байесовское глубокое обучение для оценки распределения предсказаний и определяет функцию приобретения на основе ожидаемой уверенности для выбора неопределенных образцов для обучения. Экспериментальные результаты показывают, что BEAL превосходит другие методы активного обучения, позволяя более эффективно обучать модели с меньшим количеством размеченных образцов. Это особенно ценно в реальных приложениях, где получение больших объемов размеченных данных затруднено.
Рекомендации по внедрению ИИ
Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, используйте метод BEAL. Проанализируйте, как ИИ может изменить вашу работу, определите ключевые показатели эффективности (KPI), которые вы хотите улучшить. Подберите подходящее решение и внедряйте ИИ постепенно, начиная с малого проекта.