Преимущества применения ИИ в сегментации данных
Инновационные решения для компьютерного зрения
Трансформерные модели в задачах сегментации инициировали новую эру в области компьютерного зрения. Модель Segment Anything от Meta доказала свою эффективность и стала эталоном благодаря своей надежности и отличным показателям. Однако для обучения все еще требуется ручная разметка, что делает процесс трудоемким. Человеческая аннотация затратна, ненадежна для чувствительных приложений и требует много времени. Эти проблемы требуют подхода без разметки, который предлагает производительность на уровне SAM, но при гораздо более низкой стоимости.
Новые подходы в области сегментации
Активно развиваются самообучающиеся трансформеры и нулевая сегментация с помощью подсказок. Исследователи из UC Berkeley разработали метод Unsupervised SAM (UnSAM), который представляет собой новый метод без учителя для решения вызовов, связанных с разметкой. UnSAM использует стратегию “разделяй и властвуй” для выявления иерархических структур в визуальных сценах и создания масок сегментации с различным уровнем детализации на основе этих структур.
Преимущества UnSAM
UnSAM превзошел SAM на 6,7% в AR и на 3,9% в AP на наборе данных SA-1B при обучении на 1% набора данных. Его производительность сравнима с обучением SAM на полном наборе данных из 11 миллионов изображений, отличаясь всего на 1%. В среднем UnSAM превзошел предыдущий лучший результат на 11,0% в AR. При оценке на PartImageNet и PACO UnSAM превзошел лучший результат на 16,6% и 12,6% соответственно.
Заключение
UnSAM демонстрирует, что высококачественные результаты могут быть достигнуты без использования огромных наборов данных, созданных силами человека. Малые и легкие архитектуры могут использоваться наряду с масками, созданными UnSAM, для продвижения чувствительных областей, таких как медицина и наука.