Важность MINT-1T для обучения крупных мультимодальных моделей (LMMs)
Большие наборы данных с открытым исходным кодом играют важную роль в исследовательском сообществе, также есть значительный сдвиг к обучению крупных мультимодальных моделей (LMMs), которые требуют больших наборов данных, содержащих как изображения, так и тексты. На сегодняшний день открытые мультимодальные наборы данных меньше и менее разнообразны по сравнению с наборами данных только с текстом, что затрудняет разработку сильных мультимодальных моделей с открытым исходным кодом и увеличивает разрыв в производительности между открытыми и закрытыми моделями.
Значимые результаты и решения
Исследователи из нескольких университетов предложили MINT-1T – самый крупный и разнообразный открытый мультимодальный набор данных на сегодняшний день. LLMs, обученные на MINT-1T, предлагают улучшение в 10 раз по сравнению с текущими открытыми наборами данных и могут превзойти модели, обученные на лучших существующих открытых наборах данных. MINT-1T также создал большой открытый набор данных, собрав различные источники, такие как HTML, PDF и ArXiv. Для улучшения качества обработки текста проводится фильтрация, которая позволяет более эффективно масштабировать модели только с текстом.
Применение в бизнесе
Использование решений на основе MINT-1T позволяет улучшить процессы в различных областях, таких как продажи. Новейшие технологии ИИ, такие как ИИ ассистент в продажах от Flycode.ru, позволяют отвечать на вопросы клиентов, генерировать контент и снижать нагрузку на первую линию.