Новая научная статья представляет инструмент машинного обучения, который легко распознает, когда в химических статьях использован чатбот ChatGPT. Интересный способ отследить, какие работы созданы искусственным интеллектом! #наука #машинноеОбучение #химия
Новое исследование представляет инструмент машинного обучения, который легко определяет, написаны ли научные статьи по химии с использованием чатбота ChatGPT
В эпоху, где преобладают достижения в области искусственного интеллекта, отличить между человеческим и машинным контентом, особенно в научных публикациях, становится все более актуальным. Эта статья решает эту проблему, предлагая надежное решение для точной идентификации и различения между человеческим и машинным написанием в научных статьях по химии.
Текущие инструменты обнаружения машинного текста, включая последний классификатор OpenAI и ZeroGPT, сыграли важную роль в определении машинного контента. Однако эти инструменты имеют свои ограничения, поэтому исследователи предлагают специализированное решение, специально разработанное для научного написания. Этот новаторский метод, отличающийся способностью сохранять высокую точность при сложных заданиях и разнообразных стилях письма, является значительным прорывом в этой области.
Исследователи отстаивают специализированные решения перед общими детекторами. Они подчеркивают необходимость инструментов для работы с тонкостями научного языка и стиля. Предложенный метод блестяще справляется с этой задачей, демонстрируя исключительную точность, даже когда сталкивается с сложными заданиями. Иллюстративным примером является создание текста ChatGPT с использованием сложных заданий, таких как создание введений на основе содержания реальных аннотаций. Это показывает эффективность метода в распознавании машинного контента при работе с сложными инструкциями.
Основой предложенного решения являются 20 тщательно разработанных функций, направленных на улавливание особенностей научного письма. Обученная на примерах из десяти различных химических журналов и ChatGPT 3.5, модель проявляет гибкость, поддерживая постоянную производительность в разных версиях ChatGPT, включая продвинутый GPT-4. Интеграция XGBoost для оптимизации и надежных методов извлечения функций подчеркивает адаптивность и надежность модели.
Извлечение функций включает различные элементы, включая количество предложений и слов, наличие пунктуации и конкретных ключевых слов. Этот комплексный подход обеспечивает нюансированное представление отличительных характеристик человеческого и машинного текста. В статье подробно рассматривается производительность модели при применении к новым документам, не входящим в обучающий набор. Результаты показывают минимальное снижение производительности, и модель успешно классифицирует текст из GPT-4, что свидетельствует о ее эффективности в разных версиях языковых моделей.
В заключение, предложенный метод является похвальным решением для всеобщей проблемы обнаружения машинного текста в научных публикациях. Его постоянная производительность при различных заданиях, разных версиях ChatGPT и тестировании вне предметной области подчеркивает его надежность. Статья подчеркивает гибкость разработки метода, завершение цикла занимает около одного месяца, что делает его практичным и своевременным решением, адаптируемым к изменяющемуся ландшафту языковых моделей.
Адресуя опасения о возможных обходах, исследователи стратегически решили не публиковать рабочие детекторы онлайн. Этот преднамеренный шаг добавляет элемент неопределенности, отговаривая авторов от попыток манипулировать машинным текстом для избежания обнаружения. Инструменты такого рода способствуют ответственному использованию ИИ и снижают вероятность академического мошенничества.
В будущем исследователи утверждают, что обнаружение машинного текста не должно стать неразрешимой гонкой вооружений. Вместо этого оно может быть рассмотрено как редакторская задача, автоматизируемая и надежная. Демонстрируемая эффективность обнаружителя машинного текста в научных публикациях открывает возможности для его внедрения в практику академического издательства. По мере того, как журналы сталкиваются с интеграцией машинного контента, инструменты такого рода предлагают реальный путь вперед, поддерживая академическую честность и способствуя ответственному использованию ИИ в научных коммуникациях.
Ознакомьтесь с ссылками на исследование, статью 1 и статью 2. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте присоединиться к нашему сообществу в Telegram t.me/flycodetelegramru, где мы делимся последними новостями об ИИ, интересными проектами и многое другое.
Если вам нравится наша работа, вам понравится и наша рассылка.
Мы также находимся в Telegram и WhatsApp.
Опубликовано на MarkTechPost.