Это исследование ИИ помогает ученым упорядочить метаданные с помощью сравнения методов извлечения для научных документов.

 This AI Study Saves Researchers from Metadata Chaos with a Comparative Analysis of Extraction Techniques for Scholarly Documents

Научные метаданные в исследовательской литературе

Научные метаданные имеют огромное значение в научной литературе. Они улучшают поиск и доступность научных документов, связывая их в единую сеть. Сообщество исследователей осознало важность метаданных, но ранее их внимание к ним было недостаточным, особенно в таких дисциплинах, как социальные науки.

Проблемы и решения

Многие стандарты были разработаны для обеспечения единообразия. Автоматизация метаданных значительно продвинулась благодаря современным методам обработки естественного языка (NLP) и компьютерного зрения. Однако существует серьезная проблема: малые и средние публикации часто имеют разнообразные шаблоны и форматы, что затрудняет применение методов автоматизации.

Исследование в Fraunhofer Institute

Исследователи из Института Фраунгофера изучили различные подходы для извлечения метаданных из научных PDF-документов. Они использовали как классические методы, так и новейшие технологии, такие как BiLSTM с представлениями BERT и методы TextMap.

Создание наборов данных

Команда исследователей создала два сложных размеченных набора данных. Первый набор, SSOAR-MVD, содержал 50,000 образцов, а второй, S-PMRD, был получен из корпуса Semantic Scholar Open Research.

Методы извлечения

Исследователи разделили задачу на две подзадачи: идентификация и извлечение метаданных. Они использовали изменения шрифта для идентификации метаданных на первой странице PDF-документа. После этого применили различные подходы, включая BiLSTM и Grobid, для извлечения информации.

Результаты экспериментов

Результаты показали, что CRF хорошо справляется с предсказуемыми форматами, такими как даты. BiLSTM показал высокую точность для аннотаций и дат. Grobid достиг наивысшего F1-скор в 0.96 при извлечении авторов. Fast RCNN продемонстрировал высокую точность в различных категориях метаданных.

Заключение

Авторы сравнили различные инструменты машинного обучения для точного извлечения метаданных. Это помогает пользователям выбрать наиболее подходящий подход в зависимости от содержания данных и желаемой точности.

Как ИИ может помочь вашей компании

Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, определите области, где возможно применение автоматизации. Выберите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ. Подберите подходящее решение и внедряйте его постепенно, начиная с небольших проектов.

Полученные данные и опыт помогут вам расширить автоматизацию. Если вам нужны советы по внедрению ИИ, свяжитесь с нами.

Попробуйте ИИ-ассистента в продажах, который помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж. Узнайте, как ИИ может изменить ваши процессы с решениями от Flycode.ru.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект