Научные метаданные в исследовательской литературе
Научные метаданные имеют огромное значение в научной литературе. Они улучшают поиск и доступность научных документов, связывая их в единую сеть. Сообщество исследователей осознало важность метаданных, но ранее их внимание к ним было недостаточным, особенно в таких дисциплинах, как социальные науки.
Проблемы и решения
Многие стандарты были разработаны для обеспечения единообразия. Автоматизация метаданных значительно продвинулась благодаря современным методам обработки естественного языка (NLP) и компьютерного зрения. Однако существует серьезная проблема: малые и средние публикации часто имеют разнообразные шаблоны и форматы, что затрудняет применение методов автоматизации.
Исследование в Fraunhofer Institute
Исследователи из Института Фраунгофера изучили различные подходы для извлечения метаданных из научных PDF-документов. Они использовали как классические методы, так и новейшие технологии, такие как BiLSTM с представлениями BERT и методы TextMap.
Создание наборов данных
Команда исследователей создала два сложных размеченных набора данных. Первый набор, SSOAR-MVD, содержал 50,000 образцов, а второй, S-PMRD, был получен из корпуса Semantic Scholar Open Research.
Методы извлечения
Исследователи разделили задачу на две подзадачи: идентификация и извлечение метаданных. Они использовали изменения шрифта для идентификации метаданных на первой странице PDF-документа. После этого применили различные подходы, включая BiLSTM и Grobid, для извлечения информации.
Результаты экспериментов
Результаты показали, что CRF хорошо справляется с предсказуемыми форматами, такими как даты. BiLSTM показал высокую точность для аннотаций и дат. Grobid достиг наивысшего F1-скор в 0.96 при извлечении авторов. Fast RCNN продемонстрировал высокую точность в различных категориях метаданных.
Заключение
Авторы сравнили различные инструменты машинного обучения для точного извлечения метаданных. Это помогает пользователям выбрать наиболее подходящий подход в зависимости от содержания данных и желаемой точности.
Как ИИ может помочь вашей компании
Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, определите области, где возможно применение автоматизации. Выберите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ. Подберите подходящее решение и внедряйте его постепенно, начиная с небольших проектов.
Полученные данные и опыт помогут вам расширить автоматизацию. Если вам нужны советы по внедрению ИИ, свяжитесь с нами.
Попробуйте ИИ-ассистента в продажах, который помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж. Узнайте, как ИИ может изменить ваши процессы с решениями от Flycode.ru.