Семинар

Четверг, 4 июня 2026
15:00
ЛИТ, Ком. 310
Андрей Кондратьев

Методы и программные средства автоматизации управления метаданными научных публикаций

Аннотация:

В исследовании представлены методы и программные средства автоматизации управления метаданными научных публикаций, обеспечивающие сквозную обработку библиографических данных от агрегации из распределённых источников до верифицированного импорта в институциональные цифровые репозитории. Предложена методика каскадной агрегации метаданных через программные интерфейсы внешних научных баз, позволяющая формировать унифицированные записи публикаций посредством последовательного сопоставления по цифровым идентификаторам и библиографическим атрибутам. Для разрешения авторской неоднозначности разработан мультифакторный алгоритм, интегрирующий детерминированные сопоставления по глобальным идентификаторам исследователей, нечёткое сравнение фамилий и инициалов с применением метрик строкового расстояния, а также контентный анализ тематических профилей на основе статистической модели взвешивания терминов. Реализован гибридный механизм верификации, при котором алгоритмическая фильтрация дополняется маршрутизацией сложных случаев в систему экспертной проверки, что минимизирует долю ручной обработки. Программный комплекс спроектирован на основе модульной архитектуры с унифицированными адаптерами для платформ цифровых репозиториев с открытым исходным кодом, что гарантирует независимость производительности от типа целевой системы хранения. Экспериментальная оценка в производственной среде подтвердила высокую точность идентификации авторов, эффективность устранения дубликатов и существенное снижение временных затрат на обработку библиографических записей.

Информация о семинаре и ссылка на подключение размещены в Indico.
Подключение к MTS Link.