В 2023 году российские ученые впервые останутся без доступа к Scopus и Web of Science. РЦНИ подготовил краткий сравнительный анализ открытых сервисов для научного поиска. Нижеперечисленные сервисы используют контент не только из открытых и общедоступных источников (таких как Crossref, MEDLINE, и т.д.), но также стремятся наладить прямую индексацию издательских платформ и репозиториев.
Новый сервис компании OurResearch, которая также известна благодаря запущенным ранее онлайн-сервисам ImpactStory и Unpaywall. Сервис пополняется сведениями из открытых источников и ведет базу данных с 5 типами объектов: публикации (works), авторы (authors), организации (institutions), издания (venues) и понятия (concepts).
В настоящий момент сервис доступен в виде превосходно документированного набора API-сервисов, для которых уже доступны удобные пакеты на языках R и Python.
Уникальные особенности:
Информационные материалы:
Активно развивающийся сервис Института искусственного интеллекта Аллена. База данных наполняется метаданными из открытых источников, и получаемыми напрямую от правообладателей.
Исследователям доступны:
Уникальные особенности:
Информационные материалы:
Австралийская открытая база данных, содержащая сведения о публикациях и патентах.
Возможности The Lens:
Информационные материалы:
Онлайн-ресурс компании Digital Science, предлагающий бесплатную версию для персонального использования.
Уникальные особенности:
Информационные материалы:
Бесплатный сервис MDPI, который сочетает в себе функционал индекса научного цитирования и поисковой системы. База данных пополняется сведениями из открытых источников, а также информацией, которую напрямую предоставляют издатели журналов. Сервис Scilit, развивающийся при консультативной поддержке авторитетных экспертов, уже сегодня предлагает широкий выбор инструментов для анализа мировой науки и может представлять интерес для российских исследователей.
Возможности:
Уникальный функционал вышеперечисленных баз данных заслуживает особого внимания.
OpenAlex | Semantic Scholar (S2) | The Lens | Dimensions (free) | Scilit | |
---|---|---|---|---|---|
Количество публикаций | 245 M | 208 M | 252 M | 132 M | 152 М |
Метаданные из открытых БД (CrossRef, DOAJ, MEDLINE) | да | да | да | да | да |
Метаданные от издателей | - | да | да | да | да |
Индексация препринтов | да | да | да | да | да |
Поиск по DOI | да (API) | да | да | да | да |
Поиск по тексту аннотации или ключевым словам | да (API) | да | да | да+ | да |
Идентификаторы автора | ORCID, OpenAlex | S2, ORCID | ORCID | Digital Science, ORCID, ResearcherID, Scopus Author ID | ORCID |
Поиск по авторам | да (API) | да | да | да | да |
Идентификаторы организации | ROR, OpenAlex | - | ROR | ROR | ROR |
Поиск по названию организации | да (API) | - | да | - | да |
Бесплатный API | да | да | - | Dimensions Badge, Metrics API | - |
Экспорт результатов поиска (формат) | JSON | из коллекций | CSV, JSON | XLSX, CSV, VosViewer | XLSX |
Лицензия для результатов экспорта | СС0 | (c) и CC BY-NC 4.0 | CC BY-NC-SA | (c) | (c) |
Персональные коллекции | - | да | да | да | - |
Функции уведомления (RSS, email, feeds) | - | emails, feeds | SciFeed | ||
Экспорт списка процитированной литературы | да | да | да | - | - |
Экспорт списка цитирующих статей | да | да | - | - | да |
Экспорт списка цитирующих патентов | - | - | да | - | - |
Все эти ресурсы отличаются от Scopus и Web of Science отсутствием строгих процедур отбора и, как следствие, более широким охватом научных изданий.
Сравнительный анализ качества метаданных в Lens, Semantic Scholar и OpenAlex показал, что некоторые поля метаданных в открытых источниках заполнены лишь частично, что ограничивает возможность их использования для наукометрических исследований. Вместе с тем, поля содержащие название статьи, аннотацию, имена авторов, идентификаторы и ключевые слова, заполнены в достаточной степени, чтобы рекомендовать эти базы данных в качестве замены Scopus и Web of Science для поиска научных публикаций. Не случайно популярный наукометрический инструмент VosViewer включил Dimensions, Lens, Semantic Scholar и OpenAlex в перечень ресурсов, которые можно использовать в качестве источника метаданных.
Каждый из перечесленных выше онлайн-ресурсов предлагает достаточно уникальный набор функций и удобств, поэтому вопрос «Кто лучший?» мы оставим без ответа.
А какой инструмент самый быстрый?
Для ответа на этот вопрос мы собрали 5 наборов статей с участием российских авторов, которые были проиндексированы в Scopus с начала сентября 2022 года в указанные ниже диапазоны дней, между которыми было около 2 недель:
В исследование включили 8917 статей, вышедших в 2020 году или позднее. В период с 16 по 17 декабря в базах данных Dimensions, Lens, Semantic Scholar и OpenAlex был выполнен поиск всех статей.
На иллюстрациях ниже показаны (1) доля публикаций из групп А-Д, присутствующая в открытых базах и (2) суммарное количество цитирований для найденных статей.
Для большей наглядности результаты представлены для следующих подгрупп публикаций:
Количество статей в каждой группе показано в квадратных скобках над соответствующей диаграммой.
Результаты выполненного экспресс-анализа свидетельствуют о том, что по скорости индексации открытые базы данных вполне сравнимы со Scopus, однако, этот показатель, очевидно, зависит от издателя (издательской платформы).
Совокупная цитируемость статей в исследуемых подгруппах в БД Dimensions и Semantic Scholar выше, чем в остальных базах данных, в т.ч. и в Scopus.
Авторы выражают признательность разработчикам открытого ПО R v4.1.2, RStudio и программных пакетов:
© Российский центр научной информации, текст, дизайн, иллюстрации, 2022.
РЦНИ не несет ответственности за любые последствия, связанные с использованием приведенной выше информации.
Для обратной связи: написать письмо.
Информация для цитирования:
Лутай А.В. Открытые сервисы для поиска научных публикаций./ А.В. Лутай, О.В. Черченко; Российский центр научной информации. – Текст : электронный // РЦНИ : [сайт]. – URL: https://podpiska.rfbr.ru/materials/2022_open_search_solutions/. – Дата публикации: 28.12.2022.