В октябре проекту Wikidata (Викиданные) исполнилось 10 лет. За эти годы были созданы более 100 миллионов объектов и десятки тысяч редакторов сделали свыше 1,7 миллиардов правок!

Данная статья посвящена возможностям, которые Викиданные предоставляют для научных журналов. В конце статьи приведен краткий анализ присутствия в Викиданных российских журналов.

Для тех, кто не знает, что такое Викиданные (или считает, что знает, мысленно связывая их с войной мнений в созвучно именуемой энциклопедии), рекомендуем не пропускать раздел “Введение”.

Введение

Викиданные –- это “база данных понятий”. Вместо тысячи слов – идентификаторы, связанные отношениями (свойствами), которые, по сути, тоже идентификаторы.

В биографиях Альберта Эйнштейна можно встретить десятки вариантов описания места его рождения. Викиданные также содержат эту информацию, выраженную в виде взаимосвязанных понятий:

[Q937 - А.Эйнштен] : [P569 - место рождения] : [Q3019 - Ulm]

что в более абстрактной форме записи можно сократить до лаконичного триплета:

Q937 : P569 : Q3019

Такой триплет будем называть утверждением. Многие свойства Викиданных позволяют использовать квалификаторы (qualifier), которые играют роль уточнений и по сути являются свойствами свойств.

Помимо квалификаторов утверждения позволяют добавлять сведения об источнике информации (reference).

Так, предложение “В 1912 году Альберт Эйнштейн был номинирован на Нобелевскую премию в области физики” сводится не только к триплету:

[Q937 - А.Эйнштен] : [P1411 - номинирован] : [Q38104 - Нобелев.премия по физике],

но требует добавления:

В используемом нами абстрактном языке эта запись могла бы выглядеть так:

Q937 : P1411 {P585 = 1912 / P248 = Q23684016, P3360 = 2728} : Q38104

Для пользователей веб-интерфейса Викиданных данное утверждение выглядит гораздо нагляднее.

Рис. 1. Фрагмент записи в Викиданных об Альберте Эйнштейне, [Q937](https://www.wikidata.org/wiki/Q937){target='_blank'}

Рис. 1. Фрагмент записи в Викиданных об Альберте Эйнштейне, Q937

Не всё из того, что мы привыкли говорить или думать, можно выразить на языке понятий в Викиданных.

Утверждение “Журнал Х – ведущий и наиболее значимый научный журнал” придется упростить до

[Q… - Журнал Х] : [P31 - является] : [Q5633421 - научный журнал],

поскольку для всего остального в Викиданных не предусмотрены специальные понятия.

Многие свойства в Викиданных имеют ограничения (Property constraints). Так, некоторые могут относиться только к объектам определенного типа (type constraints). Свойство [P569 - место рождения] может быть приписано объектам, которые [P31 - являются] [Q5 - человек] или [Q95074 - вымышленный персонаж], но не объектам типа [Q42889 - транспортное средство]. Бывают и другие типы ограничений.

В тех случаях, когда свойство существует в виде нескольких утверждений (например, указано несколько веб-сайтов), для выделения предпочтительного и нерекомендуемого значений в Викиданных предусмотрены ранги (rank). По умолчанию для созданного утверждения устанавливается ранг со значением Normal, но он может быть изменен на Preferred или Deprecated. В этих случаях к свойству рекомендуется добавить квалификаторы reason for deprecated rank или reason for preferred rank и из доступных вариантов обоснования (возможные значения приведены на страницах с описанием квалификаторов) подходящую причину (например, obsolete или most recent value).

Данная статья посвящена описанию свойств, которые можно использовать для описания объектов типа [Q5633421 - научный журнал].

ИСТОЧНИКИ ДЛЯ САМООБРАЗОВАНИЯ

Базовые сведения:

Популярным языком:

Для тех, кто готов пойти дальше:


Описание журнала

В верхней части веб-страницы любого объекта Викиданных видна таблица, в которой на разных языках перечислены ярлыки (label), описания (description) и варианты названий (also known as / alias) для записи. Эти элементы используются для описания страницы объекта в разных языковых версиях Викиданных. По умолчанию отображаются значения для того языка, который указан в настройках Викиданных.

Рис. 2. Фрагмент записи о журнале JETP Letters в англоязычном интерфейсе Wikidata, [Q4363734](https://www.wikidata.org/wiki/Q4363734){target='_blank'}

Рис. 2. Фрагмент записи о журнале JETP Letters в англоязычном интерфейсе Wikidata, Q4363734

А вот как эта же страница выглядит в русскоязычной версии Викиданных.

Рис. 3. Фрагмент записи о журнале Письма в ЖЭТФ в русскоязычном интерфейсе Wikidata, [Q4363734](https://www.wikidata.org/wiki/Q4363734){target='_blank'}

Рис. 3. Фрагмент записи о журнале Письма в ЖЭТФ в русскоязычном интерфейсе Wikidata, Q4363734

Поле description/описание –- единственное место в структуре описания журнала в Викиданных, где можно ввести относительно вольный текст. Нередко в этом поле можно встретить такие слова как “ведущий”, “уважаемый”, “авторитетный” и т.п.

Рекомендуем заполнить сведения на английском и русском языках. Если хотите заполнить на языке, который отсутствует в карточке, выберите этот язык в настройках Викиданных (верхняя панель).

Ниже приведены свойства и идентификаторы, которые могут быть применимы для большей части российских научных журналов. URL-ссылки указывают на страницы с описанием свойств, на которых можно найти примеры использования (Wikidata property example) и существующие ограничения (property constraint).


Свойства

P31 (instance_of) https://www.wikidata.org/wiki/Property:P31 Тип (класс) объекта Викиданных. Рекомендуемое значение: Q737498 (academic_journal), но можно присвоить дополнительные значения, например, Q16024164 (medical_journal) или Q773668 (open access journal).

Часто используется категория Q5633421 (scientific_journal), которая формально является подклассом Q737498 (academic_journal). По мнению автора статьи, не станет ошибкой указание обоих типов - как Q737498 (academic_journal), так и Q5633421 (scientific_journal). Стоит отметить, что далеко не все научные журналы в Викиданных, правильно указывают свой тип – нередко можно встретить типы Q41298 (magazine), Q49850 (journal) и др.


P1476 (title) https://www.wikidata.org/wiki/Property:P1476

P1813 (short name) https://www.wikidata.org/wiki/Property:P1813

Официальное название и краткое название журнала. Можно ввести несколько вариантов, например, добавив прошлые официальные названия и названия на других языках – каждый вариант должен сопровождаться корректными квалификаторами: language, start time, end time, а для одного из них должен быть установлен ранг Preferred rank.


P2896 (publication interval) https://www.wikidata.org/wiki/Property:P2896{target="_blank“} Вводится в виде числового значения, которое дополняется квалификатором unit (единица измерения).


P407 (language of work or name) https://www.wikidata.org/wiki/Property:P407 Язык издания.


P856 (official website) https://www.wikidata.org/wiki/Property:P856 Можно вводить несколько значений, используя квалификаторы language, start time, end time.


P123 (publisher) https://www.wikidata.org/wiki/Property:P123 Издатель журнала, вводится в виде идентификатора издательства (Q…) с квалификаторами start time и end time.


P495 (country of origin) https://www.wikidata.org/wiki/Property:P495 Страна издания. Иногда можно встретить свойство P17 (country), которое является родительским по отношению к P495. По мнению автора статьи для научного журнала более правильно использовать P495 (country of origin). Российская Федерация имеет значение Q159.


P921 (main subject) https://www.wikidata.org/wiki/Property:P921 Предметная область издания. В описании указано, что значения main subject аналогичны topic, subject, keyword, index term… одним словом, специальных правил нет. В Викиданных собраны данные из большого количества словарей и энциклопедий, см. для примера описание для записи Q764 (fungus) или Q34187 (religious studies). Поле поиска в Викиданных расположено в правом верхнем углу.


P5769 (editor-in-chief) https://www.wikidata.org/wiki/Property:P5769

P98 (editor) https://www.wikidata.org/wiki/Property:P98

Эти свойства должны быть связаны с идентификатором человека. Можно указать несколько человек, занимавших позиции в разные годы, используя квалификаторы start time и end time.


P8875 (indexed in bibliographic review) https://www.wikidata.org/wiki/Property:P8875 Свойство позволяет перечислить реферативные базы данных (в т.ч. индексы научного цитирования), в которых индексируется журнал. Правильным будет использовать квалификаторы start time и end time для отметки о начале/прекращении индексации, а также добавлять ссылку на источник (reference). Ссылка добавляется нажатием кнопки add reference под созданным утверждением. Чаще всего приводят ссылку на страницу с описанием журнала в базе данных (reference URL) или ссылаются на каталог (stated in), который существует в виде объекта в Викиданных. В обоих случаях будет полезно указать дату доступа (retrieved).

Идентификаторы наиболее популярных в России баз данных: Scopus - Q371467, WoS SCIE - Q104047209, WoS AHCI - Q713927, WoS SSCI - Q1090953, WoS ESCI - Q22908122, MEDLINE - Q1540899, DBLP - Q1224715, РИНЦ - Q4398079).


P571 (inception) https://www.wikidata.org/wiki/Property:P571 Дата основания журнала. Рекомендуемое значение –- год, но можно ввести более точную дату.


P138 (named after) https://www.wikidata.org/wiki/Property:P138 Это свойство позволяет указать человека или объект, в честь которых назван научный журнал. Вводится значение идентификатора соответствующей записи. Пример: название журнала Lancet происходит от медицинского скальпеля (Q207172).


P112 (founded by) https://www.wikidata.org/wiki/Property:P112 Это свойство позволяет указать идентификатор человека или организации, которые основали журнал. Пример: журнал Lancet основан Thomas Wakley (Q334239).


Взаимоотношения разных версий

В каталогах многих библиографических баз данных история трансформаций журналов не приводится. Викиданные предлагают несколько специальных свойств для подробного описания истории превращений.

Если у журнала сменились сразу издатель, идентификатор ISSN, адрес веб-сайта и другие важные атрибуты, лучше всего создать для нового журнала отдельную запись и связать её со старой отношениями наследования. В Викиданных есть 2 пары зеркальных свойств для оформления таких отношений:

P155 (follows) https://www.wikidata.org/wiki/Property:P155

P156 (followed by) https://www.wikidata.org/wiki/Property:P156

и

P1365 (replaces) https://www.wikidata.org/wiki/Property:P1365

P1366 (replace by) https://www.wikidata.org/wiki/Property:P1366

Первая пара свойств является родительской (более общей) по отношению ко второй. Обе пары являются зеркальными, то есть утверждения с соответствующими свойствами должны появиться в записях обоих журналов.

В тех случаях, когда предыдущая форма журнала прекращает существование (например, несколько журналов объединяются в один или наоборот), рекомендуется использовать пару P1365/P1366. Если трансформация журнала не затрагивает его суть, а ограничивается лишь сменой бренда/издателя, то лучше использовать пару P155/P156. Однако, можно и не создавать новую сущность, а просто внести в существующую запись новые детали с помощью квалификаторов start time/end time и рангов.

Связь с переводными версиями журнала можно указаться с помощью свойства P9745 (translation of) https://www.wikidata.org/wiki/Property:P9745, при этом в записях обоих изданий должен быть указан язык издания (то есть должны присутствовать утверждения со свойством P407 = language of work or name).

Для отметки о том, что журнал прекратил существование рекомендуется использовать свойство P2669 (discontinued date) https://www.wikidata.org/wiki/Property:P2669, хотя нередко можно встретить использование P576 (dissolved, abolished or demolished date) https://www.wikidata.org/wiki/Property:P576. Рекомендуем для более не издаваемых журналов в свойстве P2669 указывать год последнего выпуска и добавлять ссылку на источник, подтверждающий прекращение издания.

Если у журнала есть регулярные специальные выпуски, которые заслуживают отдельного упоминания, в Викиданных можно создать отдельные записи для журнала и для спецвыпусков, и связать их отношениями

P527 (has part(s)) https://www.wikidata.org/wiki/Property:P527

P361 (part of) https://www.wikidata.org/wiki/Property:P361

Последняя пара отношений не является зеркальной, то есть можно использовать только P527 (has part(s)) в записи журнала или P361 (part of) в записи спецвыпуска.

Интерфейс Викиданных выделяет некорректно оформленные утверждения и даёт рекомендации (см. пример ниже).

Рис. 4. Пример рекомендации по корректному оформлению утверждения в записи Викиданных

Рис. 4. Пример рекомендации по корректному оформлению утверждения в записи Викиданных


Идентификаторы

В описание журнала можно также добавить набор свойств-идентификаторов. Для большинства свойств-идентификаторов в Викиданных предусмотрены правила формирования гиперссылки (на страницу журнала в соответствующем каталоге) и формат (маска для вводимых значений).

Большая часть идентификаторов в Викиданных появилась в результате работы ботов –- специальных скриптов, которые импортируют сведения из общедоступных каталогов. Таким образом, запись о журнале в Викиданных может содержать десятки идентификаторов, внесенных без участия представителей издательства или редакции.

Если Вы обнаружили в записи некорректный идентификатор, измените ему ранг на deprecated и укажите причину, используя квалификатор reason for deprecated и ссылку на подтверждающий источник.

Почему не надо удалять некорректные данные? Во-первых, если их добавил бот, значит они присутствуют в каком-то открытом каталоге (достаточно авторитетном, чтобы боту разрешили импорт). Если удалить утверждение с некорректным значением, оно может появиться снова. Во-вторых, удаление полей из Викиданных привлекает внимание тех, кто следит за порядком. Это могут счесть признаками вандализма –- удаленные данные восстановят, а к неосторожному редактору рано или поздно применят дисциплинирующие меры.


P236 (ISSN) https://www.wikidata.org/wiki/Property:P236 Вводится значение с использованием дефиса, формируется ссылка на portal.issn.org. Каждому значению ISSN должен соответствовать уникальный набор квалификаторов applies to part, start time, end time, language of work or name, distribution format, publisher. Таким образом, если вся история трансформаций журнала поддерживается в одной записи Викиданных (без создания новых записей), каждый ISSN должен сопровождаться корректным набором квалификаторов.


P7363 (ISSN-L) https://www.wikidata.org/wiki/Property:P7363 Вводится значение с использованием дефиса, формируется ссылка на portal.issn.org.


P10952 (elibrary.ru journal ID) https://www.wikidata.org/wiki/Property:P10952


P8375 (Crossref Journal ID) https://www.wikidata.org/wiki/Property:P8375


P10283 (OpenAlex ID) https://www.wikidata.org/wiki/Property:P10283


P7662 (Scilit journal ID) https://www.wikidata.org/wiki/Property:P7662


P6180 (Dimensions Source ID) https://www.wikidata.org/wiki/Property:P6180


P1055 (NLM Unique ID) https://www.wikidata.org/wiki/Property:P1055


P3181 (OpenCitations bibliographic resource ID) https://www.wikidata.org/wiki/Property:P3181


P1156 (Scopus source ID) https://www.wikidata.org/wiki/Property:P1156


P5115 (Directory of Open Access Journals ID) https://www.wikidata.org/wiki/Property:P5115


P8104 (Paperity journal ID) https://www.wikidata.org/wiki/Property:P8104


P1144 (Library of Congress Control Number / LCCN) https://www.wikidata.org/wiki/Property:P1144


P243 (OCLC control number) https://www.wikidata.org/wiki/Property:P243


P8903 (HAL journal ID –- французский каталог периодики) https://www.wikidata.org/wiki/Property:P8903


P6981 (ACNP journal ID – итальянский каталог периодики) https://www.wikidata.org/wiki/Property:P6981


P214 (VIAF ID) https://www.wikidata.org/wiki/Property:P214


Редактирование профиля

  1. Перейти на сайт https://www.wikidata.org

  2. Нажать Log in (если нет аккаунта, то зарегистрироваться, нажав Join Wikidata)

  3. Авторизоваться.

  4. Найти журнал по названию (на любом языке) или по ISSN.

Вот и всё, можно править, вперёд!

Полную историю правок для любой записи можно увидеть, нажав на кнопку View history (над заголовком записи).

Если у журнала 2 записи в Викиданных, их можно объединить, используя функции, которые спрятаны под кнопкой More (рядом с полем для поиска)

Рис. 5. Команды в меню Викиданных для объединения записей

Рис. 5. Команды в меню Викиданных для объединения записей


Зачем использовать Викиданные?

Викиданные связывают объекты в гигантскую сеть (граф) и позволяют её анализировать ошеломительно прекрасными уникальными способами.

Сформировать список представительниц прекрасного пола, которые имеют научные награды и в своих публикациях цитировали статьи из журнала “Молекулярная биология”?

В Викиданных это можно сделать в 1 запрос (см.результат).

Сервис Scholia наиболее выразительно демонстрирует возможности использования утверждений в запиях Викиданных для формирования и анализа профилей научных журналов, организаций, публикаций, исследователей и т.д. Десятки ботов импортируют в Викиданные сведения из открытых реестров (CrossRef, ORCID и др.), поэтому объем доступных сведений быстро увеличивается.

Примеры профилей журналов в Scholia:

Профили журналов в Scholia создаются автоматически на основании записей в Викиданных (см. примеры выше). Главное требование – запись в Викиданных должна иметь правильный тип (см. выше про P31).

Всё остальное зависит от тех, кто занимается продвижением журнала. Можно подождать пару лет, пока боты сами всё распознают и внесут в Викиданные сведения обо всех публикациях и авторах журнала. Или самостоятельно наладить экспорт сведений в Викиданные через доступные API и сервисы вроде Quick Statements.


Запросы к Викиданным

Для исследования Викиданных используют запросы на языке SPARQL, которые отправляют через удобный веб-интерфейс Wikidata Query Service или с помощью API (для R: WikidataR, для Python: пакет Wikidata, другие примеры).

Примеры запросов к Викиданным:

Много примеров SPARQL-запросов с объяснениями на русском языке можно найти в уже упоминавшемся курсе “Программирование Викиданных”.


Российские журналы в Викиданных

В качестве иллюстрации возможностей выгрузим из Викиданных сведения об отечественных журналах, входящих в список ВАК (из публично доступной версии PDF от 23.09.2022).

Поиск журнала по идентификатору ISSN можно выполнить с помощью простого SPARQL-запроса, который возврает только идентификатор Викиданных:

SELECT ?item WHERE{ ?item wdt:P236 "1364-6826"}

Чтобы найти другой журнал, замените 1364-6826 на ISSN журнала, вставьте запрос в поле Wikidata Query Service и нажмите большую синюю кнопку с белой стрелкой (или Ctrl + Enter). Откройте в новом окне найденную гиперссылку вида wd:Qxxxxxxx.

Для каждого журнала из списка ВАК с помощью скрипта (R) был выполнен поиск записей Викиданных по идентификатору ISSN. Для найденных записей были выгружены значения из полей для вышеперечисленных свойств (сбор данных занял не более 15 минут). На иллюстрации ниже показана доля журналов, для которых были найдены записи, и доля заполненных полей в найденных записях.

Рис. 6. Результаты анализа присутствия журналов из перечня ВАК в Викиданных

Рис. 6. Результаты анализа присутствия журналов из перечня ВАК в Викиданных

Одним словом, для большинства журналов, если что-то и присутствует в Викиданных, то только благодаря kindness of strangers трудолюбивым ботам.


В таблице ниже приведены журналы, которые не были обнаружены в Викиданных по приведенным в списке ВАК идентификаторам ISSN.


Финальные ремарки

Существует мнение, что Викиданные несут на себе бремя славы Википедии. База знаний, в которой объекты, отношения и свойства выражены абстрактными идентификаторами, не должна быть настолько созвучна с площадкой, где графоманы и борцы за единственное верное мнение сражаются за право называть других фальсификаторами. Кто знает, может с другим именем, Викиданные получили бы большее признание?

Данное исследование иллюстрирует лишь малую часть возможностей, которые предоставляют Викиданные и родственные сервисы для издателей научных журналов. Вопрос о целесообразности и своевременности наполнения профиля журнала в Викиданных каждый издатель решит самостоятельно. По личному мнению автора, вне зависимости от принятого решения, знакомство с массивом и технологиями Викиданных будет полезно любому, кто интересуется данными. И массив Викиданных, и программное обеспечение Wikibase доступны всем желающим на условиях открытых лицензий.


Благодарности

Автор выражает признательность разработчикам открытого ПО R v4.1.2, RStudio и программных пакетов:


Материал распространяется по открытой лицензии Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0).

CC BY-SA 4.0, ФГБУ "Российский центр научной информации" (РЦНИ), текст и иллюстрации, 2022.

РЦНИ не несет ответственности за любые последствия, связанные с использованием приведенной выше информации.

Для обратной связи: написать письмо.

Информация для цитирования:

Лутай А.В. Сервис Викиданные для научных журналов./ А.В. Лутай; Российский центр научной информации. – Текст : электронный // РЦНИ : [сайт]. – URL: https://podpiska.rfbr.ru/materials/wikidata4journals/. – Дата публикации: 24.10.2022.