Введение

Социальная сеть ВКонтакте активно используется российскими вузами для работы с массовой аудиторией. У некоторых вузов официальные группы в ВКонтакте (далее также – VK-сообщества) поддерживаются крупными подразделениями, в том числе научными библиотеками.

Для данного исследования был собран перечень 367 профилей VK-сообществ библиотек, которые разбили на 5 групп:

Дизайн

Целью настоящего исследования является описательный и сравнительный анализ содержимого материалов (далее – публикации), опубликованных в период с 1 января 2020 года по 31 июля 2022 года (далее – Период) на стенах VK-сообществ выбранных категорий библиотек.

Данные

Поиск профилей официальных сообществ библиотек выполняли на веб-странице сайтов библиотек и в поисковом интерфейсе ВКонтакте.

При наличии у библиотеки нескольких VK-сообществ (например, для отдела комплектования, отдела иностранной литературы и т.п.) в исследование включалась только главная группа библиотеки.

Неофициальные или закрытые группы библиотек в исследование не включались.

Публикации со стен были собраны с использованием публичного API сервиса ВКонтакте, дата последнего обновления – 31 июля 2022 г.

Активность в группах

Со стен 367 VK-сообщества было собрано 361355 публикаций.

На иллюстрации 1 для каждого сообщества (точки) показано количество месяцев, в которые на стене сообщества была опубликована хотя бы 1 запись и количество публикаций на стене за исследуемый Период.

Иллюстрация 1

Иллюстрация 1

Во всех группах более половины VK-сообществ проявляли активность на протяжении почти всего исследуемого периода, с 01.01.2020 по 31.07.2022 гг. (медиана количества активных месяцев варьировала от 29 до 31). Некоторые VK-сообщества были созданы в 2021 - 2022 гг., поэтому имеют меньшее количество активных месяцев.

В группах VK-сообществ региональных научных библиотек (РЕГН) и библиотек общего профиля (ББОП) в среднем за исследуемый было опубликовано в несколько раз больше сообщений (медиана – 1600 сообщений), чем в 2-х других группах (ВУЗЫ, СПЕЦ).


Динамика активности сообществ

На иллюстрации 2 для каждой группы VK-сообществ показано суммарное количество публикаций за месяц.

Иллюстрация 2

Иллюстрация 2

Динамика появления публикаций в VK-сообществах библиотек вузов (ВУЗЫ) демонстрировала спад в июле/августе и наивысшие значения в марте/апреле каждого года. В остальных группах сезонные изменения активности были выражены слабее.

Тематический анализ публикаций сообщества (метки)

ВКонтакте позволяется присваивать публикациям специальные метки, которые облегчают пользователям поиск и фильтрацию похожих публикаций. Метки внутри публикаций выглядят как слова или группы слов (без пробелов), предваренные знаком #.

Из исследуемого массива публикаций мы выделили свыше 803 тысяч меток, из которых отобрали те, что встречались в публикациях минимум 2-х сообществ из исследуемого перечня (всего – 15051 метка). Такой отбор позволяет исключить из анализа метки, которые специфичны для отдельных организаций и не появляются в публикациях других VK-сообществ (например, #университетскомудубу55).

Метки отсортированы по убыванию количества сообществ, в которых они появлялись – такой рейтинг отражает популярность темы соответствующей метке для группы сообществ.

В таблице ниже представлены 1000 наиболее популярных меток по количеству сообществ (число напротив метки), в публикациях которых метки встречались в период с 01.01.2020 по 31.07.2022 гг.

Метки призваны выполнять функцию обобщающих категорий, поэтому в их роли чаще всего используются широко распространенные слова, универсальные культурные коды и термины, имеющие прямое отношение к библиотечной деятельности - по этой причине на вершине рейтинга популярности: #книги, #библиотека, #деньпобеды, #литература, #библионочь, #история, #наука, #9мая, #8марта и т.д.

Очевидно, что некоторые из этих меток, относящиеся к памятным или праздничным датам появляются в большинстве сообществ лишь в определенный период времени и слабо характеризуют специфику сообщества. Другие метки, напротив, могут встречаться в меньшем количестве сообществ, но появляться в публикациях с более высокой регулярностью, таким образом, отражая направления деятельности и спектр интересов сообщества.

Описанные различия можно наблюдать на иллюстрации 3, на которой 250 наиболее популярных меток (т.е. тех, что упоминались в наибольшем количестве сообществ), распределены вдоль оси по значению условной метрики ОЧУ (относительная частота упоминаний), которую мы определили, как отношение квадратного корня от количества публикаций с упоминанием метки (во всех сообществах) к количеству таких сообществ. Метрика создана для иллюстрации различий между 10 метками с наиболее высокими и наименее низкими значениями ОЧУ. Слева – праздники и даты, справа – ингредиенты повседневности.

Иллюстрация 3

Иллюстрация 3

К удовлетворению авторов в первой тысяче строк рейтинга популярности меток (по количеству сообществ) обнаруживаются метки, связанные с национальной подпиской и электронными ресурсами – #нацподписка, #elsevier, #springernature, #scopus, #webofscience, #clarivate, #proquest, #wiley (в таблице выше их можно найти, воспользовавшись полем для поиска).

Для этой задачи мы провели поиск следующих терминов: altmetric, aminer, anywhereaccess, arxiv, authorea, base, casa, citationchaser, citationgecko, citeseerx, citespace, coci, cocites, commons, connectedpapers, core, creative, crossref, cyberleninka, datacite, dblp, dimensions, doaj, doiboost, dryad, figshare, getftr, github, i4oa, i4oc, ifla, inciteful, knowledgegraph, kopernio, leanlibrary, lens, libkey, localcitationnetwork, mendeley, mesh, metadata, microsoftacademic, naver, nomad, openaccess, openaire, openalex, openathens, opencitations, opencode, openscience, orcid, orkg, plum, preprint, publons, refcat, referencemanager, repec, researchgate, researchrabbit, ror, scholar, scholarcy, scholia, scholix, scilit, scinapse, searchrxiv, sherpa, shibboleth, unpaywall, vosviewer, wikidata, zenodo, zotero, киберленинка, метаданные, открытаянаука, открытыйдоступ, открытыйкод, препринт) – и из них нашли 19, упомянутых в 230 публикациях (0.06% от общего количества) от 39 VK-сообществ (преимущественно университетских библиотек).

На иллюстрации 4 связи между VK-сообществами и найденными метками показаны в виде сетевой структуры – наибольшее число упоминаний получили метки #открытыйдоступ, #openaccess, #открытаянаука.

Иллюстрация 4

Иллюстрация 4

Подобно ключевым словам в научных публикациях, метки имеют очень низкую информативность для поисковых запросов. Более широкие возможности для тематического анализа публикаций открывает поиск терминов в полном тексте публикаций.

Рейтинг меток с разбивкой по типам библиотечных VK-сообществ доступен для скачивания в виде csv-файла (1Мб, 26649 строк). Содержит только те метки, которые упоминались минимум в 2-х сообществах из изучаемого перечня.


Тематический анализ публикаций сообщества (текст)

Учитывая хрестоматийное разнообразие тем, о которых в силу специфики своей работы могут писать библиотеки, мы решили не применять сложные подходы к NLP-анализу текстов и выделению тематических направлений (topic modelling) и сосредоточиться на главном. А именно – как часто в библиотечных сообществах появляется информация об открытой науке, т.е. о той части мировой инфраструктуры научного знания, которая доступна всем, вне зависимости от степени участия в проекте национальной подписки и необходимости отчитываться цифрами из Web of Science. Для этой задачи мы сформировали собственный перечень меток: Google Scholar, Semantic Scholar, Lens.com, Open Access, Crossref, Unpaywall, Preprint, Cyberleninka, Wikidata, IFLA, АНРИ, OpenAlex, ORCID, Publons, Dimensions, Arxivs, Референс-менеджер, Kopernio, Удал.доступ, OpenScience, Data Repos, OpenAire, Altmetrics, DBLP, Scholia, Asian Search Engines, Pubmed, OSF, Researcher Tools, ROR, Открытый код, Sherpa, ResearchGate, Internet Archive, BASE, Authorea (далее – СПИСОК Х).

Некоторые метки содержали в себе группы терминов. Так, метка Arxivs содержит термины arxiv, biorxiv, socarxiv, agrirxiv, ssrn, medrxiv, chemrxiv, psyarxiv, eartharxiv, (searchrxiv) и repec. Если в публикации сообщества обнаруживался любой из этих терминов, то публикация получала метку Arxivs. Еще несколько примеров – метка Researcher Tools включает в себя перечень названий современных инструментов для анализа публикаций scholarcy, scilit, citationchaser, knowledgegraph, cocites, connectedpapers, scinapse, vosviewer, citespace, citationgecko, orkg, scholix, inciteful, researchrabbit, localcitationnetwork, а метка Удал.доступ – термины удалённый доступ, shibboleth, athens, getftr, google casa, libkey, nomad, anywhereaccess, leanlibrary. Все термины приведены в удобном для читателя виде, поиск же проводился с использованием различных вариантов написания, общих лексем и регулярных выражений, чтобы избежать ложноположительных результатов.

Выполнив, таким образом, разметку всех 361355 публикаций, мы обнаружили 9019 упоминаний терминов из СПИСКА Х в 331 (из 367) VK-сообществе и найденные связи {сообщество – метка} представили в виде сетевой структуры (Иллюстрация 5).

Иллюстрация 5

Иллюстрация 5

Как можно видеть, наиболее часто в публикациях библиотечных VK-сообществ встречались термины, которым мы присвоили метки Open Science, Open Access и Удаленный доступ (алгоритм укладки сети помещает такие метки в центр).

У вузовских библиотек в центре графа (Иллюстрация 6) к вышеупомянутым меткам добавились метри АНРИ, Cyberleninka, PubMed и Референс-менеджер.

Иллюстрация 6

Иллюстрация 6

В нижней части графика мы увидели расположенные рядом метки Т13 (Lens.com), Т16 (OpenAlex), Т24 (Semantic Scholar) – эти термины присутствуют в заголовке аналитического отчёта “Сравнение качества метаданных в БД CrossRef, Lens, OpenAlex, Scopus, Semantic Scholar, Web of Science Core Collection” / А.В. Лутай, Е.Э. Любушко; Российский фонд фундаментальных исследований. – Дата публикации: 21.02.2022., который был процитирован в нескольких VK-сообществах. Однако их близкое расположение в укладке графа указывает на то, что по отдельности эти поисковые системы в библиотечных сообществах не упоминались. Мы также обнаружили метки, связанные с другими открытыми поисковыми системами T4 (BASE), T8 (DBLP), T3 (метка Asian Search Engines включает термины aminer, naver, j-stage), но это лишь единичные появления в массиве 360 тысяч публикаций.

В таблице 1 ниже приведены 5 VK-сообществ вузовских библиотек, которые упоминали наибольшее количество терминов из СПИСКА Х.

В публикациях на стенах федеральных научных библиотек (СПЕЦ) общими терминами были те же самые Open Science, Open Access и Удаленный доступ (Иллюстрация 7), без которых сеть упоминаний превращается в небольшую группу разрозненных упоминаний. Удивляет отсутствие среди терминов идентификаторов ORCID и ROR, чья роль в открытой инфраструктуре мировой науки стремительно растёт.

Иллюстрация 7

Иллюстрация 7

В таблице 2 приведены 5 VK-сообществ федеральных научных библиотек (СПЕЦ), которые упоминали наибольшее количество терминов из СПИСКА Х.

А вот в публикациях на стенах региональных научных библиотек (РЕГН) идентификаторы ORCID и ROR упоминались – по одному разу каждый (Иллюстрация 8).

Иллюстрация 8

Иллюстрация 8

В таблице 3 приведены 5 VK-сообществ региональных научных библиотек (РЕГН), которые упоминали наибольшее количество терминов из СПИСКА Х.

В публикациях VK-сообществ федеральных и публичных библиотек, у которых в названии отсутствует слово “научная” (ББОП) термины из СПИСКА Х встречались совсем в небольшом количестве, но центральное место по-прежнему занимают Open Science, Open Access и Удал.доступ, а также АНРИ и IFLA (Иллюстрация 9).

Иллюстрация 9

Иллюстрация 9

В таблице 4 приведены 5 VK-сообществ из группы ББОП, которые упоминали наибольшее количество терминов из СПИСКА Х.

Так о чем всё же пишут в библиотечных сообществах?

Для того чтобы ответить на этот вопрос мы расширили СПИСОК Х до 141 метки, которые были объединены в 9 кластеров (тематически близких групп).

Для удобства читателей перечни терминов приведены ниже в упрощенном виде – поиск проводился с использованием регулярных выражений и учетом различных вариантов написаний.

Часть организаций (из списка исследуемых нами групп) получали доступ к вышеперечисленным ресурсам в рамках проекта централизованной подписки, что могло обусловить упоминание терминов в публикациях VK-сообществ этих библиотек. Другие организации также могли иметь опыт работы с ресурсами (в рамках самостоятельно организованного доступа) или упоминать их в связи с материалами, имеющими открытую лицензию.

Разметив массив этими терминами, мы смогли оценить частоту упоминаний меток из каждого кластера в группах библиотечных VK-сообществ (Иллюстрация 10).

Иллюстрация 10

Иллюстрация 10

Основные наблюдения:


Цитирование в VK-сообществах

На стене VK-сообщества можно размещать публикации других сообществ (такие публикации далее мы будем называть цитированиями). В рамках исследования было выделено 29371 цитирований, что позволило проанализировать существующую структуру влияний библиотечных сообществ друг на друга.

На стенах исследуемых VK-сообществ за Период были процитированы публикации из более чем 8000 сообществ. На иллюстрации 11 показано соотношение процитированных публикаций по типам VK-сообществ. Доля цитирований публикаций из VK-сообществ, не включенных в исследуемый перечень (обозначены как ДРУГ), составили 96% от общего количества процитированных публикаций.

Иллюстрация 11

Иллюстрация 11

Большая часть процитированных сообществ за указанный период цитировались лишь 1-2 раза. Для дальнейшего анализа были отобраны (а) цитирования сообществ, не включенных в перечень, но процитированных не менее чем 5-ью сообществами из перечня и (б) взаимные цитирования библиотечных сообществ из перечня.

На иллюстрации 12 представлена визуализации сети цитирований между сообществ – кругами представлены сообщества, цвет круга передает подгруппу, связи между кругами указывают на факты цитирований в указанный период. Связи между сообществами представлены простыми линиями без указания, кто кого цитировал. Размер круга для сообщества Х пропорционален количеству уникальных сообществ из исследуемого перечня библиотечных VK-сообществ, которые процитировали публикации сообщества Х (то есть размер отражает степень влияния сообщества Х на библиотечные сообщества из перечня). Такое представление позволяет избежать использования стрелок для указания ориентации цитирования, но может создавать ошибочное восприятие места сообщества в структуре цитирований в тех случаях, когда маленькая по размерам вершина имеет больше связей, чем более крупная (Иллюстрация 12).

Иллюстрация 12

Иллюстрация 12

На иллюстрации 13 показаны сообщества из перечня и процитированные ими сообщества, в том числе и такие, которые не входят в перечень (обозначены как ДРУГ).

Иллюстрация 13

Иллюстрация 13

Внимательный читатель может обратить внимание на то, что на периферии сети видны лишь библиотечные группы (все цвета, кроме желтого). Это связано с тем, что мы исключили из сети огромное количество не-библиотечных сообществ, процитированных менее чем 5 сообществами из исследуемого перечня – такая фильтрация убрала с периферии тысячи маленьких желтых точек.

В таблице 5 приведен рейтинг VK-сообществ, не входящих в исследуемый перечень, но цитировавшихся за исследуемый период не менее чем 5 сообществами из перечня. Сообщества отсортированы по убыванию числа процитировавших VK-сообществ из перечня, из списка исключены несколько сообществ, прекративших существование (в выгруженных из Вконтакте данных у таких сообществ вместо названия было указано “DELETED”).

В рейтинге соседствуют сообщества 3-х федеральных министерств (Минобрнауки, Минкульт, Минпросвет) и Управления делами Президента РФ, онлайн-библиотек НЭБ и Киберленинка, проектов МАРС и Арзамас, компаний Современная библиотека, Лань, Юрайт, IPR MEDIA, ИНФРА-М, Эксмо, ЛитРес, а также профессиональные сообщества, названия которых варьируют от “Уютная библиотека” и “Свет в окне библиотеки” до “Циничный библиотекарь” и “Злой библиотекарь”.

Но является ли единственное цитирование свидетельством влияния одного сообщества на другое? Очевидно, что нет! На иллюстрации 14 показаны только такие связи между сообществами, в которых за исследуемый период наблюдалось минимум 5 цитирований.

Иллюстрация 14

Иллюстрация 14

Несмотря на то, что в общем объеме процитированных публикаций доля библиотечных сообществ из перечня составляет лишь 4%, взаимные цитирования библиотечных сообществ представляют для нас очевидный интерес (Иллюстрация 15).

Иллюстрация 15

Иллюстрация 15

В таблице 6 приведен рейтинг цитирования библиотечных VK-сообществ другими библиотечными VK-сообществами из исследуемого переченя (всего – 367) в период с 1 января 2020 г. по 31 июля 2022 г. Показаны сообщества, которые были процитированы не менее чем 5 сообществами из перечня.

С точки зрения частоты цитирования другими сообществами библиотек наиболее влиятельным оказалось сообщество Российской государственной библиотеки – публикации РГБ в указанный период цитировали в 59 библиотечных сообществах. На втором месте – сообщество Президентской библиотеки, публикации из которого процитировали в 41 сообществе. Напомним, что учитывались только публикации из официальных (основных) VK-сообществ РГБ и Президентской библиотеки, хотя у этих (и многих других библиотек) существуют также VK-сообщества для некоторых подразделений и филиалов.

На третьем месте сообщество “Национальная подписка”, поддерживаемое РФФИ – публикации из этого сообщества были процитированы в 29 сообществах библиотек.

Отметим присутствие в первой двадцатке 5 сообществ региональных научных библиотек из Москвы, Санкт-Петербурга, Иваново, Кемерово и Красноярска.


Упоминания и цитирование в VK-сообществах СНО и СНК

Итак, в предыдущих разделах мы проанализировали метки, использовали терминологический анализ для разметки публикаций и построили рейтинг влиятельности сообществ на основе цитирования. Перечисленные методы анализа немало рассказывают о деятельности библиотек, но не отвечают на очень важный вопрос: а каково реальное влияние библиотек на их аудиторию?

Сложно оценить влияние библиотеки на зрелых ученых – по мере накопления читательского и авторского опыта исследователи всё реже сталкиваются с ситуациями, требующими участия специалистов библиотечного дела. Другое дело – молодые ученые, особенно “очень молодые ученые”, чье погружение в науку начинается в студенческих научных кружках (СНК) и обществах (СНО). Для последней группы пользователей библиотека университета может предложить многое – и знания о научных изданиях, и помощь в поисковых исследований, и доступ к информационным ресурсам.

Мы предположили, что в качестве свидетельства признания важности библиотеки можно рассматривать:

Упоминание в разделе “Ссылки”

Для подсчета частоты упоминаний VK-сообществ и веб-сайтов библиотек в разделах “Ссылки” VK-сообществ СНК и СНО мы собрали 11901 ссылку (из 1953 сообществ, в которых присутствовал такой раздел), среди которых 8829 – на другие сообщества в ВКонтакте.

Упоминания библиотек в разделах “Ссылки” определяли по (а) идентификатору VK-сообщества и (б) URL-адресу библиотеки, а также вручную, если в тексте ссылки присутствовали слова “Библиотека” или “Library”, но сам URL-адрес не удовлетворял условиям (а) или (б).

В таблице 7 ниже показаны все (!) найденные упоминания – в 40 СНО/СНК сообществах (из 2965) найдены упоминания 42 VK-сообществ научных библиотек (из 367).

Наибольшее количество упоминаний (4) в VK-сообществах СНК/СНО получила группа Российской государственной библиотеки. По 2 упоминания получили:

Цитирования за период 01.05.2022-31.07.2022 г.

Для анализа цитирования публикаций из библиотечных VK-сообществ в VK-сообществах СНО и СНК мы выгрузили 12204 публикации за период с 01.05.2022 г. по 31.07.2022 г. (3 месяца).

В таблице 8 показано количество цитирований публикаций из библиотечных VK-сообществ на стенах VK-сообществ СНО и СНК.

Таким образом, на текущий момент status quo выглядит так:

Порядок приведенных цифр свидетельствует о довольно ограниченном влиянии библиотечных VK-сообществ на коммуникацию молодых ученых в VK-сообществах СНО/СНК.

Полученный результат следует воспринимать, помня о следующем:


Финальные ремарки

Данное исследование иллюстрирует лишь часть возможностей, которые предоставляет социальная сеть ВКонтакте. Авторы выражают надежду, что использованные подходы и сделанные наблюдения заинтересуют широкий круг читателей, в том числе и администраторов VK-сообществ.


Благодарности

Авторы выражают признательность разработчикам открытого ПО R v4.1.2, RStudio и программных пакетов:

Компании ООО «В Контакте» (191024, Санкт-Петербург, ул. Херсонская, д. 12-14, литер А, помещение 1-Н, ОГРН 1079847035179, ИНН 7842349892) за профессионально сделанный и доступный интерфейс API, позволяющий выполнять подобные исследования.


© ФГБУ "Российский фонд фундаментальных исследований", текст, дизайн, иллюстрации, 2022.

РФФИ не несет ответственности за любые последствия, связанные с использованием приведенной выше информации.

Для обратной связи: написать письмо.

Информация для цитирования:

Лутай А.В. Анализ публикаций и цитирования официальных сообществ библиотек в социальной сети ВКонтакте (01.2020-07.2022)./ А.В. Лутай, Е.Э. Любушко; Российский фонд фундаментальных исследований. – Текст : электронный // РФФИ : [сайт]. – URL: https://podpiska.rfbr.ru/materials/2022_VK_RFBR_report/. – Дата публикации: 10.08.2022.