Бесплатно Экспресс-аудит сайта:

13.07.2024

Скрытые цитаты: новый вызов научной этике

Современное научное сообщество сталкивается с новой проблемой – манипуляциями с метаданными, направленными на искусственное повышение числа цитирований. Проблема стала объектом расследования ученых, которые выявили механизм скрытого увеличения цитируемости через так называемые «подставные ссылки».

Цитирование в научных работах следует строгим стандартам: каждая ссылка включает название, имена авторов, год публикации, название журнала или конференции и номера страниц. Такая информация хранится как метаданные, не видимые в тексте статьи, но присваиваются уникальному цифровому идентификатору (DOI). Ссылки в научных публикациях позволяют авторам обосновывать выбор методологии или представлять результаты предыдущих исследований, подчеркивая итеративный и совместный характер науки.

Однако в процессе исследования было обнаружено, что некоторые недобросовестные авторы добавляют дополнительные ссылки, невидимые в тексте, но присутствующие в метаданных статей. В результате число цитирований для некоторых исследователей или журналов резко возрастает, хотя ссылки фактически не цитируются в самих статьях.

Расследование началось с поста на сайте PubPeer, где ученые обсуждают и анализируют публикации. Автор публикации заметил несоответствие: статья в журнале Hindawi, которую он подозревал в мошенничестве из-за неестественных фраз, имела гораздо больше цитирований, чем загрузок, что является крайне необычным.

Авторы статьи отошли от устоявшихся терминов, что смутило ученых. Обычно такое происходит из-за попытки избежать антиплагиата с помощью ПО для перефразирования.

Образец статьи, которая приводится в посте PubPeer

Пост привлек внимание нескольких исследователей. С помощью научных поисковых систем ученые нашли статьи, цитирующие исходную статью. Google Scholar не нашел ни одной ссылки, а Crossref и Dimensions их обнаружили. Разница заключается в том, что Google Scholar в основном полагается на текст статьи для извлечения ссылок, тогда как Crossref и Dimensions используют метаданные, предоставленные издателями.

Для понимания масштабов манипуляций исследователи изучили три научных журнала, издаваемых Technoscience Academy, которые были ответственны за статьи с сомнительными ссылками. Исследование состояло из трех этапов:

  1. Составление списка ссылок, явно присутствующих в HTML или PDF версиях статьи;
  2. Сравнение списков с метаданными, записанными Crossref, и выявление дополнительных ссылок, добавленных в метаданные, но не появляющихся в статьях;
  3. Проверка платформы Dimensions, которая использует Crossref в качестве источника метаданных, и обнаружение дальнейших несоответствий.

В журналах, издаваемых Technoscience Academy, как минимум 9% записанных ссылок оказались подставными. Дополнительные ссылки присутствовали только в метаданных, искажая количество цитирований и давая некоторым авторам несправедливое преимущество. Были также утрачены некоторые легитимные ссылки, не присутствующие в метаданных.

Кроме того, скрытые ссылки принесли большую пользу некоторым исследователям. Например, один ученый, связанный с Technoscience Academy, получил более 3 000 дополнительных незаконных ссылок. Некоторые журналы того же издателя получили выгоду от пары сотен дополнительных скрытых ссылок.

Crossref (слева) предоставляет список из 47 ссылок (показаны от 0 до 9). Ссылки с 6 по 46 являются скрытыми. Dimensions (справа) перечисляет 13 ссылок, ни одна из них не появляется в оригинальной статье.

Важность открытия и пути решения проблемы

Количество цитирований сильно влияет на финансирование исследований, академические продвижения и рейтинги учреждений. Манипуляции с цитированием могут привести к несправедливости на основе ложных данных. Более того, открытие ставит под вопрос целостность систем измерения научного воздействия, что уже давно вызывает беспокойство среди исследователей.

Чтобы бороться с такой практикой, исследователи предлагают несколько мер:

  • Строгая проверка метаданных издателями и агентствами, такими как Crossref;
  • Независимые аудиты для обеспечения надежности данных;
  • Повышение прозрачности в управлении ссылками и цитатами.

Исследование впервые выявило манипуляции с метаданными и обсуждает их влияние на оценку исследователей. Подчеркивается, что чрезмерное доверие к метрикам для оценки ученых, их работы и влияния может быть в корне ошибочным. Подобное доверие способствует сомнительным исследовательским практикам, включая гипотезирование (выдвижение гипотезы) после того, как результаты уже известны, салями-слайсинг (salami slicing), манипуляции данными и плагиат.

Хотя проблемные метаданные и подставные ссылки были исправлены, возможно, как это часто бывает в научных исправлениях, меры были предприняты слишком поздно.