Издатели отозвали более 120 фальшивых научных публикаций
Крупные научные издательства Springer и IEEE отозвали более 120 опубликованных материалов, которые оказались сгенерированными компьютером и не имели никакой смысловой нагрузки. Об ошибке сообщил французский исследователь, специалист в области информатики, Кирил Лаббе (Cyril Labbé) из университета Жозефа Фурье в Гренобле.
С 2012 года Лаббе каталогизировал генерируемые компьютером документы, которые попали в более чем 30 опубликованных материалов научных конференций в периоде между 2008 и 2013 годами. Шестнадцать из них появились в публикациях немецкого Springer и более сотни вышли в журналах нью-йоркского Института инженеров по электротехнике и электронике (IEEE). Лаббе проинформировал оба издательства, после чего материалы были отозваны.
Среди этих работ была, к примеру, статья с результатами Международной конференции по качеству, надёжности, риску, техническому обслуживанию и технике безопасности, состоявшейся в городе Чэнду в Китае. Документ был отозван с пометкой "за качество и содержание". Несмотря на отсутствие смысла в статье, авторами были перечислены реальные исследователи.
Лаббе разработал способ автоматического обнаружения рукописи, состоящей из кусков программы под названием SciGen, который случайным образом сочетает в себе строки слов, чтобы произвести поддельные научные документы. Генератор был изобретён в 2005 году исследователями из Массачусетского технологического института (MIT), чтобы доказать, что даже бессмысленные документы будут приняты на конференции, а также "для развлечения".
Похожий алгоритм, представленный на сайте arXiv vs. snarXiv, способен сгенерировать случайные названия для научных статьей в сатирической манере. Оба ресурса являются бесплатными для пользования, однако непонятно, кем и для каких целей они применяются.
Большинство конференций с поддельными научными статьями проходило в Китае, и многие авторы мнимых статей были китайского происхождения. Лаббе отправил письма по электронной почте авторам, издателям и председателям конференций, однако не получил объяснения происходящему: большинство попросту отрицало свою причастность к фальсификациям.
"Я и не знал о масштабах проблемы, но подозревал, что она когда-то возникнет. Мы действительно периодически получаем электронные письма от добропорядочных граждан, которые информируют нас о том, где всплывают сгенерированные программой статьи", — сообщает член команды разработчиков SciGen Джереми Стриблинг (Jeremy Stribling) из MIT.
Глава британского управления по коммуникациям издательства Springer Рут Френсис (Ruth Francis) отметила, что наиболее странный аспект произошедшего — это тот факт, что большинство конференций, куда попали фальсифицированные статьи, были рецензируемые. В самом деле, как можно было написать рецензию на полный нонсенс?
Чтобы устранить эту проблему в дальнейшем Лаббе создал сайт, где каждый может проверить ту или иную научную статью на предмет подлинности и наличия в ней языковых конструкций программы SciGen. О создании этого ресурса в 2012 году Лаббе написал статью, которая была опубликована в журнале Scientometrics.
Принцип работы проверочного сайта основан на уже существующем "антиплагиате". Лаббе утверждает, что компьютерную статью довольно просто обнаружить, если, конечно же, проверить. Исследователь добавил, что чаще всего фальсифицированные публикации появляются в журналах, на которые требуется подписка, а не в журналах общественного доступа, где за публикацию платит автор, а не читатель.