banner

Новости

Feb 18, 2024

Открытая система автоматизации для обнаружения хищнических журналов

Научные отчеты, том 13, Номер статьи: 2976 (2023) Цитировать эту статью

11 тысяч доступов

3 цитаты

57 Альтметрика

Подробности о метриках

Авторская поправка к этой статье опубликована 8 мая 2023 г.

Эта статья обновлена

Растущее число онлайн-журналов с открытым доступом способствует академическому обмену, но преобладание журналов-хищников подрывает процесс научной отчетности. Сбор данных, извлечение признаков и прогнозирование моделей — это обычные шаги в инструментах, предназначенных для различения законных и хищнических научных журналов и веб-сайтов издателей. Авторы включают их в предложенную ими систему хищнической проверки академических журналов (AJPC), основанную на методах машинного обучения. В процессе сбора данных AJPC извлекается информация из 833 черных списков и 1213 белых списков с веб-сайтов, которая используется для идентификации слов и фраз, которые могут указывать на присутствие журналов-хищников. Извлечение признаков используется для идентификации слов и терминов, которые помогают обнаружить хищнические веб-сайты, а на этапе прогнозирования системы используются восемь алгоритмов классификации, чтобы различать потенциально хищнические и законные журналы. Мы обнаружили, что повышение эффективности классификации модели «мешок слов» и алгоритма TF-IDF с помощью оценок различий (показатель различий в частоте конкретных слов между журналами) может помочь в выявлении слов-хищников журналов. Результаты тестов производительности показывают, что наша система работает так же или даже лучше, чем те, которые в настоящее время используются для выявления подозрительных издателей и публикаций. Открытая система предоставляет только справочные результаты, а не абсолютные мнения, и принимает запросы и отзывы пользователей для обновления системы и оптимизации производительности.

Журналы-хищники считаются серьезной угрозой достоверности и легитимности основных научных исследований и отчетности1,2. Хищнические журналы и материалы конференций, определяемые как вводящие в заблуждение или предназначенные только для письменной публикации публикации3,4, удовлетворяют растущий спрос среди ученых на публикацию своих исследований5,6,7,8. Они рекламируют себя как сторонники быстрого процесса рецензирования рукописей, но часто забывают упомянуть, что не придерживаются стандартных процедур рецензирования. Некоторые журналы-хищники известны тем, что используют ложную информацию, чтобы заманить исследователей к отправке рукописей, а затем потребовать непомерную плату за обработку статей (APC) перед публикацией1,9,10. По состоянию на 2021 год база данных Predatory Reports Cabells показывает, что существовало около 15 000 активных журналов-хищников, авторы которых коллективно платили сотни тысяч долларов за публикацию своих статей11.

Когда неточные или плохо оформленные результаты исследований публикуются в хищнических журналах, они могут повлиять на последующие исследования и достоверность информации, распространяемой среди широкой публики1. В некоторых случаях эти и другие ложные результаты исследований публикуются на веб-сайтах или в средствах массовой информации, таких как Facebook, Twitter и Line, или сообщаются местными теле- и радиостанциями12. Во многих случаях люди, которые читают или слышат эти истории, не получают достаточной информации для проверки первоисточников, что в конечном итоге создает ситуацию, когда потребители новостей не могут отличить три типа науки: законную, мусорную и псевдо13. Простой пример можно привести из Тайваня, где исследовательская группа заявила, что нашла данные, указывающие на то, что ежедневное употребление плодов ананаса является достаточной альтернативой медикаментозному лечению пятен под глазами, известных как помутнения в стекловидном теле14. Когда в 2019 году была опубликована оригинальная статья, все основные новостные каналы Тайваня сообщили о ее выводах, которые были репостены на нескольких сайтах социальных сетей. Однако исследователи, подробно изучившие исследование, обнаружили множество проблем, таких как полное отсутствие демографических данных участников, отсутствие контрольной группы, неправильные статистические методы, а также сочетание преувеличений и основных грамматических ошибок во всем письменном отчете. Во втором примере из Македонского журнала медицинской науки группа исследователей заявила, что «в центре Земли может существовать структура, похожая на черную дыру». Тот же автор этого отчета написал статью, в которой утверждает, что коронавирусы вызваны излучением сети 5G15. Эксперты, которые повторно изучали эти исследования, предположили, что авторы намеренно представили нелепые рукописи в хищнический журнал или что программа искусственного интеллекта использовалась для вставки критических терминов и фраз в статью, чтобы она выглядела как законное исследование.

ДЕЛИТЬСЯ