近年来,公共数据库挖掘研究持续受到学界关注,而NHANES(美国国家健康与营养调查)作为一个具有重要影响力的公共数据库,近日却引发了风波。
据Science报道,PLOS和Frontiers两大出版商已开始自动拒收绝大多数基于公共健康数据集的论文。
激增的低质论文倒逼期刊直拒数据库文章
此前,Science在其线上新闻专栏Science Insider 报道了一项令人震惊的研究发现:近3年来,利用NHANES等公开数据库发表的低质量论文数量激增,其中超过 92% 的论文由中国研究人员贡献。这一现象被认为与“论文工厂”和人工智能(AI)技术的滥用密切相关。
Science和Nature相继揭露,论文工厂正滥用UK Biobank、FAERS、GBD、FinnGen等公共健康数据集,批量生成低质量甚至无科学意义的“论文”。为遏制此类问题,Frontiers率先要求编辑自动拒绝未进行外部验证的公共健康数据集论文。自2025年5月新政实施以来,Frontiers已拒收1382项基于NHANES数据集的研究。
随后,PLOS也宣布“更新评估使用公开健康与社会科学数据库研究的标准”——无额外验证工作的这些数据集论文将被编辑自动拒绝。PLOS ONE主编艾米丽·切内特(Emily Chenette)表示,在新政策实施的第一个月,此类论文的拒绝率从40%上升到94%。
与此同时,部分期刊采取了更为严格的措施,如Expert Opinion on Drug Policy已全面拒收基于FAERS的研究,除非为编辑邀稿。
而Scientific Reports则采取了相对温和的策略——内部提醒编辑注意NHANES数据存在的问题,并提供具体的拒稿建议。
NHANES公共数据库简介
NHANES(美国国家健康与营养检查调查)是由美国疾控中心(CDC)主导的一项重大调查项目。它通过综合收集访谈问卷、体格检查和实验室检测数据,全方位评估美国公民的健康与营养状况,它包含人口统计学、人体测量、血液及生化指标、尿液检测、生活方式、饮食、环境污染物等多方面数据。其数据因其权威性、综合性和公开免费的特点,被广泛应用于探索环境、营养、行为与各类疾病之间的复杂关系。
NHANES发文影响因子
2025年基于NHANES数据库发表的论文影响因子主要集中在3-5分之间。
NHANES发文量
2025年1月至今,NHANES数据库挖掘论文发表总量已超3400篇,平均每月新增近380篇,相当于每日产出超过12.5篇。近年来,NHANES数据库挖掘发文量呈上升趋势。
NHANES发文期刊
2025年发文量最多的期刊为Frontiers in Nutrition,其次是Scientific Reports。
NHANES数据库的开放性和丰富性本应是科学研究的宝贵资源,然而,低质论文的泛滥与“论文工厂”的滥用行为,正在侵蚀其科学价值与公信力。PLOS与Frontiers等期刊的集体拒收行动,不仅是对学术乱象的及时纠偏,也向学界传递了一个明确信号:科学研究需要深度、严谨与创新,而非对数据的简单堆砌与重复挖掘。未来,公共数据库的研究若想持续发挥价值,必须回归科学本质,强化数据验证与问题导向,在质量与数量之间找到平衡。唯有如此,公开数据才能成为推动人类认知边界的利器,而非学术功利化的牺牲品。







19123189289
dissertation@delpvip.com
渝公网安备50019002504948号 