摘要: 高被引论文具有较高的学术话语权与参考价值,判别其核心影响因素对于学术论文获得持续吸引引文能力,建立并强化高被引竞争优势至关重要。通过文献提取与问卷调查的主客观相结合方法提取、筛选并形成学术论文内外部影响因素集,通过逻辑回归方法探究内外部影响因素对高被引论文的线性和非线性影响,最后运用机器学习多种经典分类算法来检验上述结果的稳健性。研究发现,参考文献质量、参考文献年龄均对形成高被引论文具有显著的正向线性影响,且随着变量值的增大,二次项对线性影响具有较强的叠加效应;期刊质量对形成高被引论文近似线性影响;而作者声誉、使用次数及初始被引量等因素对形成高被引论文具有显著的正向线性影响,随着变量值的增大,二次项逐渐削弱其线性影响,呈现先增大后趋于平缓的半倒U型趋势;机器学习决策树、朴素贝叶斯、随机森林等经典分类算法均对高被引论文具有较好的预测效果,研究结果具有较强的稳健性。
中图分类号: