引文分析|如何终结友情互引、抱大腿等引文失范乱象?用科学计量学纠偏

【引文分析|如何终结友情互引、抱大腿等引文失范乱象?用科学计量学纠偏】
近日 , 针对不合理、不规范的引用行为 , 中国科学院道德委员会办公室发布了《关于规范论著引用的通知》 。 该通知的发布对于破解当前引文失范乱象以及破四唯下科学的科技评价具有重要意义 。 笔者从科学计量学的视角 , 回顾引文分析法的起源和应用场景 , 并针对现今的引用行为失范和引文评价改进提出几点拙见 。
美国学者加菲尔德提出 , 引文分析主要是利用参考文献追踪科学进展 , 从而开辟了论文检索的新路径 。 美国学者普赖斯和匈牙利学者布劳温等提出 , 引文分析可以发现同行投票这一论文外部特征 , 进而可以用来评价科技发展现状 。 伴随着大科学时代的来临和科研工作者数量的增长 , 完全依赖于定性评价的科研绩效管理已不切实际 , 而引文分析的易用性和广泛适用性恰恰可以弥补这一缺口 , 因而 , 各类引文评价指标被逐渐用于定量评价并广泛应用 。 已有很多例子证明引用指标有利于辅助筛选出高质量与高认可度的论文 。
引文分析是建立在合理、规范引用基础之上的 , 这样其7个前提才能成立 。 在使用引用数据及指标时 , 应尽量保证这些前提成立 , 或据其作出合理的调整 。 但是 , 基于论文引用的评价指标经常与人才招聘、职业发展、职称晋升、优质学术成就、人才称号等挂钩 , 导致科研人员过于关注引文指标 , 进而出现过度自引、友情互引、抱大腿蹭引用、审稿拉引用、花钱买引用、先外后内博引用等不规范行为的现象 。 比如2019年8月 , 美国《公共科学图书馆—生物学》期刊上发表的一篇文章统计了约10万名科研人员的引用情况 , 发现学术界整体自引率中位数是12.7% 。 这些不规范引用在一定程度上影响了论文引用数据的合理性和客观性 。 因而 , 为了满足引文分析的前提 , 十分有必要对论文引用行为进行规范 。
科学计量学界一直强调分类评价的原则 。 基于引用的科学计量指标主要来自大规模的数据统计 , 重视总体 。 这对宏观层面的国家或机构评价而言能够发挥很好的作用 , 但对微观层面的科研人员个人评价或单篇论文评价而言 , 其易受个体行为的影响 , 应更为重视同行评议 。 定量指标和同行评议都有各自的有限目的和内在瑕疵 , 只有结合使用才能够更好地在科技评价和科研管理中发挥作用 。
针对现有的论文引用失范行为以及论文引用指标滥用现象 , 笔者认为可以从以下方面改进:
其一 , 改进现有指标 , 对不同类型的引用行为进行赋权 。
针对过度自引互惠互引崇引匿引等不规范的论文引用行为 , 可针对性地改进现有的科学计量指标或提出新的指标 。 针对过度自引现象 , 可以计算去除了自引的他引量 。 针对互惠互引现象 , 可通过互引网络识别期刊或科研人员之间互引行为过高的团体 。 另外 , 为了提高引文分析法的合理性和规范性 , 应根据被引文献对施引文献的作用以及论文作者在引用文献时的情感 , 对不同类型、不同动机的引用行为进行赋权 , 这样可以对引用行为作出更合理的评价 。 随着对引文内容分析研究的深入 , 笔者相信未来引文分析法在科技评价中的应用会更为合理、规范 。
其二 , 引用规范指南与违规引用识别技术研发并行 。
针对现有的论文引用不规范现象 , 可从软控制和硬控制两个方面遏制 。 软控制即制定和颁布引用行为规范指南 , 如《关于规范论著引用的通知》 , 以引导科研人员正确认识引用对于科学发展的价值、引用的合规动机和基本规范、不良的引用行为及可能造成的后果 。 硬控制则通过研发识别不规范的引用技术来实现 , 可基于施引内容的上下文特征、施引内容与被引论文间的因果关联度、施引内容较其他耦合论文施引行为的离群性等特征 , 构建深度学习模型 , 研发识别不规范引用的技术 , 并在投稿系统中推广应用 , 在投稿前或同行评议时就对所有参考文献进行扫描并标以可疑引用指数 , 以此对试图使用不合规引用的作者起到威慑和警醒作用 。