本报采访人员邹王亚赛
2019年,翟天临论文造假事件让高校重视论文的重复率 。时至今日,他仍然无法在自己的微博下绕开这个话题 。
"进行幸运抽奖,并帮助支付支票费用."
网友Epochigo_ 5月24日留下的这条评论,获得了2.5万多赞 。
毕竟,对于准毕业生来说,查重不仅是学习的要求,也是生活开销的威胁 。
目前大多数高校的官方查重平台是中国知网 。矛盾的是,知网并不开放个人检测名额,许多学校也不会提供一到两次的免费查重机会.因此,许多学生在定稿之前,不得不依靠自己的渠道多次检查和修改副本 。
这些非官方渠道,如果是知名老品牌,不一定便宜 。
文章插图
【创业机会的识别方法 创业机会论文】但是,如果在淘宝上盲目找店主,可能要冒一些风险 。
打着“知识网官方”旗号的渠道要么买假货,要么可能是通过非法手段获得的免费额度 。根据《新京报》的报道,有同学发现自己的账户被盗后,自己的免费查重机会被不知名的试卷占据了 。
未知的第三方渠道也可能导致转卖论文的风险 。澎湃号“真数”曾在文章中披露,一位同学怀疑自己的论文被查重网站卖了,被别人买去作为本科论文提交,以至于在学校检查毕业论文质量时发现自己的论文查重率高达90% 。
查重平台结果不一,知网分数偏低
即使避开这些坑,准毕业生也会遇到一个大问题:如下图所示,在为什么每个平台的查重结果都不一样?,翟天临硕士论文六个查重平台的查重结果最大差异可达62个百分点 。
文章插图
所以很多往届毕业生都会留下“论文部比知网严”的印象 。
这个印象可能是对的 。
在知乎,“PaperYY查重软件可靠吗?”在这个问题下,133位网友在中国知网和PaperYY上分享了自己论文的查重结果 。可见知网发现的重复率在大多数情况下确实很低 。
文章插图
但也有例外 。
别忘了写,她室友的论文在PaperYY找到的份数比例是4%,知网找到了60% 。同学对比了两份查重报告后得出结论:知网比PaperYY多了一个“大学生论文联合对比库”,和室友恰好采用了一个学姐论文的结构,内容是抄袭的,所以知网计算的抄袭比例那么高 。
各平台区别:论文对比库和查重方法
网友的结论大概是正确的 。
论文比较库的范围是影响因素之一 。例如,免费版PaperPass的重复率往往偏高 。据学术不端网介绍,这是因为PaperPass主要依托于网络资源库,在网络上的任何一句话都可以找到类似的句子“最简单的就像百度搜索一样,每搜索一句话都会有一系列相关的内容出现” 。
-size:15px;">而知网则会更注重和学术论文的比对 。下图中,以知网包含的对比库类型作为参照,可以看出,会被采纳为官方查重的三家平台,比“Paper系”会更接近知网的配置 。
文章插图
每个平台的查重规则也不一样,但“由于没有官方声明,所有的算法模型都是网传”,坚果云官方号在知乎问题“万方论文查重怎么样 和知网对比”下写道 。
坚果云进一步解释道:知网的查重算法有两个要点,首先,引用的文献得占到段落的5%及以上;满足这个条件后,如果一个句子里出现了连续13个字的重复,那么这句话就会被标红,即判定为抄袭 。万方的判定标准则相对简单,如果一个句子中连续10个字与库中文章重复,这个句子就会标红 。
这条判定规则的区别,基本上是各类查重平台分析的共识 。
此外,知乎论文类大V吴志根在自己的专栏《论文查重降重攻略:学术论文重复问题剖析》还补充了一点 。基于他的观察,知网还采用了“语义模糊算法”,即比起逐字逐句,这套算法更关注句子的中心意思和关键词 。换句话说,同一段文字,如果只是换一套表述方式,那也是会被知网判定为重复的 。
这些额外的查重规则,可能正是知网会显得更“智能”的原因 。准毕业生们只能通过其他平台的反馈,摸索着,一次又一次修正,去不断地预测和逼近知网的结果 。
责任编辑:吕妍
校对:刘威