关于毕业论文查重的几个问题

征文网 2017年4月22日文学快讯评论2,189 阅读12004字

一、论文查重是怎样实现的?

论文查重是用论文抄袭检测软件来进行的。一般这个软件会把你的论文分成一小段小段的。然后把每一小段拿去和对比库里的资料进行对比,如果能找到相同的,基本就能确认这一小段是抄袭的了,所有小段检测完之后,会总结下,把所有抄袭的小段的字数统计出来,然后除以总字数就是抄袭率了。

目前,高校对于硕博士论文,需要通过抄袭检测系统的检测才能算过关。对本科生来说,大部分学校也采取抽查的方式对本科论文进行检测。抄袭过多,一经查出超过30%,后果严重。轻者延期毕业,重者取消学位。辛辛苦苦读个大学,学位报销了多不爽。

但是,查重软件毕竟是人工设置的一种机制,里面内嵌了检测算法,我们只要摸清其中的机理,通过简单的修改,就能成功通过检测。

二、论文查重系统的工作原理是什么?

一般是检索关键词和关键语句的, 对比数据库为:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库。部分书籍不在知网库,检测不到。

上传论文后,系统会自动检测该论文的章节信息,如果有自动生成的目录信息,那么系统会将论文按章节分段检测,否则会自动分段检测。

有部分同学反映说自己在段落中明明引用或者抄袭了其他文献的段落或句子,为什么没有检测出来,这是正常的。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。

一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是连续13个字相似或抄袭都会被红字标注,但是必须满足3里面的前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。

三、本科毕业论文查重标准是什么?如何判定的?

1. 学术不端的各种行为中,文字复制是最为普遍和严重的,论文检测系统查重百分比只是描述检测文献中重合文字所占的比例大小程度,并不是指该文献的抄袭严重程度。只能这么说,百分比越大,重合字数越多,存在抄袭的可能性越大。是否属于抄袭及抄袭的严重程度需由专家审查后决定。有一个句子相似性的算法。并不是句子完全一样才判断为相同。句子有句子级的相似算法,段落有段落级的相似算法,计算一篇文献,一段话是否与其他文献文字相似,是在此基础上综合得出的。

2. 论文查重检测系统不下结论,是不是抄袭最后还有人工审查这一关,所以,如果是您描述的这种情况,专家会有相应判断。我们的系统只是提供各种线索和依据,让人能够快速掌握检测文献的信息。比如像知网论文检测的条件是连续13个字相似或抄袭都会被红字标注,但是必须满足3里面的前提条件,即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。

四、论文查重的原则是什么?

1. 安全原则。现在大部分学校最终都用知网检测,但是知网并不对个人用户开放,而且,如果提前预检,会在系统里存有记录。通过淘宝网,代查知网,又有可能将论文泄露。一旦被论文贩子上传到网上,查重就100%,论文就费了。所以安全不得不考虑。

2. 实用原则。很多人都认为,学校用啥检测,我们就提前用啥检测,殊不知,良好的系统检测只是为了要最后那个重复率的数字,而其查重报告对于修改来说,根本不方便。你都不知道是那几个词引起的重复。

3. 修改原则。论文修改,无非是同义换词和同义换句。因为,将一句话中造成重复的词汇换掉,就有可能拯救了整句话。这是最经济的修改方法。

五、论文查重,参考文献引用的内容还算吗?

论文查重要看你索引的字数以及你们学校的规定。索引的字数不要太多,最好不要大段大段的引用,而且也得看你们学校的规定,有的学校查重的时候只看抄袭率,有时你引用自己的也算抄袭,的确很无奈。有的学校查重的时候会看你引文的出处,如果有出处,那么就不算了。所以最关键的还是要看学校会“怎么办”。当然,你最后查重用的是知网而不是万方,所以万方就算查重是0%也没有什么权威性,因为二者的差距还是比较大的,所以我建议你用知网CNKI去查重,这样比较保险。更重要的是,知网查重时很少会根据你的参考文献而去排除你抄袭的引文,也就是说,你所引用的文字,在知网上还是算重复率的,所以你要么少引用,要么把引用的加以修改。

六、论文查重是多少字相同计算一次?

12个字连在一起就算重复。不过这东西繁琐的,有时候因为专业术语什么的,12个字连在一起是常事,最后还要靠专家人工搞定。如果你连字比较多,想办法把话换个表达方式就可以了。同时还有几个字里就要有一两个字不一样,挺长的一个句子就一两个字不一样的话照样能查出。

继续阅读

公众号:pcren_cn(长按复制)

匿名

发表评论

匿名网友