毕业论文查重

本科论文的查重原理

本科论文的查重原理

每年六月份本科毕业、硕士毕业、博士毕业生们最害怕的事是什么?我想莫过于毕业论文没通过吧!

为了打击学术上抄袭剽窃的不正之风各类不同的查重软件也是不停地推旧陈新,这也算是广大毕业学子面前横亘的一座大山吧!

但是查重软件千千万你知道它的工做原理么?

现今高校的本科论文查重、硕士论文查重、博士论文查重指定用的便是知网了,所以就以知网为例子谈谈查重软件的查重原理吧。

首先知网检测识别的是文字,而图片、mathtype软件编辑的公式等是不能识别的。第二写论文的时候导师给的论文格式一定要规范使用,

比如自动生成目录,知网是以章为单位来给论文划分的,其他的课题名称、中英文摘要、导论、各个章节的标题、引用文献这些又是划分成一个部分来检测的。

核心就是知网使用的镜像对比库也就是它的数据库和进行比对的算法原理了,这里有一个名词叫“模糊计算”举个例子,

数据库里有一篇论文的一章软件使用模糊计算提取出其中的关键字词做为样本,而在对另一篇文章进行查重的时候发现在这篇文章的某个章节提取出来的关键字和词几乎和样本库里的关键字词一样,

软件就会将那些高频重复的地方标红――涉嫌抄袭。

但是软件其实也并不会完全把你抄袭的地方全部出来这里还有一个词叫“阈值”一般参照数学分析里来设定就是5%,这是什么意思呢?

比如你有个章节有1000字 ,其中出现小于等于50字篇幅重复,软件也会让你通过。

如果你对这些原理都了如指掌了,即便是硕士论文查重是不是也不害怕了呢?希望这些小知识可以帮助这些莘莘学子们顺利毕业。

分享到:更多 ()

抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址