科技期刊识别伪作者的方法

发布者:师钰铭发布时间:2015-11-11浏览次数:573

科技期刊识别伪作者的方法

(南方医科大学南方医院《护理学报》编辑部)

1  什么叫伪作者?

“伪”指虚假,与“真”相对[1],伪作者指虚假的论文作者,即论文真正的写作者并不是署名作者。

2  识别伪作者有何意义?

目前,科技期刊学术论文抄袭、剽窃、弄虚作假等学术不端[2]现象非常普遍。同时,学术不端行为中伪作者的身份与行为较隐蔽,不易识别与判断。为了净化学术氛围,杜绝弄虚作假行为[3],科技期刊需要采取多种手段识别“伪作者”,以确保科技期刊学术论文的科学性。

3  识别“伪作者”有哪些方法?

3.1  利用辅助工具识别伪作者

1CrossCheck反剽窃文献检测系统识别法 CrossCheck是一个国际性反剽窃文献检测系统。该系统因实现了多语种的文献检测功能而在国际上广泛应用。其操作方法简单,只要将被测论文传至检测系统,与其储备数据资源库或互联网开放共享资源进行对比检测,系统就会迅速生成一个相似度报告,显示被测论文与其他内容匹配的相似百分比,并以不同的颜色标出各相似的文本内容[4]。编辑可据此判断论文是否涉及抄袭,从而识别伪作者。该系统的弊端是只能对语言文字进行比对,还无法对储备数据库以外的内容,“高级”抄袭以及公式、图像、表格等内容进行直观有效的比对。

(2)利用学术不端文献检测系统识别法学术不端文献检测系统主要有3种:CNKI学术不端文献检测系统、万方论文相似性检测系统和武汉大学自主开发的ROST反剽窃系统。编辑只需将目标检测论文上传到上述检测系统,系统就可以快速提供被测文献与其他文献的雷同比例,其比对结果包括被测论文雷同的字数与字段长度,雷同文献的作者及来源,发表时间等。编辑可依据系统生成的检测报告来判断抄袭、伪造、剽窃、不当署名等学术不端行为[5]。前2种检测系统目前在学术界应用比较普遍,ROST反剽窃系统已将研究重点转向内容挖掘,较少正式运用。上述3种检测系统的弊端是无法识别同义词替换、句子语序调整等语义抄袭行为。

3)利用专业软件进行识别法

ATurnitin剽窃检测[6]识别法。Turnitin剽窃检测是一款学术工具类软件系统,它通过大部分主流浏览器接入互联网,将被测论文与Turnitin背后海量的全球数据库和网页内容作比对,迅速得出一个相似度比例和涵盖大量相关信息的原创性检测结果。科技期刊编辑可根据这些Turnitin精确定位出的论文中非原创的内容,对论文整体的原创性作出一个客观判断,据此识别伪作者。

B:文本相似性百度检测法。该检测软件是一种可以帮助用户检测论文是否为原创的论文相似性检测工具,用户只要在输入区输入目标检测论文,然后设置好随机检测字数,设置好每次检测间隔之后,系统就会自动在百度上搜索相关的语句、词条,如果有相似的内容会很明显地显示出来[7]。通过这个程序,可以很方便地了解到一篇论文是否为抄袭,或者抄袭程度如何,从而识别伪作者。

(4)基于数字指纹的文献相似度检测识别法

为了应对自然语言抄袭,基于汉语词频的文本数字指纹的文献相似度检测识别法[8]应运而生。该方法是通过对具有参考性的语料库进行词频和字频统计形成一个 hash词表,然后基于最大熵原理为任意长度的文本生成一个基于词频特征的文本数字指纹,对于任意两篇文献可以通过计算对应的两个数字指纹的 Hamming距离来得到一个相似度的估计,从而识别伪作者。该方法的不足也是对语义级别的抄袭较难识别。

(5)利用语义角色标注技术对学术文献检测识别法

利用语义角色标注技术对学术文献检测的方法,可以识别同义词替换、句式调整、语言结构调整等语义级别的抄袭行为。其方法是以句子为最小单位进行文献的语义相似度检测;其操作步骤为:提取文献中所有词语的上位词,每篇文献形成句子————语义角色——上位词四部图,通过四部图确定两篇文献的待对比句子[9],进而得出两篇文献的语义相似度,识别伪作者。这种方法由于受语义角色标注工具和技术的限制,还未能得到广泛使用。

3.2  科技期刊编辑自主识别伪作者

1)从期刊网站注册的作者信息中识别伪作者

大部分科技期刊都建立了自己的网站,实现网络在线投稿。一般来讲,在线投稿时作者必须要注册用户名,填写作者的真实个人信息;编辑只要在审稿过程中提高警惕,认真比对网站注册的作者信息与论文的署名作者信息是否吻合[10],就可以识别伪作者。

2)从作者工作单位与文章内容吻合度来识别伪作者

大部分学术论文是实践工作的总结,是研究人员将理论和专业知识在实际工作中的运用与升华。因此,科技期刊编辑在审稿过程中密切关注作者的实践经历,以保证文章内容的真实性与实用性;判断作者的实践经历很重要的信息来源是作者的工作单位[10]。在审稿过程中,编辑运用自己的专业知识和编辑经验,可以打电话与作者沟通,质问有关论文素材内容与写作方面的问题,了解作者的实际工作经历和工作范畴等,经过进一步的交流,编辑可以从作者工作单位与文章内容吻合度来识别伪作者。

3)从电话沟通过程中识别伪作者

  

部分科技期刊的作者群由于工作性质较为特殊,作者身份以男性或女性为主。如,目前护理工作者绝大多数为女性,对于个人信息显示为女性,而编辑在审稿过程中与作者电话沟通时,发现实际通话人是男性者,编辑可以要求作者对文章内容进行概括陈述[10],进而核实其作者身份的真实性,以识别伪作者;另外,还有一些利益集团、“枪手公司”代替作者打电话来咨询论文事宜,也可通过这种电话交流方法判断通话人是否为伪作者。

4)将每次修改稿的作者署名和排序与原稿进行比对来识别伪作者

一篇论文从投稿到发表,基本上都要经历1次甚至于多次修改。有些作者出于某种原因,在修稿过程中增加、减少或变换作者,或更改作者排序,若作者不主动作出说明,编辑很容易忽略这一环节的审核。在当今以在线电子稿件为主的审稿模式下,尤其是对多次修改的稿件,编辑更加应该重视对作者屡次修改稿署名和排序与原稿进行比对,以识别伪作者。

5)利用和通讯作者联系进行识别

科技期刊编辑在论文的审理与编辑过程中应与通讯作者进行联系和沟通,以核实录用的论文署名是否真正体现了各作者的实际贡献;通讯作者应对文章进行把关,并屡行监督的责任和义务,同时向编辑部出具所有作者亲笔签名的论文专用使用权授权书,以避免有些署名作者在未知情同意的情况下刊发论文,而被动地成为伪作者。

  

参考文献

[1]中国社会科学院语言研究所词典编辑室.现代汉语词典[M].北京:商务印书馆,3,2002(增补本):1311

[2]田美娥.科技期刊的学术不端行为及其预防[J].今传媒,2009,(12:70-71

[3]江 霞,方玉桂,陈伶俐,.医学科技期刊应用《科技期刊学术不端文献检测系统》判断抄袭时应慎重对待的几种情况[J].中国科技期刊研究,2010,21(4):471-472

[4]林汉枫,贾晓燕,张月红,.重视学术伦理是期刊编辑义不容辞的责任——《浙江大学学报》(英文版)初探CrossCheck的工作模式和规范标准[J].中国科技期刊研究,20ll22(3):328-333.

[5]谭华,崔洁.学术不端文献检测系统的使用建议[J].编辑学报,2010222):153-155

[6]不详.Turnitin剽窃检测系统[EB/OL].

[7]不详.文本相似性百度检测V1.22 官方免费版[EB/OL].(2015-08-07)

[8]白如江,王晓笛,王效岳.基于数字指纹的文献相似度检测研究[J].图书情报工作,20135715):88-95

[9] 王晓笛,祝娜,白如江,等.基于语义角色标注的文献相似度检测研究[J].图书情报工作,20145812):130-135

[10].科技期刊识别伪作者的方法——以《护理学报》实践为例[J].编辑学报,201325(2):151-152