“抄袭终结者”

   有道是”道高一尺、魔高一丈”。日前发现了一款名为”抄袭终结者”的文本对比软件,可以将现有文本与网上其他全文文献进行比对,显示与分析文本内容的相似度(拟似抄袭情况)。该软件在技术上实现了对抄袭者的威慑,当有助于在数字化环境下遏制肆无忌惮抄袭的恶习。使用方法如下:

1、输入或导入需要比对的文本
2、设定文本发表(或提交)的日期
3、设置比对范围:期刊数据库、图书全文库(需要有相应数据库的访问权限,并设置本地访问路径),网上免费可检图书、开放存取的网上期刊或全部网络。
4、自动上网搜索比对
5、文本标记:发表日期早于本文的以突出显示(底色)表示,发表日期后于本文的以字体颜色表示,期刊、图书和其他网络分别采用不同颜色,在侧栏提供相关文本的信息及链接地址。
6、人工调整:无法确定日期先后的,需人工查核确定
7、统计输出:
(1)拟似抄袭
引用文本字数:与引用文献文字相同的字数
引用文本比率:与引用文献文字相同部分占全文的百分比
(2)引文规范
实际引用文献一览表及引用字数
参考文献标示率:引用文献标为参考文献者,占上述”实际引用文献”的百分率
(3)拟似被抄袭
引用来源一览表及被引字数

    该软件功能强大

 

  • 预设供比对的常用数据库,如中国期刊网、万方全文数据库、方正Apabi、中国预印本服务系统奇迹文库
  • 可以自定义方式,增设供比对的数据库(需具备全文检索功能)
  • 支持多种文本格式(txt、doc、pdf、caj、vip、html等)
  • 采用模糊匹配认定相同文字
  • 有批量比对功能,可一次导入大量文本进行比对

    可以预料,该软件有着广泛的应用前景

  • 教师:检查学生论文(尤其可评为”优”的论文)
  • 编辑:审查作者投稿
  • 管理者:查核成果(如评职称、课题结题)
  • 评审人:课题成果、学位论文…
  • 作者:维护版权、了解作品引用情况

    “抄袭终结者”文本比对软件目前为beta版,今后还将提供在线版。

 

不可小觑的句点

    做西编,有一件无聊之极而又落伍之至的事情,就是要记住每个字段最后是不是要加一个句点”.”。具有讽刺意义的是,事情虽小,却是判断西编功底的一块试金石,故编目者不可轻视。
    只是USMARC/MARC 21的规定几乎可以说没有什么道理――有此想法大概也是功底不深的表现。常用的字段自然记得,不常用的,就要翻详版MARC格式。
    为此头疼的人肯定不在少数,所以Vianne Tang Sha专门整理了”Ending Punctuation for Bibliographic Data“,按字段顺序列出MARC书目记录格式中对字段结束处有无句点的规定,并举实例,方便大家随时在网上查。
    网页起首处,有对MARC手册中用语的说明:

    凡有”以句点结束”或”以句点结束,除非有另外一个标点符号”的说明,则以句点结束,即使有圆括号、尖括号和方括号(除非特别指出了这些符号)。

    换言之,上述”另外一个标点符号”不包括”括号”――真是奥妙得很。其实看最常见的504字段结尾处的”点”时有时无,就知道这个说明不是没有意义的了。
    看看Sha整理的内容,明白如果要根据MARC格式说明,列出一个二栏的表格――一栏为”有结束句点”字段、一栏为”无结束句点”字段――还是要伤些脑筋的。

 

 

数字化:抄袭的双刃剑

    这世界诱惑太多,令人轻易就突破了道德底线。又在报上读到两条有关抄袭的消息:

    《中华读书报》2005年3月23日第19版”致歉声明”:”《中国城市批判》一书作者海默,坦承在该书中既未经许可也没有注明作者和出处,擅自抄用了易中天先生《读城记》一书核心内容、精华片断和其他表述共4600余字……”
    《文汇读书周报》2005年3月25日第7版陈福康”网上查到剽窃贼”:”点名揭发”2003年第3期《山东图书馆季刊》发表的《井中奇书――〈心史〉》,”全文五千多字,全部都是原封不动地抄自拙著《井中奇书考》”。不过,文末倒是将原书注为唯一的参考文献。

    记得去年Google宣布数字化五大图书馆馆藏,引起各方论争,也曾涉及抄袭问题:有人认为数字化后方便了抄袭,有人认为数字化后方便了抓抄袭。从”网上查到剽窃贼”来看,显然支持后者。但数字化方便抄袭也是显而易见的,至少不需要手工输入或扫描、识别,只要简单地CtrL+C加Ctrl+V就可以了。并且抄起来简单,抓起来就不那么容易,发现抄袭大多具有很大的偶然性。这也是抄袭之风日盛的原因之一吧?

 

    固然也有原作者基于传播知识与理念、同情抄袭者改善自身际遇的愿望等等考量,如启功不在意别人假冒其名出售书法作品一般,并不特别在意他人抄袭自己。但对抄袭者而言,终究是伴随终身的污点――即使没有原作者追究,说不定什么时候会有局外人揭发,最后或许还有自己的良心不安。如果因为受不了抄袭便利的诱惑而尝禁果,最终贻害的还是自己。
    如果能”以其人之道还治其人之身”,在数字化环境下,用技术手段阻止诱惑、遏制肆无忌惮抄袭的恶习,可谓善莫大焉!