开放编目规则:OCR草案发布

2021开年,《开放编目规则》(OCR)发布2020草案(Google文档)。这个草案可以说是一个简要说明,包括:作者、愿景、范围、原则、元素清单和未来发展方向。实质性内容体现在原则和元素清单二部分,“原则”约等于IFLA《国际编目原则声明》(ICP)的13条,仅有极有限的补充修改;“元素清单”则全面体现OCR未来框架:

  • 【范围】元素概述仅适用于非珍稀专著资源。
  • 主要来源:PCC核心/ BIBCO标准记录(BSR)
  • 次要来源:ISBD 2007(无法免费获得2011版);对于实际的编目规则,计划主要依靠ISBD 2007。
  • 模型:BIBFRAME 2.0。仅采用了BIBFRAME的最高级别概念(总共六个:作品、实例、单件、行为者、主题、事件)作为组织元素的方法,以便可以将其用于其他元数据标准(例如Dublin Core)。

元素大纲:

  • I、Instance 实例【12大项(对照ISBD8大项/3-7合并)】
  • 1题名(1正题名、2并列正题名、3其他题名信息、4变异题名、5后续正题名、6与正题名相关的责任说明)
  • 2版本(1版本标识、2与版本相关的责任说明、3版本的命名修订标识)
  • 3生产(主要对非出版单件)(1生产地、2生产日期)
  • 4出版(1出版地、2出版者名称、3出版日期)
  • 5发行(1发行地、2发行者名称、3发行日期)
  • 6制作(如印刷信息)(1制作地、2制作者名称、3制作日期/数字化或印刷日期)
  • 7版权日期
  • 8丛编(1从编正题名、2从编其他题名信息、3与丛编相关的责任说明、4丛编ISSN、5丛编编号、6子丛编正题名、7子丛编ISSN、8子丛编编号)
  • 9发行方式
  • 10实例标识符(ISBN等)
  • 11附件
  • 12附注(1首选引用格式、2题名附注 、3责任说明附注、4用作资源识别基础的期/部分/代附注、5其他类型附注/见IFLA第7部分)
  • II. Carriers 载体【4项】
  • 1媒介类型,2载体类型,3数量,4尺寸
  • III. Item 单件【5项】
  • 1单件标识符,2馆藏地,3保管历史,4采访直接来源,5附注
  • IV. Work 作品【7项】
  • 1首选题名,2形式,3日期,4起源地,5其他区别性特征(如版本),6内容类型(文本、动态图像等),7语言
  • V. Content 内容【6项】
  • 1学位论文信息,2内容概要,3内容语言,4文字,5插图内容(1插图类型、2色彩内容),6附注(1内容清单、2包含:书目/影片目录/唱片目录/索引等、3受众/评分)
  • VI. Access points 检索点
  • 1作品(1创作者、2贡献者、3与作品相关的其他行为者、4相关作品)
  • 2实例(1与实例相关的行为者/如出版者、2相关实例)
  • 3单件(1与单件相关的行为者/如捐赠者、2相关单件)
  • VII. Other elements (covered by separate rules) 其他元素(单独规则)【3项,主题】
  • 1分类,2主题,3体裁/形式
  • 【思考】
  • 1、考虑到ISBD正在修订,用10多年前的ISBD 2007作为主要依靠真的好吗?OCR编制也是需要时间的,为什么不等等直接使用新ISBD?只要加上检索点部分,还不是只适用于普通专著——如果这样,IFLA编目部岂不是会十分高兴?
  • 2、元素清单7个部分,并未如说明所称以6个BIBFRAME概念组织。从其组织看,尽管标出了来自BIBFRAME和ISBD的元素,但原RDA的影子或许更多——其实也没有必要刻意回避。但想想新RDA,还真是让人摸不着头脑。

《PCC最少标点MARC书目记录指南》的弃用ISBD标点规定

与UNIMARC不同,MARC21记录中有大量ISBD标点。在有字段、子字段标识符的情况下,这些标点并无实际意义,却常白白消耗编目员的脑力。比如300字段末尾要不要加句点,要看是不是存在490字段,因为这个句点是表示丛编项的分隔符。最新提出的《PCC最少标点MARC书目记录指南》(以下简称《指南》),给编目机构提供了弃用ISBD标点的选项,有助于减少编目员的无效劳动。

1、背景

PCC即合作编目计划(Program for Cooperative Cataloging),是美国最重要的合作编目组织。我们现在套录到的很多书目记录,都有042$apcc,即表明是PCC认证的记录。早在2011年,PCC即成立“PCC ISBD和MARC任务组”,研究MARC21记录中的ISBD标点问题。2018年初,PCC公开测试在书目记录中停止使用字段末尾句点、停止使用与MARC 21编码相对应的分隔标点。2019年4月PCC把实施范围限定在了描述字段(不包括检索点),并将实施分成2个阶段:第1阶段省略字段末标点(头标第18位=i),2019年4月8日开始实施;第2阶段省略字段末标点和子字段间标点(头标第18位=c)。本《指南》即为第2阶段实施而编制,于2019年9月完成草案,经批准后公布,2020年1月生效(见 New policy regarding limited use of ISBD punctuation in bibliographic records. 2019-10-18.)。

2、实施选择

《指南》正式版已于2020年初在网上发布:PCC Guidelines for Minimally Punctuated MARC Bibliographic Records / Prepared by PCC Standing Committee on Applications ; Approved by PCC Policy Committee, Sept. 2019. Policy effective January 2020.

《指南》规定了省略ISBD标点的规则,同时仍接受保留ISBD标点的做法。具体来说,编目机构有3个选项:

(1)省略字段末标点(头标第18位=i);

(2)省略字段末和中间标点(头标第18位=c,不采用ISBD标点);

(3)继续采用全部ISBD标点(头标第18位=i或a)。

《指南》同时规定,编目人员不应将现有经过认证的PCC记录(即有042$apcc)从完全标点转换为最少标点或反之。

实际上选项(1)自2019年4月起已经实施。《指南》的全面生效即选项(2)的实施,意味着2020年开始,编目员可能会套录到更多少用或不用ISBD标点的记录。编目机构应关注此一变化,确定自己的实施政策

3、最少标点规定

所谓“最少标点”,指尽可能省略由字段、子字段分隔的标点(包括非ISBD标点),《指南》对描述字段和检索点字段有不同规定;另外还有不能省略ISBD标点的情况。因此,《指南》有如下3方面的规定。需要说明的是,自然语言中正常的标点符号(包括缩略符等)不在讨论范围

(1)描述字段:仅应省略RDA记录的:1字段末尾标点,或:2子字段之间位置的标点。应保留:出现在子字段内部且没有相应MARC子字段标签的标点。

例:其他题名信息与并列其他题名
(原来)245 14 $a Les Ballets jazz de Montréal : $b au gré des rencontres depuis 40 ans = encounters in motion 40 years on.
(头标18位=c)245 14 $a Les Ballets jazz de Montréal $b au gré des rencontres depuis 40 ans = encounters in motion 40 years on
说明:省略:$b前冒号,字段末句点;保留:$b内部表示并列其他题名信息的等号。

(2)检索点字段:标点是检索点本身一部分的,不在本指南的范围之内;仅应省略:1字段末尾标点,或:2将检索点与关系说明语分隔开的标点。

《指南》只针对书目记录,未涉及规范记录。书目记录中的规范检索点,都以与规范记录形式一致为准,因而大量保留相应子字段标识的标点,即所谓“不在本指南范围之内”,如:姓名与生卒年间的逗号,会议的届次、日期、地点,以及名称-题名形式中间的句点等。
例:
(原来)700 12 $i Container of (work) $a Lo, Malinda, $d 1840-1897. $t Meet cute
(头标18位=c)700 12 $i Container of (work) $a Lo, Malinda, $d 1840-1897. $t Meet cute
说明:保留:$d前逗号,$t前句点;省略:关系说明语后冒号,字段末尾句点。另:姓和名间的标点不属于讨论范围。 

(3)标点重新定位:头标18位采用c后(不采用ISBD标点),在需要保留标点时,将标点移到子字段内(换言之,由前一子字段末,移到本子字段前),同时空格由标点前移到标点后。

保留标点主要由于MARC21子字段区分度问题,典型情况如245字段$b的多义性,如果省略标点则无法区分$b是其他题名信息、并列题名还是合订题名等。如(1)例,$b为其他题名信息时省略,为其他时则需保留。
例:并列题名
(原来)245 10 $a Histoire de La Digue = $b History of La Digue / $c Julien Dunrup
(头标18位=c)245 10 $a Histoire de La Digue $b = History of La Digue $c Julien Dunrup
说明:并列题名=由$b前移至$b首;省略责任说明/
例:附件
(原来)300  $a 271 pages : $b illustrations ; $c 21 cm + $e 1 atlas (37 pages, 19 leaves : color maps ; 37 cm)(头标18位=i)
(头标18位=c)300  $a 271 pages $b illustrations $c 21 cm $e + 1 atlas (37 pages, 19 leaves : color maps ; 37 cm)
说明:附件标点+由$e前移至$e首;保留:附件说明中括号及其内部的载体说明,按照(1)的规定。
参见:
MARC21准备弃用ISBD标点(2018-3-3)
《PCC最少标点MARC书目记录指南》:弃用ISBD标点(2019-10-20)  

为什么不直接使用ISBD?(附ISBD修订计划)

“开放编目规则”(OCR)启动,提出以ISBD为起点(参见:OCR(开放编目规则)启动中,2019-11-8)。前几天,OCR核心委员会成员 Amber Billey (CaMMS候任主席,她的个人网站上的自我介绍)在讨论组中提出了一个问题:为什么不直接使用ISBD作为内容标准,而要用AACR2和现在的RDA进行大量的解释?Amber 同时给出了ISBD统一版的链接,表明这是个开放获取的标准。

这个问题或者说就是:已经有了ISBD,还要OCR吗——有了描述(著录)部分,我想应该加上检索点部分就可以了吧?问题引起了大概是OCR讨论组有史以来最热烈的回应。【浏览原文需加入OCR讨论组:http://opencatalogingrules.org/(Google Group)】

从回应看,大体可分如下二类:

一类认为ISBD有364页,还是太庞大、太复杂,需要精炼;同时缺少与语言关系很大的检索点规则。加拿大不列颠哥伦比亚大学的Adolfo Tarango并引用AACR2编辑Michael Gorman文章,说明AACR2及其扩展RDA都包含ISBD作为内容标准。

一类以为有个开放的RDA应用配置文件(application profiles,AP)或最佳实践就可以解决问题。当然有人指出有了AP还是要访问全文才能了解条款内容的——想想就知道,如果出版方允许避开订购而享相同利益,它根本就会放弃订购这种模式了。

—— ISBD修订计划(2018-2022) ——

《国际标准书目著录》(ISBD)是国际图联(IFLA)制订的标准,但2011年的统一版并不遵循当时已经完成的《功能需求》FR系列。2017年FR系列完成统一版《IFLA图书馆参考模型》(LRM),2018年ISBD启动4年修订计划,确定将基于IFLA的《国际编目原则声明》(ICP,2016年IFLA标准)和LRM(2017年IFLA标准)。

ISBD Review Group (ISBD RG): Proposed work plan for ISBD revision 2018-2022

按此计划,如果只限于现有元素,ISBD修订将在2020年完成。完成后如果决定涵盖所有LRM元素,则将在2022年完成修订。

IFLA编目部已经放弃自己的编目规则了(参见:IFLA放弃编制国际编目条例的正反意见,2018-1-20)。检索点部分比描述部分难吗?在语义网/关联数据环境下,检索点语言形式上的一致性已不重要,URI才是关注点;检索点类别与数量更不成问题,只要列个清单供选即可……