《中文图书标识数据》(征求意见稿)观感

    耄耋少年博客新开,一连发表了“标识性编目”系列博文,使我对此问题有了一定的了解。规范出版行业需要提供的书目信息,不管从哪个方面来说都是很有必要的,即使这样做的目的是让图书馆的大部分编目员失业。

    正好有幸看到了中华人民共和国新闻出版行业标准《中文图书标识数据》(征求意见稿),觉得特别困惑的就是其主体“4  标识数据”采用CNMARC名称(字段、子字段)与DC元数据表达各著录项。该标准长达56页,说其繁复程度不亚于编目手册,或许也算不得夸张。而“附录3.  中文图书标识数据应用实例”,看上去就是一条常见的CNMARC记录,一点未体现出或者说让人感受到耄耋少年在其博文中所说的标识性编目的优点。总体而言,可以说有见到编目手册的“亲切感”。
   
    如果要对这个行业标准提一些观感,那么就是以下四点:

1、国际出版界电子形式产品信息的标准是ONIX,美国国会图书馆在编目中也使用ONIX数据,我国的相应标准是否应当考虑与其兼容?

2、本标准同时采用MARC与DC,不会意味着出版者必须同时提交两种格式的数据吧?应当是只需一种格式,另一种格式经过转换即可。或许可以认为本标准同时提供两种格式转换的标准(附录1和附录2分别为CNMARC到DC和DC到CNMARC的对应表)。

3、元数据之间的转换不可避免。无论是图书馆现在所用MARC还是未来用某种元数据(不排除DC),只要向出版行业或图书馆提供格式转换软件,数据即具有通用性。不必拘泥于某一元数据格式。

4、标准如果要有长期的指导性,更不应将其局限在某一种元数据格式中。标准只要确定需要哪些项目(如同ISBD的八大项若干小项),至于用什么方式表现这些项目,是用2709格式文本、EXCEL表格、XML格式文本或是其他什么形式,肯定会随技术的发展而改变。

参见耄耋少年的相关博文:
出版界书目工作有大的进展(http://blog.sina.com.cn/u/4bd4c87b010006mw)
“2005年发布了《图书流通信息交换规则》 和CIP相比,明确使用CNMARC格式为信息交换格式”
“自动编目软件已开发成功  自动编目是图书馆界做不了的”
“从源头进行书目数据制作可实现更大范围的信息资源共享  真正做到一家编目,大家使用”

中文图书标识数据(征求意见稿)系列(http://blog.sina.com.cn/u/4bd4c87b010006my)
不知道为什么发布的是7-14,内容为“附录1.  中文图书标识数据使用CNMARC字段、子字段一览表”,而不发布正文部分。寻些CNMARC字段、子字段估计把很多人都弄晕了。

关于《中文图书标识数据》标准 2007-01-12(http://blog.sina.com.cn/u/4bd4c87b010006nj)
“这是出版信息化建设的重要举措。主要为实现在图书出版过程中自动编目规定一个数据内容。这样,在图书付印前,就可以产生符合书目记录要求的数据。此事已酝酿好几年,标准推行后,其中基本部分将以二维码形式印在书上,完整内容将在图书付印前在网上发布。以满足出版社、书商、图书馆与读者对书目信息的需求。”“因为是在电子文本上进行标识,而不是另行描述,所以称之为标识性编目。”

关于ECIP与自动编目(http://blog.sina.com.cn/u/4bd4c87b010006p5)
新制定的《图书流通信息交换规则》及正在制定的《中文图书标识数据》等中均采用CNMARC。

标识性编目概念的提出(http://blog.sina.com.cn/u/4bd4c87b010006qh)
“自动编目处理的是图书付印前的电子文本,对其具有的属性数据进行标识。在制定相关标准时,可要求一种新出版的图书必须具有那些属性数据,使图书制作者有所遵循,在属性数据项目的设置上按规范要求处理。”
“标识性编目不可能代替描述性编目,两者将长期共存。一是正式出版的图书方可先行标识,而文献收藏机构总有部分非正式出版的图书。二是对过去出版的图书,还只能进行描述性编目。”

标识性编目的特点(http://blog.sina.com.cn/u/4bd4c87b010006r8)
“4.真正做到一家编目,大家使用。由于出版单位在图书发行前即提供了标准化的书目数据,发行商与图书馆可不用另行编目了。”

努力做好标识性编目的事情(http://blog.sina.com.cn/u/4bd4c87b010006s7)
“文献编目是社会性事业,出版、发行、图书馆、情报所等都是图书目录的编制者,必须改变“图书馆目录”的狭隘观念。”
“数字图书馆需要解决自动编目的问题,但图书馆界做不了。不能因为图书馆界做不了就不加以研究。”
“加强元数据研究,主要是突破繁琐哲学,在新的条件下,探索可满足检索要求的元数据设置。”[理论与实践怕总是有距离的]

书目记录的856字段:我们还需要吗?

    Do we need field 856 any more?

    由于万维网的发展,OPAC进化到了WebPAC,点击链接成为联机目录的重要功能,856字段在此背景下应运而生。通过856字段,我们可以直接连到文献的电子版,也可以连到文献的相关信息如目次、介绍等等。856字段可称MARC与时俱进的重要标志。
    不过,856字段也有致命弱点:网址需要不断地维护。互联网上的信息动态性太强,可能链接到的信息已经不存在,或者信息的网址发生变化。提供856字段的目的是为了向用户提供更多的相关信息,如果听任失效链接的存在,将大大影响用户体验。而当书目库中积聚了太多856字段后,如何维护是很令人头疼的问题。
    我们的图书馆集成系统每月都会发出一个有问题链接的报告,数量往往达4位数之多。其中有的可能是因网络连接不畅的误报,有的则可能是永久性的失效。我曾经尝试处理,最终还是放弃了。

    上个月到复旦大学图书馆访问,询问他们在文章中曾提到的把数字化文献的链接放在856字段的问题。原来他们现在已经不再做了,代之以在OPAC显示中嵌入链接,用程序实现。
    虽然由于一些考虑,他们只对部分数字资源做了链接,自己数字化的资源部分并没有做,但仍使我联想到856字段的未来。看那些Geek手下的OPAC,如AADL的目录,根据书目信息,链接到那么多的相关资源,靠的并非ILS提供的856字段链接,很多都是采用最时髦的混搭(mashup)。另外,如SFX之类的链接解析器,也能够在书目记录之外,提供相关链接。
    程序当然不能提供所有链接。但现在,资源库遵循OpenURL标准,或提供可推测的对象URL地址成为越来越通用的做法,提供Web服务的也越来越多。这样,如果资源库网址变化,只要简单地对程序作个小修改或改变一下设置,就可以即时更新链接,而无需逐个(或批量)更新856字段。
   
    美国国会图书馆(LC)有一个书目记录强化计划,前些年在很多书目记录中都链接了目次信息,但今年改变做法,代之以将扫描识别后的目次直接放在书目记录中。856字段又少了一个用武之地。
    不知道这是不是856字段衰败的一个征兆?

 

令人困惑的“与本版有关的责任说明”

    前阵子发现一个名为“馆员日志”(http://my.donews.com/gafa)的编目员博客,很细致地记录在日常编目中遇到的各种问题、处理方法、相关知识等。做编目的去看看,应该会有多方面的收获。

    我以前也记录过一些遇到的西文MARC实例。这些日子为准备CALIS西文图书编目业务培训,又翻出来看。这些东西闲放在电脑中,以后换机器恐怕就丢了,挑一个有点意思的写在此地。

    MARC中比较令人困惑的就是“与本版有关的责任说明”。什么情况下责任者只与本版有关?比如《中国书史简编》,刘国钧著(高等教育出版社,1958),郑如斯订补(书目文献出版社,1982),如果书目文献出版社的说明是修订版,那么把郑如斯当成“与本版有关的责任说明”是没有问题的。但有时情况就不是那么清楚了。

    下面是取自LC的同书不同版本记录实例:最新版著录于245,之前各版均著录于250;在同样为三个责任者的情况下,主要款目有时为责任者,有时为题名:

第10版245$c,以责任者为主要款目:
100 1# $aPost, James E.
245 10 $aBusiness and society :$bcorporate strategy, public policy, ethics /$cJames E. Post, Anne T. Lawrence, James Weber.
250 ## $a10th ed.
260 ## $aBoston :$bMcGraw-Hill/Irwin,$cc2002.

第9版250$b三个责任者,以题名为主要款目
245 00 $aBusiness and society :$bcorporate strategy, public policy, ethics.
250 ## $a9th ed. /$bJames E. Post, Anne T. Lawrence, James Weber.
260 ## $aBoston, MA :$bIrwin/McGraw-Hill,$cc1999.

第8版250$b三个以上责任者,以题名为主要款目
245 00 $aBusiness and society :$bcorporate strategy, public policy, ethics.
250 ## $a8th ed. /$bJames E. Post … [et al.]
260 ## $aNew York :$bMcGraw-Hill,$cc1996.

第6-7版250$b三个责任者,以第一责任者为主要款目
100 1# $aFrederick, William Crittenden,$d1925-
245 10 $aBusiness and society :$bcorporate strategy, public policy, ethics.
250 ## $a7th ed. /$bWilliam C. Frederick, James E. Post, Keith Davis.
260 ## $aNew York :$bMcGraw-Hill,$cc1992.

100 1# $aFrederick, William Crittenden,$d1925-
245 10 $aBusiness and society :$bcorporate strategy, public policy, ethics.
250 ## $a6th ed. /$bWilliam C. Frederick, Keith Davis, James E. Post.
260 ## $aNew York :$bMcGraw-Hill,$cc1988.

    由上例,是不是可以得出结论,新记录更倾向于把责任说明放在245呢?这里有另一个实例,最新记录反而把从第一版开始未变的责任者放到了250:

Human geography : culture, society, and space / H.J. de Blij
1977. 245$cHarm J. de Blij
1982. 2nd ed. 245$cHarm J. de Blij
1986. 3rd ed. 245$cHarm J. de Blij, Peter O. Muller.
1993. 4th ed. 245$cH.J. de Blij.
1996. 5th ed. 245$cH.J. de Blij.
1999. 6th ed. 245$cH.J. de Blij, Alexander B. Murphy.
2003. 7th ed. 250$bH.J. de Blij, Alexander B. Murphy.

    关于上述问题,曾请教过高人。他给我找出了AACR2的规定:
1.2C1  Transcribe a statement of responsibility relating to one or more editions, but not to all editions, of a given work following the edition statement if there is one.
(not all, and if there is one, following the edition statement). That depends on how the cataloger is reading the information on t.p.
1.2C2  如果对责任说明是否适用于所有版本,或者,只适用于某些版本有疑问,或者,如果没有版本说明,则将这种说明著录于责任说明项中。

    如果作一总结,可以说版式(the information on t.p.)是编目员作出判断的重要依据。我没有看到上面两例中所有图书的题名页,无法作出自己的判断。不过如果我做的话,我更倾向于尽可能与前一版的著录方式保持一致。