ONIX方面对BIBFRAME的评论

出版行业的元数据标准ONIX由EDItEUR维护。BIBFRAME模型草案发布后,EDItEUR的首席数据架构师Graham BellBIBFRAME邮件组中发表了评论,涉及到ONIX背后的概念模型<indecs>及其与FRBR模型的异同。翻译并[简评]如下:

[BIBFRAME] Comments on BIBFRAME draft model from EDItEUR (2012-11-29)

对报告概述的BIBFRAME模型草案,我们的第一反应很大程度上是正面的。然而,对于缺乏“单个复本”实体(以及BIBFRAME“实例”实体潜在的令人困惑的命名),我支持对此表示保留的评论。我想澄清一些报告中涉及的对ONIX和< indecs >的误解。
[第一句完全是客套话。本段其实是在质疑BIBFRAME类的设置及其名称。BIBFRAME有4个主要类,对应FRBR“单件”的不是独立的类,而是属于“注释”类;对应FRBR“载体表现”的,是“实例”类]

如同FRBR,<indecs>是一个概念模型。事实上,<indecs>包含两个基本模型:报告中引用的商务模型(“人们做东西、用东西、交易东西”),还有指代“东西”的“制作模型”或称“创作模型”(非常接近对应FRBR,尽管两者是完全独立开发的)。在目前语境下,相关的<indecs>是创作模型,基于3个而非4个概念层──抽象(Abstraction)(大约相当于FRBR内容表达,也明确是一个知识产权项目)、载体表现、单件。“内容表达”及相关的“定位”(Fixation),是抽象和载体表现间关系的方面。没有对应FRBR作品的。对熟悉的图书,“单件”就是单个复本,“载体表现”是一类相同的册(典型的以一个ISBN标识),“抽象”是许多潜在“载体表现”的抽象类,现在可以用一个ISTC(国际标准文本码)标识,可以与其他“抽象”形成多对多关系──这当然不只用于图书。
[<indecs>三层:抽象=内容表达-ISTC、载体表现、单件。对应BIBFRAME的三层是:作品、实例、注释中的馆藏]

在某种程度上,BIBFRAME草案近乎<indecs>。值得注意的是,<indecs>也预示了今天对关联数据的关注:“一项元数据即某人声称两个实体间存在的关系。” [1]

然而,<indecs>包含“单件”实体,而BIBFRAME模型草案没有,似乎是个奇怪的遗漏。我想说,必要时最好能够识别个别复本,能够分开适用于资源的个别复本的BIBFRAME“注释”,与适用于整个BIBFRAME“实例”的“注释”(“实例”组成所有复本的类)。
[注:BIBFRAME把“单件”归入“注释”之下]

如报告所说,图书ONIX(ONIX for Books)是部分基于<indecs>的,本身关注描述“载体表现”,尽管“载体表现”的很多属性无疑继承自“抽象”。图书ONIX最初由美国出版者协会(AAP)构想于1999年,2000年发布1.0版。进一步的联合开发经由EDItDUR实施,与书业研究组(BISG)和书业交流会(BIC)合作,但目前已由EDItDUR管理多年,由代表约20个国家用户组织的国际指导委员会领导,这些国家包括最近的中国、日本和阿拉伯国家。这是个真正的国际贸易标准,并且免费使用。
[ONIX有图书和连续出版物两种格式]

图书ONIX最广泛采用的是2.1版,发布于2003,之后只做过少量更新。最新发布的是3.0,有一个微小更新到3.0.1(增加了两个属性,用于非字母文字如日语汉字的人名或题名的语音排序)[2]。EDItEUR已经宣布2014年底为“日落之日”(sunset date),将减少对2.1的支持,鼓励所有实施者更新到3.0。

BIBFRAME模型草案与<indecs>的紧密校准(alignment),为商业元数据──以ONIX为例──与图书馆元数据之间更大程度的语义互操作提供了极大的希望。目前ONIX和MARC数据间的对照(Crosswalks)过于复杂,而BIBFRAME具有大大简化商业与图书馆数据交换的潜力。更大互操作的益处也可以延伸到音乐,如DDEX──相当于录音贸易中的ONIX──也基于<indecs>。
[或者说,既然BIBFRAME并没有采用FRBR,图书馆界也基于<indecs>算了?]

图书ONIX的关键价值之一是用于ONIX元数据的大量控制词表集(并且很大程度上在不同版本间共享)。EDItEUR将在未来数月内,(用SKOS)为每个术语发布权威的URI,如此这些术语将可被任何人用于发布关于图书或其他图书馆资源的关联数据。
[当年看ONIX,不知道其三层模型,感受最深的就是其词表的开放性,同一个“字段”,接受各种来源的词表,不像MARC格式那么严格规定采用一种。现在,RDA词表的出版还在磨磳中,ONIX词表已经要发布了──未来关联数据环境下,出版业将领先?]

连续出版物ONIX(ONIX for Serials)系列信息──最初由EDItEUR和NISO开发、现称订阅产品ONIX(ONIX for Subscription Products)──与图书ONIX相比,布署得相当有限,主要用于图书馆订阅代理者和主要期刊出版者之间的交流。相关信息标准特别用于如描述保留馆藏。

[1] The <indecs> Framework
[2] ONIX 3.0 Specification, Implementation and best practice guide, and latest controlled vocabularies

《ONIX方面对BIBFRAME的评论》上有5条评论

  1. 感觉这里可能有个观念转变的问题。

    传统观念中的编目,主要是为馆藏藏本的描述和检索服务的,所以馆藏信息应列为主项。

    而未来的编目,服务于作为知识资源的作品本身的描述与检索:一次编目、全球共享,于是各主项都用于描述作品本身各方面的、具有全球共享价值的信息,而仅作为各图书馆自有藏本的、仅对各自读者对象才有用的馆藏信息,只需在“注释”项中列出,就足够了。

    1. 似乎事实并不如此。在以往的编目中,一直以相当于载体表现的手头文件为主,馆藏从来不曾作为重点。
      相反,对于博物馆之类的文化遗产机构,馆藏才是相当重要的。

  2. 啊呀~~我好像把文化遗产机构,翻译成“文化传承机构”了,总觉得什么遗产+机构,这机构里就会闹鬼……

    事实似乎是,以往的编目观念中,本就没有“作品、载体表现、馆藏单件”三者区分的概念,至少到我学着抄写手工目录卡的那个年代,对编目的理解还只是:图书馆为什么要编目?不是因为人世间有这么一部作品,而是因为图书馆买进了这本书,要把这件馆藏与其他馆藏区别开来。所以抄写在目录卡片上的每个项目,都属于记录和描述这件馆藏不同方面的馆藏特征而已。如果记录这套书是《华严经疏》金陵刻经处刻印的线装版,那就能和其他简体横排现代版区分开来,如果某博物馆收藏的是唐代写经手的手抄《华严经疏》残卷,那可能就是该经书现存年代最早的独一无二的手写本而能成为镇馆之宝了……所有这些著录全部都看作就是描述本馆馆藏的特征信息的。

    现在的观念是:首先是世间存在《华严经疏》这样一部作品,然后唐代有手抄本后代有木刻线装本现代有简体横排本,乃至大藏经数据库里有电子本,所有这些都是属于这部作品的不同载体表现形态而不是属于哪家图书馆自家馆藏的特征,任何一家图书馆或博物馆收藏的,只是这众多载体表现中的某一种中的某一件,只有这一件上的个体特征和标识才属于馆藏项,这样的概念分别,只有在以作品为核心的观念中才能建立起来,以往以各自馆藏为中心的观念里恐怕是没有的,至少在我接触到FRBR、RDA、BIBFRAME之前还是想象不到的。

    所以,要推广RDA和BIBFRAME的应用,观念的转变、思维模式的转变应该是第一步,不然怎么看怎么别扭的。

    1. 过去自然没有FRBR的4层实体,就bibframe来看,未来也不见得有这4层。
      但就图书馆自动化系统中书目记录与馆藏记录的区分,就可以知道,过去编目(做书目记录)所依据的“手头文献”,是可以对应于载体表现的——所以我说的是“相当于”。

评论已关闭。