BIBFRAME模型公布

来自nalsi的消息(1月30日),BIBFRAME有了自己的网站:http://bibframe.org/,前往一看。
网站目前有几个部分,其中View of the BIBFRAME vocabulary along with supporting formal specifications实际上首次完整发布了BIBFRAME模型。其他包括演示及转换工具,以及书目框架转变行动的重要文件链接。

———-BIBFRAME模型:词汇及形式规范———-
2012年11月模型草案公布时,只是一个框架,没有具体的元数据格式;12月早期实验代码公布,也只能通过转换代码的规则部分,拼出元数据格式。现在可以看到BIBFRAME元数据规范了。

四个核心类(class)创作作品、实例、规范、注释都有用于资源(Resource)及具体类的属性(Property),属性说明包括:取值(Expected value)、说明(Description)[update 2013-3-9: 现称“标签(Label)”]、MARC映射(MARC Mapping)和RDA相关附注(Related RDA Note)──或许还来不及做,RDA部分基本空白。

———-演示区(a demonstration area)———-
呈现测试数据集。目前有7个参与机构提供的8个样本数据集,分别是美国国会图书馆(2个)、不列颠图书馆、德国国家图书馆、乔治·华盛顿大学图书馆、美国国家医学图书馆(NLM)、OCLC和普林斯顿图书馆。
采用Exhibit 3.0发布,类似于分面OPAC,左侧栏有创建者、主题、贡献者、提供者/出版者四个分面限定项。大致浏览了一下,有四个感觉:
(1)部分条目下列有多个作品(Work)。不知道这条目是何含义,因为在BIBFRAME模型中,作品是最高层。
(2)作品下列有包含作品(分析)和相关作品,尤以OCLC数据为多。相关作品并没有指出具体的相关关系。
(3)作品没有都列出实例(instance)──更像是规范数据而非书目数据。
(4)作品有多个实例的比较少见。看到美国国会图书馆有两个实例的,只是ISBN不同(10位和13位),出版信息等相同;德国国家图书馆数据中倒是有一些真正的两个不同实例,但也没有看到不同contributor的。难道其Work对应的是内容表达(对应ISTC)?
记得OCLC曾有一个统计,有百分之十几书目属于作品的不同版本,如果以内容表达作为顶层,这个比例更低,汇集资源的价值也会降低──比如无法汇集同一作品的不同译本。当然可以通过定义作品之间的具体关系做关联(而不是笼统的“相关”关系)。

———-BIBFRAME词汇与MARC21对应———-
目前尚无链接,但在模型部分已经有部分MARC21映射.

———-代码与支持服务———-
– 代码,参见:BIBFRAME早期实验代码公布
– 支持服务(工具):评估BIBFRAME模型中MARC书目记录的工具
1、比较服务:针对LC的MARC记录,输入001字段值或LCCN,看MARC/XML记录和BIBFRAME RDF/XML记录
似乎看到了未来LC关联书目数据的URI,如:http://id.loc.gov/resources/bibs/123456
2、转换服务:提交MARC/XML记录(联机网址或直接粘贴文本),由Exhibit转换后以BIBFRAME资源呈现,转换结果可下载

———-背景链接———-
2011年10月31日LC发布《数字时代的书目框架》以来的重要文件
参见:相关博文

———-关注:发布工具Exhibit 3.0———-
Exhibit 3.0是大规模丰富数据交互网页的发布框架,软件有两个独立模块:脚本式(Scripted),用于建立较小的浏览器内展示;舞台式(Staged),用于较大的基于服务器的展示。

参见:
BIBFRAME早期实验代码公布(2012年12月11日)
书目框架模型草案发布(2012年11月26日)
书目框架模型相关信息及讨论(2012年11月26日)
ONIX方面对BIBFRAME的评论(2012年12月3日)

《BIBFRAME模型公布》上有26条评论

  1. 属性说明包括标签(Lable),没有说明(Description)?

    1. 想来当时不致于把Lable看成Description。大概是做了修改。或许是为了与DC一致?上文要更新下。

  2. 美国国会图书馆记录两个实例的情况。看到有个例子(LCCN=2008049764),有两个instance,两个ISBN除了分别是10位和13位外,还有一点,原MARC记录13位的ISBN后有pbk.,10位的ISBN后没有这个,表示精装本。联想到有关bibframe的图示里,有book分别引出两个“hasInstance”,分别标以Hardcover和Paperback,是否本意是将精装、纸皮列为两种Instance?但是另外看的几条记录似乎确实只是ISBN是10位、13位的区别。

    1. 区分平装、精装,也不能说没道理。
      从大多数只是10位、13位不同看,只能猜测是把ISBN当作一种标识号,一个标识号对一个实例。
      当然也不排除先印的书上是10位,后来加印的是13位——只是这个不拿到书,单凭书目记录的话是无法知道的,自然也不能在MARC记录转换为BIBFRAME记录时做出判断。

  3. 精灵老师 你好。我想做bibframe模型和cnmarc映射方面的研究,您觉得有研究价值吗,可以给我一些建议吗?

    1. 做对照有助于对其有较深入的了解,但研究价值就不好说了。
      我也还没有在上面花什么时间,提不出什么建议。感觉还是往如何利用方面走比较好。

      1. marc记录转换成bibframe,会有部分信息的丢失,是转换工具的问题,还是bibframe模型不完善,不能完全容纳marc元素,您觉得我可以在这个方向上研究吗?

        1. 这个思路可以。不过不宜轻易下不完善的结论,或者说,不能站在MARC角度看问题。

          1. 恩 谢谢精灵老师。我在数据库里搜国内外关于bibframe的文章,但是没有发现多少,老师,您有推荐的相关文献吗。

          2. 过不了多久就会多起来了吧。
            如之前所说,我还没有在这上面花什么时间,只是订了LC的BIBFRAME的邮件组,看看其官网。

  4. 问个外行问题:MARC、BIBFRAME、RDA三者什么关系?如果是RDA要取代MARC,又搞出来个BIBFRAME干什么?

  5. 果然是我这个外行自己搞混了~(@^_^@)~

    这么说来,BIBFRAME应该努力服务于RDA顺利取代AACR2才对,怎么现在看着还有点搞不灵清?

  6. 没有汉译文本,国内不要说研究的,可能连了解的都不会多起来多少……胡老师,您就不要再说没在这上面花什么时间了,现在开始就在这上面多花点时间,先搞个汉译本出来吧(*^__^*)

  7. 嘿嘿~~了解和研究,不同于跟随和照搬吧……您已经了解中国佛教史了,佛教产生于印度,却发展于中国。印度佛教从八世纪因印度教的兴起而走向衰弱,至十三世纪即在印度本土彻底灭绝。而传入中国的佛教,经东汉、魏晋南北朝的译介、传播和研究,至隋朝第一个汉传佛教宗派天台宗诞生,标志着汉传佛教从了解和研究,走上了独立的发展和创造,然后隋唐五代至宋,汉传佛教已经发展成为具有民族文化生命力和世界文化影响力的一支深厚力量,这不是单纯的跟随和照搬所能做到的。

    玄奘大师所处的隋唐交替之际,面对汉传佛教界各派思潮风起云涌,众说纷纭,才发愿去印度取经,还指望能通过重新翻译印度佛教经典,来统一汉传佛教思想。结果到了印度,发现那边的佛教已是外强中干,那烂陀寺一众高僧大德,面对其他教派的思想挑战,却都躲了起来,还要靠他这位东土来的留学生挺身而出力撑局面,显示出当时汉传佛教的思想水平,已经超越了江河日下的印度佛教。无论在当时还是到现在,印度人最佩服的中国人,还是玄奘。这同样不是简单的跟随和照搬所能做到的。

    玄奘回国后严守印度护法-戒贤一系唯识学的一家师说,创立的法相唯识宗,三传即绝,并没有能如他所愿地统一汉传佛教思想,显示了唐朝的汉传佛教界早已不可能再简单地跟随和照搬印度传来的所谓权威思想了,但玄奘的翻译和介绍还是让汉传佛教得以了解和研究印度佛教思想的最高成就,为汉传佛教哲学思辨成就最高的宗派华严宗的诞生提供了重要的思想资源。直到近代的佛教复兴运动中,支那内学院重兴玄奘一系的法相唯识学,同样为传统佛教的现代化转型,提供了博大深邃的理性化资源。

    所以,胡老师,您就当一回编目界的玄奘型大师,挺身而出力撑局面吧O(∩_∩)O哈哈~

  8. 讽刺我呢吧?您不肯翻,那就我来翻翻看吧,先翻个目录和导言,看看行不行吧(^o^)

    用于数据网的书目框架:关联数据模型和支持服务

    美国国会图书馆
    华盛顿特区
    2012年11月21日

    本文及模型由国会图书馆和来自Zepheira的小组合作开发,成员包括:埃里克•米勒,尤奇•奥格布吉,维多利亚•缪勒和凯西•麦克杜格儿。

    目录

    导论

    作为关联数据模型的书目框架
    BIBFRAME模型
    BIBFRAME创作作品
    BIBFRAME实例
    BIBFRAME规范
    注释BIBFRAME模型
    BIBFRAME词汇表
    序列化BIBFRAME
    支持工具

    关联数据和LOD背景
    关联开放数据(LOD)101
    扩展设想
    实际使用中的关联、受控数据

    相关图书馆的倡导
    不列颠图书馆
    德国国家图书馆
    OCLC/WorldCat
    Schema.org
    资源描述与检索(RDA)
    书目资源功能需求(FRBR)
    ONIX

    结论与未来展望

    相关术语表

    导论

      美国国会图书馆于2011年5月正式推出其书目框架倡议,该倡议的目的,是从长远来重新设想,为图书馆实现一种以网络为中心、使相互关联更普遍的新的书目环境。作为该倡议的一部分,很大程度上是希望提示图书馆界必须重新开发其书目数据模型,接受新的编目规范。为了实现这一目标,该文件提出一个高层次的模型供图书馆界评估和讨论,但是,以一个更广阔的背景和远远超出图书馆界的视野来研究这一文件,也很重要。

      图书馆有使用技术以实现规模经济的悠久而丰富的历史。国会图书馆在20世纪60年代领导制定并实施机读编目格式(通常被称为MARC),实现编目信息以电子形式的共享。一位编目员的努力即可以为大家所共享,而不需要成千上万的编目员重复描述相同的资源。随着时间的推移,格式作为交换的方式大致维持不变而数据处理继续发展,因此,图书馆界得以从相当长一段时期的数据模型/格式的稳定性中受益。这是一个很少有相似事例的成功故事。它利用新的、尚未经证实的技术,以标准的制定为突破,引导广泛而持久的图书馆之间的合作,并且,最重要的是,降低了成本。现在,是时候让我们再来一次了。

      新提出的模型简称BIBFRAME,是“书目框架”的缩写。新的模型不仅仅是图书馆界现用模型/格式MARC的替换,它是未来将出现在网络和我们所生活的网络世界中的书目描述的基础。它被设计为融入和参与到更广泛的信息社会中去,同时也服务于其使用群体——图书馆以及类似的存储机构非常具体的需求。它将在如下几个方面实现这些目标:
      1.明确区分概念性内容和它的物理表现(如:作品和实例)
      2.致力于明确识别信息实体(如:规范)
      3.设法揭示各实体之间的关系

      在一个大规模的网络世界中,呈现图书馆数据的方式必须能够做到:不仅能区分概念性作品(题名和作者)与作品载体表现(页数,是否有插图)的物理细节,而且能清楚地标识涉及资源的创造(作者,出版者)以及与资源相关的概念(主题)的实体。至少到目前为止,标准的图书馆的描述做法,都侧重于创建独立的可理解的目录记录,整合概念性作品及其物理载体的信息,很大程度上依赖于使用词汇字符串作为标识符,比如一位作者的名字。推荐的BIBFRAME模型,鼓励创建明确的可识别的实体,并使用机器友好的标识符以便让计算机能理解那些实体。

      这是符合现代的、期望数据尤其能与网络相融合的做法。随着网络从一个关联文献的网络发展为一个关联文献以及作为那些文献基础的数据的网络,越来越清楚的是:那些文献中的数据对于帮助使用者在网上查找信息至关重要。这一特有的观念是Schema.org的基础,由谷歌、必应、Yandex和雅虎努力引导,创建一个通用词汇表给网络设计者,用以更好地描述传统网页中包含的信息。当用户使用搜索引擎或社交网络开始他们的信息查找,为了帮助用户找到信息,文化传承机构需要帮助那些引擎和网络指给用户答案,图书馆尤其应提供那些帮助。BIBFRAME模型特意设计来协调编目和各个图书馆创建元数据的努力,并与他们联系。总之,BIBFRAME模型是图书馆界能成为一个更大数据网中一部分的正式切入点。

      当图书馆成为这个更大数据网的一部分时,通过设法使用稳定的标识符以清晰地标记有区别的实体,重点将从捕捉和记录图书馆资源的描述细节,转向识别和建立各种资源之间的更多关系。这包括网络上发现的资源,尤其是那些超越传统图书馆领域范围的资源。这些关系、这些关联驱动网络,将信息空间从很多互不关联的筒仓,转化为很多网点在每个方向上互相关联的网络图。关联,帮助搜索引擎和其他服务提高搜索相关性,最重要的是,帮助用户发现他们正在寻找的信息。关联是现代网络的基础,例如:谷歌的知识图充分利用关联,以用户们以前的搜索内容为基础,向用户们建议他们可能会感兴趣的其他知识项目;亚马逊根据购买模式和书籍题名之间的关联,运算出一份顾客可能会感兴趣的其他书籍的列表。图书馆员们,是识别和捕捉书目关联的专家,BIBFRAME模型为揭示这一专家知识奠定了基础。当我们的用户们搜索相关资源时,书目关联将为网络的丰富作出重大贡献,并能帮助信息搜索者们。

      虽然理解书目框架倡议和所提出的模型是重要的,但在更大范围内,在图书馆界,同样重要的是,将这份文件视为图书馆界继续加强书目建设的一个起点。阅读BIBFRAME模型,我们很清楚还有很多工作要做。重要的是记住,这一模型,和MARC一样,必须能适应任何数量的内容模型及其具体实现,并仍使各图书馆之间的数据交换成为可能。它必须能支持新的元数据规则和内容标准的出现,包括最新的图书馆内容标准——RDA(资源描述&检索)。 BIBFRAME模型因此必须既能扩大也能缩小书目数据交换的规格空间。

      虽然BIBFRAME模型是一个草案,还有待改善,但国会图书馆希望现在就与图书馆界分享,不仅是报告正在取得的进展,而且希望引起对话和建设性的反馈意见。国会图书馆领导着这项倡议,更重要的是引领图书馆界作为一个齐心协力的整体去创造一个书目描述和数据交换的环境,来认识和利用全球数据网络的资源和规模。这需要牢记图书馆的资源和传承的数据来实现。

      对于所推荐的新BIBFRAME模型,国会图书馆期待和欢迎反馈意见。

      美国国会图书馆
      2012年11月19日

  9. 纯属自娱自乐,不敢正式发布,先给您过目一下,以后翻出来的内容多了,可能传到我们图书馆的馆员园地里充作内部参考资料吧,哈哈~~又翻出来一点:

    作为关联数据模型的书目框架

      关联数据界的所有多样化灵感来自于互联网发明者蒂姆·伯纳斯-李的思想。在他的文章“巨大全球图景”(http://dig.csail.mit.edu/breadcrumbs/node/215 )中,他表达了一些易于观察到的思想变化:

      “(在互联网创造之后)人们意识到:‘这不是很多电缆,这是很多有趣的计算机。’,网络被设计为很多计算机能够被看到,而不需要看到很多电缆。万维网(World Wide Web)再一次增强了我们作为用户所拥有的力量,人们意识到‘这不是很多计算机,而是很多有趣的文件。’,现在你们可以浏览周围文件的海洋,而无需担心它们存储在哪台电脑上。现在,人们正进行着另一种智慧的提升,现在人们意识到的是:‘这不是很多文件,而是文件内容所关于的很多重要的事情(things)。’”

      伯纳斯-李指出,这一演变的各个阶段都关乎关联的网络——电脑的网络(虽然我们称之为“network”而不是“web”),文件的网络(大多数人称之为“The Web”),以及最后这种我们想要分享的所有事情(things)的网络。他认为,我们必须把网络的基本原则,更直接地延伸到数据(例如,传统数据库中的内容),我们应该不再羞于关联到非计算机资源,诸如人物、有形的和抽象的事物,地点等等。这一广泛关联的观点被称为“数据网络”并构成了关联数据的基础。

      这份初步草案的目的,是提供一种为未来资源和以MARC21传统编码的书目资产建立模型的模式。这一模式以网络为基础架构,塑造一个普遍的描述框架并实现两个目标:(1)能大大整合现有的书目资源;(2)创建一个朝向细化、重建或开发替代方案的发展路线图。(更多关联数据和关联开放数据的背景知识,在“关联数据和LOD背景知识”一章)

      图书馆界,一直是创建、管理、组织和合作处理以提供与我们的文化所产生的创作作品相关的数据的先锋。MARC21,是在相对专业的市场交换这一数据的图书馆交换格式的最新发展。众多图书馆生成、维护和处理提供大量的高质量的数据,其宝贵价值无论如何都远远超出了传统图书馆的范畴。通过在关联数据模型中反映MARC21格式,我们既扩展这一数据的效用与价值,也扩展图书馆、文化遗产机构等群体的服务的效用和价值。将MARC21格式用于数据网络的建模,重要的是要拆解进而重够包含MARC的信息资产。MARC在支持图书馆界不断变化的需求上有着丰富的历史,这可以体现在3个主要功能上(Delsey, T. (2002) “MARC21书目和控制格式的功能分析”www.loc.gov/marc/frbr/functional-analysis.html ):
      1.记录与作品的知识本质相关的数据
      2.记录与作品的实例(你手上持有的,从电子源网络上检索到的,等等)相关的数据
      3.记录元数据,如控制号,记录处理代码和其他注释。

      通过解构与这些功能相对应的数据元素,我们可以开始实现将“可关联的信息资源”这一概念嵌入这些数据元素集中。然后,这些“MARC资源”可以被重组成一个连贯一致的架构,为一个新的书目框架提供基础,并允许在更高粒度的级别(人物,地点,主题,机构,等等)上联合编目。然后,由于我们利用网络作为信息架构,每当这些MARC资源被执行更新(例如:有人增加关于某位人物的新信息,与某个主题相关的新映射,等等),新发布的事件就能够参考这些资源自动更新系统。此为,这些信息资产现在可以在更高粒度级别上的第更有效地利用,为本地馆藏、特色馆藏和第三方数据提供更丰富的基质,能够很容易地注释并融入协作图书馆内容。

      这个文件为新的书目框架提供一个关联数据模型,并确定了一组补充的问题以帮助其未来的改善。此书目框架(BIBFRAME)关联数据模型被设计为一个供图书馆界讨论和对话的基础,它是未完成的,即便这个模型有效,它也不是“完成的”,因为它能够也必须进行扩展以支持一系列新的应用,并描述我们目前尚无法想象的资产。

      BIBFRAME关联数据模型试图平衡以下几个因素:
      •以适应未来编目领域、全新使用场景和信息来源的灵活性
      •网络作为一个表达和连接分散信息的架构模型
      •图书馆界以外的群体和技术的采纳
      •图书馆界内部的群体和技术的配置
      •以前将书目资料表达为关联数据的努力
      •对机械的任务运用计算机技术的同时,充分包容作为机器背后智慧头脑的主题事项专家(图书馆员)
      •以前在图书馆界、出版界、档案和博物馆界为书目信息建立模型的努力
      •书目信息传输常用方法的各个方面及其稳健而有益的历史经验
      

    1. 看到您发在馆员论坛里的译文了。
      这反应速度也太快了点,那个版块刚加没几分钟,东西就传上去了。

  10. 嘻嘻~~太快,是好,还是不好呢?

    我也觉得神奇呢……馆员园地和论坛,近来一直都登录不上去的,昨天忽然想起,一试竟然就登录进去了,这才发现原来论坛一直就只有党务工作和工会之家两个板块,译文发在哪块都不合适……然后不知怎么就刷新了一下页面,忽然又发现:新增加了一个工作讨论板块!O(∩_∩)O~~

  11. BIBFRAME近期还真发布了不少新东东啊,主页上的列表:

    Recent updates

    BIBFRAME Annotation Model (Updated – 26 August 2013)
    BIBFRAME Use Cases and Requirements (NEW! – 14 August 2013)
    On BIBFRAME Authority – Discussion Paper (Updated – 15 August 2013)
    BIBFRAME Resource Types Discussion Paper (17 June 2013)
    Vocabulary updates (Ongoing)
    MARC21 to BIBFRAME Transformation updates (Ongoing)

    发布了“注释”模型、规范和资源类型的讨论文件,进展不小哇~~胡教授快来关注和述评一下(*^__^*) 嘻嘻……

评论已关闭。