OCLC弃用BiblioGraph.net词表

OCLC当年因等不及schema.org的图书馆扩展而自行发布书目图谱BiblioGraph.net(BGN),自己曾在文章中介绍。2020年初偶而发现BGN网站跳转到了bibliograph.github.io,并标记“词表弃用”。于是去虚拟国际档(VIAF)和Worldcat网站找RDF文件,看到BGN命名空间的说明还在:xmlns:bgn=”http://bibliograph.net/“,但其中并未使用BGN的类和属性。另外,worldcat.org中还在使用“图书馆扩展”中两个属性:

xmlns:library="http://purl.org/library/"
<library:placeOfPublication>
<library:oclcnum>1126314791</library:oclcnum>

今天找到了BGN于2019年5月发布的说明网页,详细说明BGN词表弃用的原委:BiblioGraph.net Vocabulary – Deprecated

BiblioGraph.net(BGN)是Schema.org的扩展,是为更详尽地描述书目资源而开发的。尽管尚未完全协调,但该“外部”扩展已于2015年5月由“托管”扩展bib.schema.org代替。由于Schema.org的覆盖范围随着时间的推移而发展,并且书目数据的其他关联数据词汇表涌现并逐渐建立起来,因此对Bibliograph.net的需求减少。考虑到这一点,自2019年5月起,该词表已被弃用。BiblioGraph.net网站已移至开放的GitHub存储库BibloGraph-Frozen(https://github.com/bibliograph/BibloGraph-Frozen),以保留其状态并托管该网站,仅供参考。 BiblioGraph.net条款和条件保持不变。同样出于参考目的,在BiblioGraph.net词表中定义的相关术语已映射到Wikidata.org中的等效词。可以使用Wikidata查找覆盖范围,并声明为“等效类”(P1709)和“等效属性”(P1628)声明。 Wikidata类和属性并非旨在在Wikidata本身之外使用,但可以用作在其他命名空间中查找等效项的中心。在一定程度上,除了在网络上爬网Schema.org标记外,搜索引擎还使用Wikidata,仍然可以实现搜索引擎优化的一些潜力。

又去schema.org书目扩展(Schema.org Section: bib),与2016年正式发布的书目扩展比对,原11个属性减少为6个。比对减少的5个属性,全部由托管扩展移入了主要词表:

  • duration – The duration of the item (movie, audio recording, event, etc.) in ISO 8601 date format.
  • pageEnd – The page on which the work ends; for example “138” or “xvi”.
  • pageStart – The page on which the work starts; for example “135” or “xiii”.
  • pagination – Any description of pages that is not separated into pageStart and pageEnd; for example, “1-6, 9, 55” or “10-12, 46-49”.
  • translator – Organization or person who adapts a creative work to different languages, regional differences and technical requirements of a target market, or that translates during some event.

这大概是弃用BGN词表中所称“由于Schema.org的覆盖范围随着时间的推移而发展”的一个证明吧。

存档BiblioGraph的GitHub存储库(https://github.com/bibliograph),有唯一关注者Jeffrey Young,应该是BGN项目的操作人吧。以前因为听说他是曾蕾老师的学生,一直以为他很年轻,这次看照片+简历,才知道很沧桑了。

参见:

文章摘录:国外书目RDF词表的进展与趋势(《图书馆杂志》2015年第5期)

2.5 联机计算机图书馆中心(OCLC):
Schema.org扩展OCLC自2011年起实验采用schema.org作为基本词表,向搜索引擎曝光图书馆元数据。2012年OCLC将其全球联合目录WorldCat用schema.org发布为关联数据,对schema.org缺少部分加以扩展,称为schema.org的图书馆扩展。为谋求将“图书馆扩展”融入schema.org,同年OCLC牵头成立W3C的Schema书目扩展小组SchemaBibEx,目标是提交建议给WebSchemas小组,扩展Schema.org词表,强化其描述书目资源的能力。
由于SchemaBibEx小组进展乏力,OCLC在2014年上半年注册了BiblioGraph.net网站(命名空间简称bgn:,以下简称BGN),基于schema.org词表,增加在“图书馆和相关领域中书目和文化遗产资源与收藏的概念、实体和关系”。2014年下半年起,虚拟国际规范档(VIAF)和WorldCat中已开始陆续采用新的BGN命名空间。

2020居家办公时期的BIBFRAME更新论坛

新冠肺炎全球横行,工作仍要继续,于是很多时候变成了居家办公。BIBFRAME开发几乎没有中断,原本在ALA年会期间召开的BIBFRAME更新论坛,如期举办但改为线上会议——BIBFRAME from home于2020-6-24举办,PPT日前已上网。

5个报告,美国国会图书馆(LC)3个,分别介绍进展概况、新的BF编辑器和BF到MARC转换;另外2个介绍梅隆基金资助项目,也是延续先前的LD4P系列和OCLC。

BIBFRAME Update Forum – June 2020(2020-6-24)

一、BIBFRAME from home / Beacher Wiggins,LC采访与书目获取部主任

介绍会议日程,概述BF试验进展(由另2位报告人详述)。

二、Cataloger’s editor / Matt Miller, LC网络开发与MARC标准办公室(NDMSO)

BIBFRAME编辑器(BFE)重构,主要重点放在用户(编目员)界面与体验,NDMSO委托SAMHAENG做UX咨询与设计。

新的编辑器界面设计(截屏)见BF官网:BIBFRAME Implementation, Tools, and Downloads 之Editor interface design

当前编辑器见:BIBFRAME Editor(正常显示需架梯)

五、BIBFRAME to MARC refined / Sally McCallum, LC NDMSO主任

2020-5-1,LC宣布提供新的BIBFRAME 2.0组件,用于将BIBFRAME数据转换为MARC。

特别说明与半年前ALA仲冬会议BIBFRAME更新论坛上Jodi报告中的2个变化(更新):

  • 没有007字段 -> 007字段添加007/00(资料类别)和007/01(特定资料标识)
  • 仅通用008字段 -> 添加特定媒介008数据
参见:
LC发布BIBFRAME到MARC转换(2020-5-6)
2020ALA仲冬会议BIBFRAME更新论坛(2020-2-11)

三、LD4P, LD4P2, LD4P3, and community / Philip Schreur, Stanford University

概述2016-2018年的LD4P和LD4L-Labs,2018-2020年的LD4P2(实施之路),以及最新的2020-2022年LD4P3(闭环 CLOSING THE LOOP)

LD4P3目标:发现;合作编目项目PCC的自维持数据池;扩展Sinopia;扩展质询规范;扩展合伙人培训计划。

参见:LD4系列

四、Shared Entity Management Infrastructure Project update / Chelsea Dalgord, OCLC元数据服务部产品分析师

共享实体管理基础设施项目的进展。基本情况可参见:OCLC获梅隆基金资助开发实体管理基础设施(2020-1-11)

项目计划交付:实体主干:数百万实体、永久URI;生产规模;生产基础设施;通过API访问搜索、读取、创建、更新;基本的用户界面。

对图书馆有什么好处:基于Web的发现结果;丰富的背景、联系材料和馆藏;数据品质;数据的机器可操作性和使用;跨馆藏和资料类型的元数据工作流程的一致性和效率。

OCLC获梅隆基金资助开发实体管理基础设施

OCLC新闻:OCLC awarded Mellon Foundation grant to develop infrastructure to support linked data management initiatives (2020-1-9)

项目称为“Entity Management Infrastructure”,摘要信息如下:

时间:2年(2020.1-2021.12)

费用:Andrew W. Mellon Foundation资助243.6万美元,OCLC提供所需另一半费用

新闻稿摘译:

  • OCLC将使用资助来发布对于作品和人物的权威性和易于访问的实体描述,作为持久性集中式基础结构的一部分。基础结构将在外部词表和规范档中聚合到这些作品和人物的其他表示形式的关联。
  • OCLC成员关系和研究副总裁兼首席策略师Lorcan Dempsey表示:“要使关联数据普遍使用,图书馆需要可靠和持久的标识符以及它们所依赖的关键实体的元数据。该项目开始建立基础架构并推动整个领域的发展。”
  • OCLC将与LD4P社区(由斯坦福大学图书馆牵头、同样由梅隆基金资助的参与“关联数据生产项目”的图书馆)合作,以确保系统与图书馆关联数据环境的发展相匹配。
  • OCLC期望提供多种访问实体基础结构的选项,其中一些选项可免费提供给图书馆社区,而其他选项则可通过订阅获得。OCLC将通过网络发布实体的URI和元数据,并将为图书馆员工提供编辑、充实和添加到这组实体的方法。OCLC还将提供API,以扩展这些实体在图书馆内外的工作流程中的采用和集成。

【个人理解的“实体管理基础设施”概要】

  • “实体”仅包括“作品”和“人物”
  • 实体标识符(URI)
  • 关联(sameAs)现有规范档(猜测如VIAF、WorldCat Identity和WorldCat Work)和外部词表(比如Wikidata、ISNI……)中的实体
  • 聚合实体的元数据描述(作品和个人的各种相关信息)
  • 与LD4P合作开发【参见:LD4相关博文
  • 基础设施访问:编辑(专业用户贡献),API(应用)
  • 基础设施使用模式:免费+订阅