OCLC永久标识符调查


OCLC正在进行一个在线的“永久标识符调查”:Persistent Identifier Survey。调查语言可选英、法、西、德,调查截止期为2019-9-13。

从调查内容看,OCLC有意提供一个收费的永久标识符服务,希望了解图书馆在资源描述中永久标识符的需求、可承担的年费等。

调查的第一个问题是:贵馆是否用统一资源标识符(URI)增强图书馆的资源描述?

问题涉及图书馆在哪些类型的资源描述中使用永久标识符,包括:档案检索系统、数字档案与特藏资料、数字人文项目、机构库、研究数据管理、MARC编目、文章描述、期刊与其他连续性资源等。
调查给出的永久标识符(Persistent Identifier)的定义是:永久标识符(PI或PID)是对文档、文件、网页或其他对象的永久引用。术语“永久标识符”通常用于可通过因特网访问的数字对象的上下文中。通常,这样的标识符不仅是永久的,而且是可操作的(可将其插入Web浏览器并转移到标识的来源)。

调查中提到的永久标识符包括(永久标识符简介):

ARK (Archival Resource Key)

DOI (Digital Object Identifier)

FAST (Faceted Application of Subject Terminology)

Handles

Identifiers at id.loc.gov

ISNI (International Standard Name Identifier)

LCAF (Library of Congress Authority Files)

MeSH (Medical Subject Headings)

ORCID (Open Researcher and Contributor ID)

PURL (Persistent URL)

VIAF (Virtual International Authority File)

Wikidata

对《对ILS投标者的BIBFRAME期望》的意见

2018-8-22 德国国家图书馆 Lars Svensson 在BIBFRAME邮件组中,针对2018年2月《对ILS投标者的BIBFRAME期望》提出意见,认为应当提出“功能需求”而不是“技术要求”,并参考2013年BIBFRAME用例与需求,从不同方面举例。

原文件参见:2017 EBW:对ILS投标者的BIBFRAME期望(2019-4-3)

—— 对《对ILS投标者的BIBFRAME期望》的意见 ——
[BIBFRAME] Some comments on “BIBFRAME Expectations for ILS Tenders” / Lars Svensson (2018-8-22)

……我认为该文所采取的总体方向存在一些问题。我觉得它主要关注技术而功能要求太少。本文建议过渡,从范式(1)其中编目在MARC记录中直接完成,并且图书馆集成库系统(ILS)使用关系数据库(RDBM)存储编目和任何相关联的数据存储到另一范式(2)其中编目在RDF中完成(使用BIBFRAME数据模型),ILS使用三元组库来存储必要的信息。我想说的是,第一个假设未必是真实的(有相当长的一段ILS其中数据不使用RDBM存储,至少一些图书馆编目不通过创建或编辑MARC记录,但使用其他元数据格式,如果需要可以转换为MARC)。我还要说,对新系统范式的建议过于狭隘,甚至可能通过强制要求使用哪种技术来阻碍创新。例如,有一种称为图数据库的新兴技术,它允许以有趣的方式分析图中的数据,包括找到两个节点之间的最短路径,找到“孤岛”(图或子树未连接到图的任何其他部分)或松散连接的子树(例如仅由一条边连接的子树)。如果我们要求使用三元组库,则供应商将无法使用此技术,因此将失去实现有趣统计功能的可能性。在我看来,招标应该尽可能技术中立(至少在系统内部方面)。

那么招标要包含什么呢?
我的看法是它应该指定所需的功能。毕竟,有趣的是我们希望系统做什么(或者至少我们想要对系统做什么)。对于基于关联数据的系统,我能想到的非详尽列表将是【引用2013 BIBFRAME使用案例与需求,参见:BIBFRAME使用案例与需求(2014-10-26)】

– 系统必须能够以下列格式导入图书馆数据:
— MARC 21(多半有不同风味)【比如:德国的没有ISBD标识符?LC较少用连接字段?】
— 使用BIBFRAME数据模型的RDF
— 使用RDA数据模型的RDF
— …
– 系统必须能够以下列格式导出数据:
— MARC 21(多半有不同风味)
— 使用BIBFRAME数据模型的RDF
— DC-XML(用于OAI-PMH)
— …
– 系统必须支持下列导入和导出接口:
— SRU/SRW
— OAI-PMH(双向同步)
— Z39.50 😉
— W3C WebSub(确保系统是Web的)
— …
– 编目模块必须允许编目员:
— 将题名和规范连接到驻留在本地系统中的其他题名和规范(例如,连接出版物与其继承者或作者;连接作者与其出生地、出生地与其所属国家)
— 将题名和规范连接到驻留在联机数据库中的其他题名和规范(可能要求系统必须支持的搜索界面列表)
— …
– 系统必须允许管理者:
— 配置数据录入表单,如限制编目员可以使用哪个规范档
— 以标准化格式导入和导出数据录入配置和元数据纲要(可能说明此种格式清单,如SHACL, ShEx, JSON Schema, XML Schema……)
— 无缝包含第三方数据库(IEEE Xplore, EconBiz, PubMed, ………)到最终用户检索中
– 系统必须允许最终用户:
— 使用单一、统一搜索界面搜索图书馆内部内容和第三方数据库
— 导出书目引文到第三方引文管理系统
— 对匹配定制搜索的新内容订阅RSS/Atom源【推送】
— …
对我,此方法的优点是:
1) 客户需要考虑他们真正希望系统做什么
2) 供应商可以专注于以舒适的方式实现此功能,而不必专注于新技术。

Karen Coyle与Lars进行了一番互动,认为在关联数据的讨论中缺少内容:要做哪些链接?由此Lars对需求作了补充:
这让我想到了另一个重要的要求,我通常认为这是理所当然的,但这可能需要明确:
系统必须为系统中管理的所有实体公开可解引的URI。管理员还必须有一种方法可以为所有或某些类型的实体(例如,不得共享的资源)禁用此功能

2017 EBW:对ILS投标者的BIBFRAME期望

关于欧洲BIBFRAME研讨会(EBW),参见:
欧洲BIBFRAME研讨会(2019-3-29)
2018 EBW:就RDA与BIBFRAME致信RDA指导委员会(2019-4-2)
[update,对本文件的反馈: 对《对ILS投标者的BIBFRAME期望》的意见(2019-4-3)]

2017年欧洲BIBFRAME研讨会上讨论了对集成图书馆系统(ILS)实现关联数据模型的要求,尤其是应用BIBFRAME。由此2018年EBW组委会要求Tiziana Possemato(意大利数据/系统厂商 Casalini Libri – @cult)草拟规范《对ILS投标者的BIBFRAME期望》,作为2017 EBW成果。文件提出了ILS转向BIBFRAME/关联数据的不同级别,可作为招标需求。其中ILS主要指其编目模块,共定义了3个类型、逐步过渡到关联数据环境的10个级别。以下摘译“ILS的BIBFRAME一致性级别”部分。
注:其中提到主/从(技术):“一种通信模型,其中一个设备或进程对一个或多个其他设备具有单向控制。 在某些系统中,从一组符合条件的设备中选择一个主设备,其他设备扮演从设备的角色”

EBW-ILS

—— 对ILS投标者的BIBFRAME期望(摘录) ——
BIBFRAME Expectations for ILS Tenders (2018-02)
ILS的BIBFRAME一致性级别

以下一致性级别可分为三种不同类型:
a. 元数据生成/维护:1-8级
b. 发现:9级
c. 文档化/未来能力:10级
当图书馆提供更加成熟和明确的要求时,将来可以改进这些类型组中的每一个。

1. 第一级(入门级):ILS需要管理格式并能够生成“做得好”的数据(这意味着高质量的MARC数据),准备转换为BIBFRAME。该系统仍然处于传统环境中,但供应商已经改进了编目标准或格式,使传统MARC记录更易于转换。这些功能的一些示例是:
 管理对数据转换为BIBFRAME有用的属性和关系的可能性;
 使用RDA条款和指南进行编目的可能性;
 使用URI管理和丰富MARC记录的可能性;
 管理ILS级别的书目和规范记录之间的链接、使转换变得更加容易的可能性,因为系统确保了链接的一致性。
通常,任何提高数据质量的功能都有助于以后的转换。在这种情况下,编目模块完全面向记录

2. 供应商可以提供转换工具,能够转换为各种模型,包括BIBFRAME(从MARC/MODS …格式到关联数据),不包含在ILS中,但可用于转换数据。在这种情况下,编目模块完全面向记录,之后实现到BIBFRAME的转换。关系数据库为主、三元组库为从。

3. 供应商可以提供连接到ILS的BIBFRAME转换器:这意味着一次性实现海量数据转换,但系统应允许逐个记录RDF(BIBFRAME)数据集的更新。此外,系统应允许更新已经采用RDF格式的数据。在这种情况下,编目模块仍然完全面向记录,之后实现了对BIBFRAME的转换。关系数据库为主、三元组库为从。这两个环境应保持一致。这将使数据作为关联开放数据提供给外部应用程序以供使用。

4. ILS便于使用BIBFRAME编辑器,以在BIBFRAME中创建和编辑数据。供应商提供API层以将RDF数据转换并下载到关系数据库中(以传统格式)。在这种情况下,数据变为面向实体,并且它们被转换为传统格式,以允许使用传统数据的其他服务(用于流通等)。在这种情况下,主/从关系由“编辑器”确定(它可以有一个存储系统)。这将使数据作为关联开放数据提供给外部应用程序以供使用。

5. ILS有自己的BIBFRAME接口(在图中称为GUI),因此编目不再是面向记录的,而是面向实体的。系统在两个环境中同时管理两个不同的数据库(关系和三元组库)和每个编目操作(发出 – 编辑 – 删除 – 获取)更新。在这种情况下,主是三元组库,从是关系数据库。

6. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境);供应商提供API/Web服务以将系统与传统系统连接(转换和管理来自传统系统的数据)。没有必要拥有平行的传统环境,但图书馆希望与现有的传统环境保持联系。

7. 系统允许原始编目在RDF/BIBFRAME环境中进行。编目过程完全是面向实体的(关联开放数据环境),整个ILS很可能在RDF中生成和管理数据[或者情况可能并非如此,但这种情况不属于本文档的范围] 。没有理由拥有并行环境,因为完全实现了向新的关联开放数据环境的过渡。

8. 供应商将确保前面提到的工具/技术将考虑BIBFRAME的演变;特定组件将更新吸收BIBFRAME模型和词汇表中的更改,通过… [定义特定时间,例如从新BIBFRAME版本发布后一年]。

9. 供应商将提供一个发现工具,该工具能够为BIBFRAME提出的实体关系模型提供证据。面向OPAC/面向BIBFRAME的发现系统的详细信息需要本文档的另一部分(或其他特定文档)。就OPAC/发现工具而言,此列表并未全面展示前端系统的可能演变。如果没有以前的级别,则该级别不被视为更高级别的合规性,而是较低级别的合规性。

10. 供应商必须确保共享所有项目文件(技术和实践),以便将来在供应商的专属领域之外管理系统。