Folio实体管理应用(实体app)

在FOLIO的元数据管理特别兴趣小组(MM-SIG)支持下,实体管理工作组(EM-WG)在2020-2021年打算开发实体App,形成了2份文件:

之后EM-WG大概就结束活动了。2022年小组恢复活动,并更新了用例。

实体管理工作组的恢复,似乎与美国国会图书馆(LC)于2022年9月宣布决定采用由EBSCO支持的FOLIO有关。参见:美国国会图书馆选择folio系统(2022-9-22)

2023年1月30日LC的BIBFRAME更新论坛,已经与BIBFRAME关系不大,几乎成为其FOLIO更新论坛,其中第3时段的康奈尔大学Jason Kovari报告,针对FOLIO中的实体管理,介绍了上述2份文件。该时段后来增加EBSCO的Gloria Gonzalez报告,针对LC的FOLIO项目,在用于FOLIO的新BIBFRAME/关联数据需求部分,介绍“规范和实体管理功能”,提到以下两点:[1]自动化规范管理任务,用MARC书目和规范记录同步关联数据规范;[2]作为LC图书馆馆藏获取平台(LCAP)的一部分创建实体管理服务,FOLIO实体管理工作组将提供反馈。

根据“实体App愿景”,实体包括:行为者、体裁、地理、主题、作品、其他(如MARC和RDA词表),即通常的规范控制对象。通过管理、创建、缓存、发布,集成实体数据,支持实体的CRUD(即创建、读取/消费、更新、删除)功能。

概述

  • 实体管理应用程序(实体App)是FOLIO架构的模块,在这里管理、创建、缓存和发布实体数据。该应用程序提供支持实体管理的功能,跨FOLIO应用程序集成外部和内部关联数据源,并提供促进基于实体的数据模型(如BIBFRAME)的一个组件。这将是FOLIO管理受控实体和支持FOLIO存储和支持的任何元数据模式的中心位置。
  • 为了方便其他功能,实体App必须缓存外部实体并存储内部实体。外部实体,如美国国会图书馆(LC)主题标题、LC名称规范档(LCNAF)、Getty词表、RBMS词表或任何具有关联数据端点的基于web的词库,可以在内部缓存,以便可以在MARC SRS、典藏和FOLIO内开发的其他数据存储中控制数据。
  • 实体App还将支持使用永久URI创建、维护和发布的本地定义实体。实体的本地管理示例可能包括机构的本地实体,这些实体不由现有的外部实体数据源表示,或创建关于外部实体的本地数据(例如:为有问题的主题标题添加替代标签)。
  • 实体管理工作组承认CODEX愿景,该愿景与实体管理概念之间存在一些重叠【本人说明附后】。然而,实体管理app旨在实现特定功能,以实现对Folio内实体的管理,并不局限于CODEX愿景,也不要求交付CODEX愿景的任何部分。
  • 在规范管理范围内,实体App以多种方式处理FOLIO和第三方查找服务中其他地方存储的数据。首先,实体App保存FOLIO中使用的受控标题的记录数据。这包括MARC SRS书目记录中1XX、6XX、7XX等字段中存储的标题等数据,以及FOLIO中当前管理的参考数据(例如:资源类型和载体类型)。

【说明】Folio使用Codex管理元数据(The Codex Vision),并作为规范化的元数据中心,供各种app调用。Codex不但映射导入各种来源的元数据,甚至还建立抽象的“作品”,以实现如典藏(Inventory)中的实物资源和知识库(KB)中电子资源(eHoldings)的关联。这显然与实体管理有交叉。

实体管理App作为规范控制工具,对于转向FOLIO的LC来说是刚需,其他图书馆不一定需要。而Codex作为不同FOLIO域和App之间的连接点,则是所有图书馆都需要的基础FOLIO域,二者本各有侧重。实体App完成后,Codex当可直接利用实体管理域中的规范数据

台湾链接资源系统 LDT@Library

台湾图书馆界在2022年3月18日正式启用“台湾链接资源系统”(LDT@Library)。如网址 https://ld.ncl.edu.tw/ 所示,本系统对标美国国会图书馆(LC)的关联数据服务id.loc.gov,提供关联数据环境下的规范取值词表,可通过API获取,也提供RDF数据打包下载(每年更新1次)

系统由台湾中央图书馆与台湾大学图书馆合作开发。网站首页之“LDT @ Library 緣起”:

  • 在2018年起國內部分圖書館陸續導入了支援Linked Data的自動化系統,部分圖書館開始將編目規則轉換為RDA規範之際,在此趨勢之下使鏈結資源的具像化得以有實現的可能。有鑑於此,國家圖書館與國立臺灣大學圖書館積極合作執行本計畫,旨在承繼先前的成果,整理國內聯合權威資料庫,結合題名、主題資料,製作符合標準之鏈結數據並開發相應的「臺灣鏈結資源系統」平台,以期提供使用者更多元、詳盡的相關資訊。
  • 本計畫旨在建置一個整合的臺灣資料鏈結資源系統,而透過這個臺灣圖書館界可共用共享的系統,使臺灣各領域的學研數據可透過網際網路和國際間各大型語意數據集形成脈絡的串連,呈現使用者更豐富的臺灣資料及更完整的華文研究資源。

系统目前收录台湾《中文主題詞表》主题规范17212条,《中文图书分类法》(2007年版)28352条,中文个人名称规范324781条(2023-2-7实时数据)。

系统在去年发布时称,“未來並可與網路資源(例如:ISNI、ORCID、VIAF、Wikidata等)進行串連,以因應語意網(Semantic Web)世代的來臨”。via 「臺灣鏈結資源系統」於111年3月18日正式啟用(2022-3-23)

早在2015年,台湾中央图书馆就以关联数据发布了以上3种资源。新系统应该已取代原发布资源。参见:中国国家图书馆,你在哪儿?台湾发布关联数据有感(2016-1-17)

试用LDT@Library

不懂API,还是手查。已看到部分记录与Wikidata关联。

不过又手黑,发现一人多记录。另外不支持繁简通检,或许只有大陆对此有强烈需求?

1、用简体汉字查“鲁迅”,可以查到人名规范“魯迅, 1881-1936.”

URI(s):
- https://ld.ncl.edu.tw/authority/351060
Instance Of:
- MADS/RDF Authority
- MADS/RDF PersonalName
Preferred name:【首选名称(规范形式)】
- 魯迅, 1881-1936.
Variants:
- Luxun, 1881-1936.
- 周, 樹人, 1881-1936.
……(以下省略其数百个汉字笔名及音译,不含简体汉字)
Related names:【外连名称?】
- Lu, Xun, 1881-1936.
Sources:【来源】
- His A Q cheng chuan, 1957:t.p. (Lu Hsün; Lū Sin [in Thai])
……(省略8个)
- 鲁迅诗编年笺证【唯一出现的简体字“鲁迅”,使本记录得以查到】
Connected External IDs:【外部关联:wikidata,使用名称为:Lu Xun】
- http://www.wikidata.org/entity/Q23114
Alternate Formats:
- RDFXML
- Turtle
- N-Triples
- JSON-LD

2、由以上相关名称查Lu, Xun( 拼音/拉丁字母音译),查到另一人名规范“周樹人, 18810925-19361019”【显然为不同来源的数据,没有合并;此记录没有连接wikidata】

URI(s):
- https://ld.ncl.edu.tw/authority/86496
Preferred name:
- 周樹人, 18810925-19361019
Variants:
- A'er, 18810925-19361019
- A-chang, 18810925-19361019
……(以下省略其数百个汉字笔名及音译,不含简体汉字)
Sources:
……(省略18个)

3、查“毛泽东”,确定不支持繁简通查,必须使用繁体字“毛澤東”:

URI(s):
- https://ld.ncl.edu.tw/authority/294713
Preferred name:
- 毛澤東, 1893-1976.
Variants:
- 澤東, 1893-1976.
- Zedong, 1893-1976.
- 潤, 1893-1976.
- Run, 1893-1976.
……(以下省略其数十个汉字假名及音译,不含简体汉字)
Related names:
- Mao, Zedong, 1893-1976.
Connected External IDs:【外部关联:wikidata,使用名称为:Mao, Zedong】
- http://www.wikidata.org/entity/Q5816

编目伦理守则(2021年)

近年,美国图书馆界的“政治正确”就是日益重视“多样性、公平性和包容性”(DEI即Diversity, equity, and inclusion)。2021年发布的《编目伦理守则》(Cataloguing Code of Ethics)是编目领域这方面的重要文件。

本文件由编目伦理指导委员会 (CESC) 与六个工作组和国际编目实践社区的成员协商起草。CESC成立于2019年初,由来自美国、加拿大和英国的六名成员组成。最终版本于2021年1月发布。编目伦理守则的第1部分包含背景信息、定义和文件范围。其范围包含十项原则和价值观,这些原则和价值观在守则的制定过程中被确定为编目工作的基础。文件第2部分包含十个声明,详细阐述第1部分中所述的原则和价值观。正如编目伦理守则第1部分中所述,CESC认为该文件“提供了一个框架来处理编目工作,这将是一个当出现伦理问题时,对从业者、雇主、标准制定者、供应商、学生和教育工作者来说是有用的工具。”

美国图书馆协会(ALA)于2021年11月、英国图情专业人员协会(CILIP)于2022年6月批准此文件。加拿大的审查工作组2022年10月才启动,目标是2023年12月前发布报告。加拿大图书馆协会(CFLA)批准后,本文件将提交给国际图联(IFLA),供创建国际编目伦理守则

via ALA: Cataloging Ethics Steering Committee. Cataloging Code of Ethics. 2021-01. http://hdl.handle.net/11213/16716(含文件正文)

via CFLA-FCAB: Call for Participation: Cataloguing Code of Ethics Review Working Group. 2022-10-12.

via CILIP News: Cataloguing ethics code backed by CILIP / Jane Daniels. 2022-06-29.

以下是第2部分的十项原则和价值观:

  • 我们将使用此处列出的这些伦理声明(重要性不分先后)来指导和改进我们的编目实践:
  • 1. 我们以最终用户为中心对我们馆藏中的资源进行分类,以方便访问和促进发现。
  • 2. 我们承诺不加歧视地描述资源,同时尊重相关行为者的隐私和偏好。
  • 3. 我们承认我们将偏见带到了工作场所;因此,我们努力克服工作中的个人、机构和社会偏见。
  • 4. 我们认识到标准的互操作性和一致应用有助于我们的用户查找和访问资料。然而,所有的标准都是有偏见的;我们将批判性地对待他们,并倡导使编目更具包容性。
  • 5. 我们支持努力使标准和工具让所有编目员在经济上、智力上和技术上可用,并在基于证据的研究和利益相关者的投入下开发。
  • 6. 我们对我们的编目决定负责,并提倡我们机构实践和政策的透明度。
  • 7. 我们广泛合作,支持在各种环境和司法管辖区创建、分发、维护和丰富元数据。
  • 8. 我们坚持工作场所的。我们为所有编目员提倡教育、培训、公平薪酬和公平的工作环境,以便他们能够继续支持搜索和发现。
  • 9. 我们倡导为编目的价值,在组织内部和与外部伙伴合作。
  • 10. 我们与用户社区合作,了解他们的需求,以便提供相关和及时的服务。

编目伦理委员会(Cataloging Ethics Steering Committee, CESC)官网

  • 《编目伦理守则》(Cataloguing Code of Ethics)(Google Sites,需备梯)
  • 除《编目伦理守则》文本外,还有相关更新内容,包括:会议报告发表文章(预印本)、配套案例(同时征求新案例)、译本(目前有希腊语)及6个咨询工作组对守则的报告。

以下为样本案例2

  • 问题陈述/情况背景
  • 用于描述与土著居民相关资料的过时术语,尤其是在国会图书馆主题标目(LCSH)中,使殖民态度永久化,并可能阻碍对任何类型图书馆中资料的访问。 添加或编辑现有主题标目的过程可能漫长而艰巨,许多图书馆没有工作人员有时间专门用于这些过程。
  • 解决方案
  • 加拿大各地的几个图书馆都创建了自己的叙词表。通过直接与原住民社区合作并广泛提供他们的作品,图书馆已经能够使用用户熟悉的术语使用本地创建的标题来补充有问题的标题,这些标题不仅更准确而且更易于访问。不列颠哥伦比亚大学(UBC)图书馆在土著知识方面的工作是一个很好的例子,它可以找到一种方法来证明LCSH的局限性并提供可行的解决方案。UBC制作“平行记录”,一个带有LCSH标题,另一个带有他们当地的词库“First Nations House of Learning Subject Headings”。2019年6月,CFLA-FCAB原住民事务委员会宣布软启动First Nations, Metis and Inuit – Indigenous Ontologies (FNMIIO)。这个由社区自己定义的社区名称清单是一份动态文件,也是一个长期项目的第一步。未来的计划包括作为MARC守则记录和关联数据格式进行分发。