ALA 2019仲冬会议的BIBFRAME更新论坛

德国国家图书馆的Reinhold Heuvelmann在BIBFRAME邮件组发消息,看到BIBFRAME更新论坛的所有报告都上线了(官方未发信息)。

2011年书目框架行动启动以来,自2012年冬起更新论坛每年2次在ALA仲冬和夏季年会中举办。参见:
LC书目框架转换行动:首届更新论坛(2012-2-7)
ALA 2016仲冬会议的BIBFRAME更新论坛(2016-1-29)
2016 ALA年会BIBFRAME更新论坛(2016-8-27)
2017年BIBFRAME更新论坛(2017-7-26)
2018年BIBFRAME更新论坛(2018-11-14)

今年照例除美国国会图书馆(LC)本身外,还请了其他机构,除从不缺席的OCLC,特别是欧洲的出席,共4家5个报告。
BIBFRAME Update Forum at ALA Midwinter Meeting 2019 (2019-1-27)

一、LC的BIBFRAME试验扩展
1、Expanding the Pilot / Sally McCallum, Library of Congress (PPT, 76KB)
【完成了从MARC到BIBFRAME转换,开始反向转换。】
转换的动机。
转换中遇到的问题,包括:BIBFRAME作品到MARC题名规范或者书目作品?非拉丁文字880字段;来自BIBFRAME数据的URI(带入MARC);MARC子字段末尾标点(不再有)。

2、Anonymous Resources, Blank Nodes, And Providers, Oh My! / Kevin Ford, Library of Congress (PPT, 392KB)
【本次会议最有意思的报告:BIBFRAME转换的匿名资源或空节点问题,实验通过规范控制或实体URI减少空节点】
使用匿名资源会导致大量重复资源,匿名资源的数量正在导致或将导致性能和扩展问题。
以“提供者”(主要是出版者)为例:在1800万MARC书目记录中=约1500万匿名提供者Agent资源。其中许多(大多数?)表达相同实体,比如Harcourt Brace, Penguin Books, Harper Collins。1500万中有120万独特提供者。
因此我们创建了一个“提供者”文档……做实验【即出版社规范档:id.loc.gov/bfentities/providers/…,实验对出版社使用URI】

二、LD4P2
3、LD4P Status update / Philip Schreur, Stanford University (PPT, 868KB)
介绍使用Sinopia作为BIBFRAME编辑器,使用SHARE-VDE转换记录为BIBFRAME(2018年BIBFRAME更新论坛上有SHARE-VDE介绍),以及LD4P的成果。
参见:
BIBFRMAE应用进展:LD4P实施之路(2018-7-8)
LD4P2走向实施之路:目标与工作(附LD4系列)(2019-1-8)

三、欧洲BIBFRAME研讨会
4、European BIBFRAME Workshop / Reinhold Heuvelmann, German National Library (PPT, 3.23MB)
欧洲BIBFRAME研讨会已经召开两届,每年9月召开:
2017.9.26-27 European BIBFRAME Workshop 2017, German National Library, Frankfurt https://wiki.dnb.de/display/EBW
2018.9.17-19 European BIBFRAME Workshop 2018, European University Institute, Fiesole (Florence), Italy http://www.casalini.it/EBW2018
2019.9.17-18 European BIBFRAME Workshop 2019, National Library of Sweden, Stockholm,

四、OCLC
5、OCLC BIBFRAME Update / Nathan Putnam, OCLC (PPT, 13.61MB)
介绍OCLC研究部的BIBFRAME相关工作:
* 使用LC的转换器,将WorldCat中的MARC记录转换为BIBFRAME数据,得到的经验教训是:[1]作品ID很重要,在处理开始就有用;[2]URI很重要,空节点=不可互操作;[3]OCLC处理书目记录=很少单件/实例数据【?】。
* OCLC研究部当前活动:创建可用的BIBFRAME数据图,供最终用户测试,已经完成:[1]Hash URI代替空节点;[2]移除已经有VIAF或FAST的额外实体属性【指哪些?】;[3]评审BIBFRAME管理数据【BF管理元数据放在作品下有点奇怪】;[4]在WorldCat记录集上测试图修改。
* 现在:OCLC研究部与全球产品管理部共享信息,前进的道路取决于回答有关问题:[1]工作流程,[2]用例,[3]期望成果/服务。
* 向前走,我们知道我们将提供BIBFRAME数据,需要答案的问题集中在社区需要和期望的内容上:[1]重要的是什么(标识符来源,转换选项,质量等);[2]如何评估数据?(API、下载、导出等)[3]应当强化什么?[4]WorldCat中的编目工作流程是什么?
* 与成员馆合作:
与RLP成员合作:[1]焦点小组,[2]收集需求,[3]期望的工作流程,[4]实践工作流程开发。
与成员馆和小组合作,如PCC、OCLC元数据首创咨询组、MOUG(音乐OCLC用户组 )、OLAC(关注非印刷资料的编目员组织)、OCLC CJK用户组等。

BIBFRAME扩展:哈佛电影本体及动态图像扩展

在LD4P和LD4L-Labs项目中,哈佛大学的工作包括对哈佛电影档案馆(Harvard Film Archive, HFA)馆藏的关联数据转换。据哈佛的LD4P项目计划(Harvard Project Proposal,由 Alissa Hafele创建, 最终由 Michelle Futornick修改于 二月 07, 2017):
“作为LD4L-Labs配套项目(5.2哈佛电影档案馆(HFA))的一部分,哈佛将探索和评估将动态图像资源的遗留元数据转换为关联数据的问题。本项目还将探讨使关联数据对研究和发现有用的问题。将开发元数据转换工具,为哈佛电影档案馆(HFA)拥有的各种格式(电影拷贝、底片、DVD、VHS、超8等)和内容(故事片、预告片、家庭电影、民族志电影、宣传片)及相关档案资料(包括制作元素、艺术品、电影剧照和宣传短片)创建关联数据描述。本项目将评估BIBFRAME作为数据模型用于描述动态图像资料,对于研究需求的有效性,并在关联数据环境中识别用于描述这些材料的特定词汇表。HFA项目将为HFA电影拷贝数据库中的记录创建映射,重点关注女性导演的一部分动态图像材料(之前曝光不足的作品,在许多情况下是该馆藏的独特之处)。在可能的情况下,实体将与关联数据URI进行调和,包括个人和公司名称(ISNI、LCNAF)、地名(GeoNames)、体裁(LC体裁/形式、Getty AAT)和作品。”

据介绍项目完成了35,000电影单件从Filemaker Pro数据库到关联数据的转换,生成3,600,000三元组,1,000电影制作人名称获取到ISNI身份。为描述HFA资料所用的哈佛电影本体,对BIBFRAME在动态图像资源方面估了有限的扩展,称为MI扩展(MI extension)。
哈佛电影档案使用主要本体如下(注意到非限定RDA得到多处利用):
描述领域:Works ; Instances ; Items;模型/本体: BIBFRAME
描述领域:Work to work relationships;模型/本体:BIBFRAME, RDAU, MI extension
描述领域:Titles ; Notes ; Annotations;模型/本体:Bibliotek-o, Web Annotations
描述领域:Activities and Agents;模型/本体:Bibliotek-o, dcterms, ISNI, FOAF
描述领域:Content/Carrier/Media ; Subjects ; Genres ;模型/本体:dcterms, schema.org, MI extension
描述领域:AV characteristics and preservation;模型/本体:RDAU, MI extension
描述领域:Provenance;模型/本体:ArtFrame-RareMat

via: LD4P + LD4L Labs projects for geospatial and cartographic resources + moving image materials at Harvard (Marc McGee and Christine Fernsebner Eslao; presentation for IGELU-ELUNA Linked Open Data Working Group Show & Tell, July 10, 2018,梯子自备) [slides]

去GitHub上的LD4L_Film_Ontology(2018-4-20最后更新)看MI extension.ttl,新增词表中技术细节不多,更偏重使用。概要如下:

新增类(4个)及其取值(Individuals,41个)
mi:ConditionDefect(缺陷情况),18个取值
mi:ConditionGrade(等级情况),4个取值
mi:Caution(注意),11个取值
mi:ColorCharacteristic(色彩特征),8个取值

新增子类(5个):
bf:Identifier子类:
– mi:ImdbNumber(IMDb标识符)
活动子类(bib:指bibliotek-o.org命名空间)
bib:Activity 子类
– mi:ProductionCompanyActivity(?原文件说明有误)
– mi:UseActivity(使用)
— mi:ScreenerActivity(促销放映)
bib:AcquisitionActivity 子类
– mi:PurchaseActivity(购买)

新增属性(4个):
dcterms:language(语言)子属性:
– mi:intertitleLanguage
– mi:spokenLanguage
– mi:subtitleLanguage
rdau:P60305(is based on)子属性http://www.rdaregistry.info/Elements/u/#P60305
– mi:isPromotionFor(是……的宣传片)【2018-4-20 最后增加】

更多详细信息见:Working documents for Moving Images LD4L Labs(Created by Christine Fernsebner Eslao, last modified on Apr 18, 2017)

BIBFRAME扩展:地理空间和制图资源本体(GCRO)

地理空间和制图资源本体(Geospatial and Cartographic Resources Ontology,GCRO)是BIBFRAME 2.0扩展本体bibliotek-o的扩展本体,目前为工作草案/beta版(2018-3-30最后更新),暂时采用 http://ontology.library.harvard.edu/geo/ 作为GCRO扩展的命名空间(占位、未激活)。
GCRO是LD4P项目中哈佛大学承担的制图资料项目中的重要内容。介绍见维基:Cartographic Extension (由 Michelle Futornick创建, 最终由 Marc McGee修改于 七月 17, 2018)
项目完成了6个优先考虑的概念领域(投影Projection、空间范围-边界框坐标 Spatial Extent – Bounding Box Coordinates、比例尺 Scale、地势 Relief、制图资源类型 Types of Cartographic Resources 和本初子午线 Prime Meridians)的本体开发,以支持完成11位研究员、学生和图书管理员用例。创建了GCRO本体的OWL文档,信息见:
LD4P Cartographic Materials GitHub repository
大致统计,GCRO共定义了153个类,5个对象属性,1个数据类型属性,24个取值(Named Individuals)。

根据某网络会议PPT(Linked Data Description of Cartographic Resources (Marc McGee, ALCTS Webinar, May 2, 2018),梯子自备)
GCRO为描述地理空间和地图资源,对BIBFRAME 2和bibliotek-o模型进行扩展,可能情况下复用已有LOD本体,包括:RDA, GeoSPARQL, Web Annotations, DCMI Metadata Terms, FOAF;推荐选择支持实体取值词汇。
GCRO所用主要本体:
描述领域:作品、实例、单件 —— 模型/本体:BIBFRAME
描述领域:活动、题名、内容/载体/媒介、主题、附注和注释 —— 模型/本体:bibliotek-o
描述领域:比例尺、地势、投影、坐标、制图资源类型 —— 模型/本体:GCRO
描述领域:本初子午线 —— 模型/本体:rdau
描述领域:测度 Measurements —— 模型/本体:ArtFrame-RareMat

参见:BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)(2018-5-1)

——— 附:LD4P项目中哈佛大学制图资料项目(计划) ———
Harvard Project Proposal(由 Alissa Hafele创建, 最终由 Michelle Futornick修改于 二月 07, 2017)

哈佛大学将探索为图书馆制图资源创建本地关联数据描述的最佳实践,包括印刷地图、地图集、数字地理空间数据集和其他制图信息资源。本项目将评估BIBFRAME作为数据模型的有效性,用于描述研究需求的制图材料,并将比较BIBFRAME的有效性与其他可用的关联数据描述性模式。此外,本小组将评估与制图资源描述相关的叙词表和受控词汇表,以识别最适合描述关联数据环境中制图资源的词汇表。
本项目的LD4L-Labs部分(5.1地理空间数据集和地理空间图像)将侧重于转换哈佛地理空间图书馆、斯坦福EarthWorks和康奈尔大学地理空间信息库的OpenGeoMetadata元数据记录的子集(现在使用地理空间社区标准“联邦地理数据委员会”(FGDC)架构,ISO 19139 表示),成为关联数据描述。
目标/预期成果【据PPT增加注释】
* 识别图书馆制图资源元数据用例、用户故事和研究需求。
* 评估现有BF模式是否适合描述制图资源。【schema.org?】
* 评估其他可用的LOD词表以描述制图资源的属性。【id.loc.gov, FAST, ISNI, VIAF, ISO 19139, GeoNames】
* 开发并记录BF配置文件以描述制图资源。
* 与制图资源社区合作,开发用于描述制图资源的BF最佳实践。
* 使用开发的BF配置文件(珍稀资料到原生数字、不同的语言)编目并转换代表性的制图资源选集,并为项目三元组库提供描述。
* 制订一套由联邦地理数据委员会(FGDC)地理空间元数据标准到关联数据的映射规则
* 使用LD4L-Labs将一组OpenGeoMetadata记录转换为使用制图资料本体的关联数据描述;协调和Originators、Place和Theme关键字以及丛编作品的源元数据中的关联数据实体;将描述发布到关联数据三元组库。
* 通知元数据生成工具的开发,以确保描述制图资源的兼容性。【VitroLib】
* 通知制图资料元数据可视化工具的开发。
* 评估项目结果并分享一系列建议,以便进一步研究和开发。
* 将项目结果呈现给适当的图书馆和关联数据社区,如ALA地图和地理空间信息圆桌会议(MAGIRT)、合作编目计划(PCC)、DLF(数字图书馆联盟)、数字人文组织联盟(ADHO)。
【以上是当初的计划书,从前引维基页面看,有2项推迟到将来:1、创建GCRO的SHACL应用配置文件;2、使用VitroLib的哈佛地理空间元数据实例中的GCRO应用配置文件测试一系列地理空间和制图资源的编目】