BIBFRAME扩展:哈佛电影本体及动态图像扩展

在LD4P和LD4L-Labs项目中,哈佛大学的工作包括对哈佛电影档案馆(Harvard Film Archive, HFA)馆藏的关联数据转换。据哈佛的LD4P项目计划(Harvard Project Proposal,由 Alissa Hafele创建, 最终由 Michelle Futornick修改于 二月 07, 2017):
“作为LD4L-Labs配套项目(5.2哈佛电影档案馆(HFA))的一部分,哈佛将探索和评估将动态图像资源的遗留元数据转换为关联数据的问题。本项目还将探讨使关联数据对研究和发现有用的问题。将开发元数据转换工具,为哈佛电影档案馆(HFA)拥有的各种格式(电影拷贝、底片、DVD、VHS、超8等)和内容(故事片、预告片、家庭电影、民族志电影、宣传片)及相关档案资料(包括制作元素、艺术品、电影剧照和宣传短片)创建关联数据描述。本项目将评估BIBFRAME作为数据模型用于描述动态图像资料,对于研究需求的有效性,并在关联数据环境中识别用于描述这些材料的特定词汇表。HFA项目将为HFA电影拷贝数据库中的记录创建映射,重点关注女性导演的一部分动态图像材料(之前曝光不足的作品,在许多情况下是该馆藏的独特之处)。在可能的情况下,实体将与关联数据URI进行调和,包括个人和公司名称(ISNI、LCNAF)、地名(GeoNames)、体裁(LC体裁/形式、Getty AAT)和作品。”

据介绍项目完成了35,000电影单件从Filemaker Pro数据库到关联数据的转换,生成3,600,000三元组,1,000电影制作人名称获取到ISNI身份。为描述HFA资料所用的哈佛电影本体,对BIBFRAME在动态图像资源方面估了有限的扩展,称为MI扩展(MI extension)。
哈佛电影档案使用主要本体如下(注意到非限定RDA得到多处利用):
描述领域:Works ; Instances ; Items;模型/本体: BIBFRAME
描述领域:Work to work relationships;模型/本体:BIBFRAME, RDAU, MI extension
描述领域:Titles ; Notes ; Annotations;模型/本体:Bibliotek-o, Web Annotations
描述领域:Activities and Agents;模型/本体:Bibliotek-o, dcterms, ISNI, FOAF
描述领域:Content/Carrier/Media ; Subjects ; Genres ;模型/本体:dcterms, schema.org, MI extension
描述领域:AV characteristics and preservation;模型/本体:RDAU, MI extension
描述领域:Provenance;模型/本体:ArtFrame-RareMat

via: LD4P + LD4L Labs projects for geospatial and cartographic resources + moving image materials at Harvard (Marc McGee and Christine Fernsebner Eslao; presentation for IGELU-ELUNA Linked Open Data Working Group Show & Tell, July 10, 2018,梯子自备) [slides]

去GitHub上的LD4L_Film_Ontology(2018-4-20最后更新)看MI extension.ttl,新增词表中技术细节不多,更偏重使用。概要如下:

新增类(4个)及其取值(Individuals,41个)
mi:ConditionDefect(缺陷情况),18个取值
mi:ConditionGrade(等级情况),4个取值
mi:Caution(注意),11个取值
mi:ColorCharacteristic(色彩特征),8个取值

新增子类(5个):
bf:Identifier子类:
– mi:ImdbNumber(IMDb标识符)
活动子类(bib:指bibliotek-o.org命名空间)
bib:Activity 子类
– mi:ProductionCompanyActivity(?原文件说明有误)
– mi:UseActivity(使用)
— mi:ScreenerActivity(促销放映)
bib:AcquisitionActivity 子类
– mi:PurchaseActivity(购买)

新增属性(4个):
dcterms:language(语言)子属性:
– mi:intertitleLanguage
– mi:spokenLanguage
– mi:subtitleLanguage
rdau:P60305(is based on)子属性http://www.rdaregistry.info/Elements/u/#P60305
– mi:isPromotionFor(是……的宣传片)【2018-4-20 最后增加】

更多详细信息见:Working documents for Moving Images LD4L Labs(Created by Christine Fernsebner Eslao, last modified on Apr 18, 2017)

BIBFRAME扩展:地理空间和制图资源本体(GCRO)

地理空间和制图资源本体(Geospatial and Cartographic Resources Ontology,GCRO)是BIBFRAME 2.0扩展本体bibliotek-o的扩展本体,目前为工作草案/beta版(2018-3-30最后更新),暂时采用 http://ontology.library.harvard.edu/geo/ 作为GCRO扩展的命名空间(占位、未激活)。
GCRO是LD4P项目中哈佛大学承担的制图资料项目中的重要内容。介绍见维基:Cartographic Extension (由 Michelle Futornick创建, 最终由 Marc McGee修改于 七月 17, 2018)
项目完成了6个优先考虑的概念领域(投影Projection、空间范围-边界框坐标 Spatial Extent – Bounding Box Coordinates、比例尺 Scale、地势 Relief、制图资源类型 Types of Cartographic Resources 和本初子午线 Prime Meridians)的本体开发,以支持完成11位研究员、学生和图书管理员用例。创建了GCRO本体的OWL文档,信息见:
LD4P Cartographic Materials GitHub repository
大致统计,GCRO共定义了153个类,5个对象属性,1个数据类型属性,24个取值(Named Individuals)。

根据某网络会议PPT(Linked Data Description of Cartographic Resources (Marc McGee, ALCTS Webinar, May 2, 2018),梯子自备)
GCRO为描述地理空间和地图资源,对BIBFRAME 2和bibliotek-o模型进行扩展,可能情况下复用已有LOD本体,包括:RDA, GeoSPARQL, Web Annotations, DCMI Metadata Terms, FOAF;推荐选择支持实体取值词汇。
GCRO所用主要本体:
描述领域:作品、实例、单件 —— 模型/本体:BIBFRAME
描述领域:活动、题名、内容/载体/媒介、主题、附注和注释 —— 模型/本体:bibliotek-o
描述领域:比例尺、地势、投影、坐标、制图资源类型 —— 模型/本体:GCRO
描述领域:本初子午线 —— 模型/本体:rdau
描述领域:测度 Measurements —— 模型/本体:ArtFrame-RareMat

参见:BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)(2018-5-1)

——— 附:LD4P项目中哈佛大学制图资料项目(计划) ———
Harvard Project Proposal(由 Alissa Hafele创建, 最终由 Michelle Futornick修改于 二月 07, 2017)

哈佛大学将探索为图书馆制图资源创建本地关联数据描述的最佳实践,包括印刷地图、地图集、数字地理空间数据集和其他制图信息资源。本项目将评估BIBFRAME作为数据模型的有效性,用于描述研究需求的制图材料,并将比较BIBFRAME的有效性与其他可用的关联数据描述性模式。此外,本小组将评估与制图资源描述相关的叙词表和受控词汇表,以识别最适合描述关联数据环境中制图资源的词汇表。
本项目的LD4L-Labs部分(5.1地理空间数据集和地理空间图像)将侧重于转换哈佛地理空间图书馆、斯坦福EarthWorks和康奈尔大学地理空间信息库的OpenGeoMetadata元数据记录的子集(现在使用地理空间社区标准“联邦地理数据委员会”(FGDC)架构,ISO 19139 表示),成为关联数据描述。
目标/预期成果【据PPT增加注释】
* 识别图书馆制图资源元数据用例、用户故事和研究需求。
* 评估现有BF模式是否适合描述制图资源。【schema.org?】
* 评估其他可用的LOD词表以描述制图资源的属性。【id.loc.gov, FAST, ISNI, VIAF, ISO 19139, GeoNames】
* 开发并记录BF配置文件以描述制图资源。
* 与制图资源社区合作,开发用于描述制图资源的BF最佳实践。
* 使用开发的BF配置文件(珍稀资料到原生数字、不同的语言)编目并转换代表性的制图资源选集,并为项目三元组库提供描述。
* 制订一套由联邦地理数据委员会(FGDC)地理空间元数据标准到关联数据的映射规则
* 使用LD4L-Labs将一组OpenGeoMetadata记录转换为使用制图资料本体的关联数据描述;协调和Originators、Place和Theme关键字以及丛编作品的源元数据中的关联数据实体;将描述发布到关联数据三元组库。
* 通知元数据生成工具的开发,以确保描述制图资源的兼容性。【VitroLib】
* 通知制图资料元数据可视化工具的开发。
* 评估项目结果并分享一系列建议,以便进一步研究和开发。
* 将项目结果呈现给适当的图书馆和关联数据社区,如ALA地图和地理空间信息圆桌会议(MAGIRT)、合作编目计划(PCC)、DLF(数字图书馆联盟)、数字人文组织联盟(ADHO)。
【以上是当初的计划书,从前引维基页面看,有2项推迟到将来:1、创建GCRO的SHACL应用配置文件;2、使用VitroLib的哈佛地理空间元数据实例中的GCRO应用配置文件测试一系列地理空间和制图资源的编目】

BIBFRAME扩展:Performed Music Ontology(PMO)

LD4P(2016-2018)项目很重要的工作是在不同领域对BIBFRAME进行扩展。以前关注过其基本扩展bibliotek-o、艺术和珍稀资料扩展(现合称ARM),由bflc 1.1.0发布中采用pmo:命名空间,再关注Performed Music Ontology(PMO,演奏音乐本体)。
参见:
BIBFRAME扩展:bibliotek-o(及ArtFrame和RareMat)(2018-5-1)
BIBFRAME的LC扩展更新:bflc 1.1.0发布(2019-1-12)

译名说明:
Perform(ance) 可译为“演出”“表演”“演奏”等,performed music确定采用“演奏音乐”是基于RDA的术语定义:
performed music:A content type that consists of content expressed through music in an audible form. Recorded performances of music, computer-generated music, etc., are included.
由于包括录制音乐、计算机生成的音乐等,未必是具有观众的“演出”“表演”,故采用“演奏音乐”。

——— PMO基本情况 ———
“演奏音乐本体”项目旨在为所有格式的演奏音乐开发基于BIBFRAME的本体,特别强调澄清和扩展作品、事件及其贡献者的建模。这项工作是斯坦福大学、音乐图书馆协会(MLA)、录音收藏协会(ARSC)、美国国会图书馆和合作编目项目(PCC)的共同努力,由LD4P合作机构参与。项目主页:
Performed Music Ontology(由 Michelle Futornick创建, 最终由 Nancy Lorimer修改于 十二月 05, 2018)

主页上有很丰富原始资料,包括:项目计划(Deliverables)、当前活动、完成工作(分析/建模,会议报告)。
完成工作【有相关文件链接,部分在Google Doc中,需备梯子】:
* 收集演奏音乐元数据的现有用例并开发更多用例
* 调查了与演奏音乐相关的现有关联数据【其他演奏音乐相关本体、词表等】
* 关于题名的初步立场文件(提交给所有本体组)【对变异题名、并列题名、作品题名、实例题名提出异议,建议新增若干题名类,包括bf:FRBRWorkTitle——是想把BIBFRAME的3层模型变成FRBR的4层模型?】
* 分析BIBFRAME并添加与演奏音乐相关的类和属性【只有32个类,无属性;更新的完整内容见:PMO中所有类、属性和个体[取值]的列表】
* 向LC提交已添加的类bf:Identifier,对音乐相关bf:Identifier子类的定义更改,以及bf:Identifier子类更改
* 建模演奏音乐特定概念,包括主题目录和作品编号以及音乐调和调式(key and mode)
* PMO中所有类、属性和个体[取值]的列表(更新时间2018-07-03)【只有类、属性,并无Individuals】
* 分析和建模文章:1用例;2事件;3-5演奏媒介,第1部分、第2部分、第3部分;6-7作品,第1部分、第2部分-汇编
* 映射:MARC 382 字段到 PMO(草案)

PMO中所有类、属性和个体的列表(The Performed Music Ontology (PMO): an extension to BIBFRAME 2.0 for Performed Music,更新时间2018-07-03)中,有对象属性23个、数据属性8个、类40个,其中“事件”相关类和属性占了相当大的比例。
与事件有关的类有14个——在“事件”文件(Events,更新时间2018-06-27)中还有另外2个——合计16个类(Class),列举如下:
EventName 事件名称
bf:Event子类(及子子类)
– Audition 面试
– BenefitConcert 福利音乐会
– Ceremony 仪式
– Concert 音乐会
— CommandPerformance 命令演奏(应君主或其他国家元首的要求完成音乐会或演出)
– ConcertSeries 音乐会系列(相同地理区域)
– ConcertTour 音乐会之旅(不同城市、国家或地点)
– Festival 【来自 Events 文件】
— MusicFestival【来自 Events 文件】
– MasterClass 大师班(大师授课的音乐高级讲习班)
– Performance 演奏
— FirstPerformance 第一次演奏
— LivePerformance 现场演奏
— OpenMicPerformance 打开麦克风表演(业余表演者在咖啡馆、夜总会或其他场地的现场表演)
– RecordingSession 录制会话
– Rehearsal 排演/排练

Events 文件对事件建模有详细说明和举例,引文件最后一段说明备记:
“另外两个音乐领域本体(Doremus和音乐本体论)也具有事件结构,两者都更精确,更能够非常精细地描述音乐事件,特别是录制会话和相关事件。鉴于对传统编目中事件关注普遍较低,由此导致缺乏丰富的信息,以及对编目人员愿意或能够提供多少工作的现实评估,PMO试图提供一个模型,比MARC可能的更丰富,并不寻求涵盖所有可能性。相反,我们确定我们的模型与Doremus和音乐本体论的模型尽可能兼容,并期望在PMO和Doremus之间建立正式的联系。”