《BIBFRAME音像建模研究》笔记

《BIBFRAME音像建模研究:为描述音像资源而定义一个灵活的模型》是BIBFRAME网站上发布的唯一一个BIBFRAME模型的“分析”报告。
音像资源与图书有很多不同(见报告1导论),用源于图书的模型来描述音像资源让编目员很折腾。本研究的目标是提出一个通用内容模型(见报告4),为此首先分析比较了现有内容模型(见报告2)。研究得到LC音像部门的全面支持。LC音像部门不仅收藏商业音像制品,还有很多类型的未出版音像资源(见报告3)。通过对不同音像资源的需求分析,提出了一个适用于包括图书在内的通用内容模型,并用8个样例加以说明。最后依此提出对BIBFRAME的修改建议(报告5)。
文件于2014年提出,其建议有多少最终体现在BF2中?有待后续详察。

———-《BIBFRAME音像建模研究》摘译 ———-
BIBFRAME AV Modeling Study: Defining a Flexible Model for Description of Audiovisual Resources (Submitted May 15, 2014) By Kara Van Malssen, AVPreserve
【说明:半角方括号编号为摘译时所加,全角方括号为摘译时注释】

1 导论
动态图像和录音内容的特征
[1] 基于时间【意味着需要事件中心法,而不是严格的作品或对象中心法】
[2] 多创作者/贡献者【不同职能的施事者】
[3] 独特性【未出版,无可分享记录】
[4] 集合体和收藏集【专辑作为作品,或者若干作品的集合体;作品本身多载体】
[5] 多代与使用【为保存而升级到不同媒介类型,相同内容不同单件,保存格式与访问格式各不相同】
音像资源描述的一种内容模型的需求概要
[1] 同样应用于出版和未出版资料【关键词:未出版】
[2] 内容描述允许作品或事件中心方法【引入与作品并列的“事件”】
[3] 允许内容跨越作品和事件中心
[4] 允许分别描述内容和载体,以及两者间(潜在的复杂)关系【内容、载体】
[5] 能够描述收藏集和集合体,以及包含在其中的单件关系【收藏集、集合体】
[6] 足够灵活以支持广泛的内容类型【更多内容类型】
[7] 能让编目员和最终用户轻易识别内容类型,到适当粒度(如音频:口语,动态图像:剧集)【细化内容类型】
[8] 支持描述相关内容实例,表明其代、使用和相互关系【相关内容】
[9] 能够描述内容重用和重新定位,允许来源与新内容间关系【内容间关系】
[10] 允许描述来源艺术意图(如无声/有声、彩色、长宽比、帧频、调),作为内容特性【即作品而非实例属性】
[11] 能够表达内容间复杂关系(如主记录用于商业发布,“网络剧集”用于电视集,原始新闻用于最终广播等)【内容间关系】
[12] 允许适应内容和机构情景的描述粒度【描述粒度】
[13] 支持载体的技术特征描述,能够认证访问与保存【技术特征】

2 现有内容模型的比较分析
作品/内容表达:FRBR/RDA,FIAF,OLAC,Variations,PBCore/EBUCore,indecs
载体表现/单件:FRBR/RDA,FIAF,Variations,indecs,PBCore/EBUCore
事件 【在不同标准中有很不相同的含义】
集合体
[1] FRBR
[2] RDA(含“音乐编目最佳实践”)
[3] OLAC(Online Audiovisual Catalogers (OLAC) Moving Image Work-Level Records Task Force)
[4] FIAF(International Federation of Film Archives (FIAF) Cataloguing Manual)
[5] Variations3 Metadata developed by Indiana University
[6] metadata framework【ONIX所用】
[7] 其他:Dublin Core, PBCore, EBU Core, Europeana Data Model, Schema.org
[8] AMIM2(Archival Moving Image Materials: A Cataloging Manual, 2nd edition)作为AACR第7章的扩展,仍被LC电影、广播和录音部(MBRS)的动态图像部所用
* 表1 不同编目标准识别的主要实体间松散对应【上述1-6】(p.11)【作品(抽象层)、内容表达(变体、实例)、载体表现(容器)、单件、个人/家族/团体(施事者agent、贡献者)、事件、地点、内容】
虽然看上去各内容标准中实体是重叠的,实际上相同术语却有重要的概念差异

3 LC动态图像和录音内容的需求
动态图像部
[1] 描述资料集,包括未出版的:预印本、制作元素、大堂画片、预告片、草图、手稿、电影剧本、口述史视频、信件、抄本
[2] 描述基于事件的内容:体育直播、口述历史、演出、参众两院立法程序
[3] 表达版本概念,并关联到原始元素与作品
[4] 更适应描述电视系列剧集的原始播放版,与图书馆收藏的DVD或蓝光汇编一同呈现与描述
[5] 方便及管理研究者,对内容有贡献但在(载体上)没有信息
[6] 包括作品级的娱乐标识符注册EIDR的标识符,更好地通过版权注册提交内容存储的电影和电视广播业校准【我国有许可号?】
录音部
[1] 提供事件中心模型,允许包含作品或某些作品元素为事件的部分,但不要求出现作品。
[2] 描述出版或未出版录音的内容集合,以及相关资料,如广播录音、商业录音、信件、抄本。
[3] 描述容器中的单个乐曲/歌曲
[4] 描述某些格式的粒度特征,能够识别适当的播放设备,如用于1/4英寸录音盘、音轨数、播放速度、盘尺寸等
[5] 结合人种/传统内容的结构,结合上下文元素和现有结构/内容标准缺失的重要数据字段
[6] 弄清支持该数据模型的软件系统,应该允许对特定字段的多款目选项(文本/字符串,链接/URI,以后日期链接)
[7] 能够有效摄入通过版权呈缴方式提交的元数据,内容来自录音业,可能与indecs校准

4 面向通用内容模型
– 内容创建领域模型
内容(作品、事件)——附着过程——实例
– 内容描述数据模型
(在上述模型中增加:施事者agent、集合collection、断言assertion)
– 样例

5 与BIBFRAME校准
对BIBFRAME的建议
[1] 不完全作品中心,也可选事件中心,或者按需跨越两者【“事件”作为与原顶级“作品”同级的类】
[2] 创建“内容”超级类【在“作品”与“事件”之上】
[3] 明确对作品和实例可指定多个类型【只能选一个内容类型有困难】
[4] 修改某些属性的定义域限制,为另一些属性增加附加定义域【定义域由“实例”扩大到“作品”】
[5] 考虑采用动态图像和录音实例的技术特性【从稳定性考虑,不建议采用外部命名空间来扩展这部分属性】
[6] 扩展“注释”,包括某些FRBR/RDA单件属性【BF2有独立的Item类,应当在Item中解决】
[7] 考虑增加日期和日期类型属性【需要不同日期,但没必要增加不同日期属性,而是用日期+关联日期类型——适合RDF吗?】
[8] 调查能够实现顺序的方法【类似edm:isNextInSequence】
[9] 调查支持在描述音像内容中包含时间戳【关联内容到时间片断】

附录A:与音乐类型有关的录音问题
附录B:音乐作品集的数据模型
附录C:复杂的多部分音像作品的挑战
参考文献

《Web注释数据模型》对注释的分类

《Web注释数据模型》的W3C工作草案于2015年10月15日发布,该模型基于较早的社区草案《开放注释数据模型》,其自定义类和属性仍采用后者的命名空间(oa:) 。
Web Annotation Data Model (W3C Working Draft 15 October 2015)
Open Annotation Data Model (Community Draft, 08 February 2013)

首先,什么是注释?制订本规范的目的是什么?以下译自其摘要:
– 注释典型地用于表达有关资源的信息或者资源间联系。简单例子包括对单个网页或图像的评论或标签,或有关新闻报道的一篇博文。
– Web注释数据模型规范,描述一个结构化的模型和格式,使注释能跨软硬件平台被分享和复用。通用案例可用简单方便的方式建模,与此同时,可有更复杂的需求,包括链接任意内容到特定数据点或定时多媒体资源的片断。
– 本规范提供适应这些使用案例的概念模型,以及表达它的术语词表。为方便创建和消费注释,推荐特定的JSON格式。

本模型有三个主要成分:注释(Annotation)、主体(Body)、目标(Target)。简单地说,注释关联主体与目标,提供主体“关于(about)”目标的信息。
annotation
主体和目标是Web资源(有URI,但主体可以是文字),也可以是资源的片断(如文本被高亮选中的部分、地图的特定区域、视频的某一段),而主体和目标还可以包含在注释中(嵌套)。
“注释”、“主体”和“目标”有各自的属性和关系,比如创建(如谁、何时)和描述信息(比如语言、文件格式)。创建者除了个人机构,还可以是软件

“注释”有一个重要属性是创建的理由,被称为“动机(Motivation)”资源。动机的实例(Instance),可视为注释的类别,目前有13种。
———- Motivation 动机———-
bookmarking 书签
classifying 分类(确定类别)
commenting 评论
describing 描述
editing 编辑(修改)
highlighting 强调/高亮
identifying 标识(给URI)
linking 链接
moderating 评分
questioning 提问
replying 回复
reviewing 评介(评估,而非简单评论,如书评)
tagging 加标签

———- 题外话:BIBFRAME的“封面”在哪里? ———-
BIBFRAME 2.0取消了“注释”类,理由大致是可以直接采用《Web注释数据模型》。
如果拿BIBFRAME 1.0的注释类型对照的话,上述列表中没有对图书来说很重要的“封面”(Cover Art)。虽然我当初就有点疑惑,封面难道不是资源本身的特征?作为“注释”或许本来就可斟酌?不过原方案是考虑用户上传封面图片等情况,把封面作为外部资源的。
《Web注释数据模型》 附录D“扩展动机”称,本规范中的动机表衍生自注释领域的扩展调查,但许多场合需要或者希望更准确的定义;在这种情况下,推荐创建新的“动机”资源,关联到一个或多个已有(动机),作为下位关系
看上述清单,大概只有“描述”勉强可以。BIBFRAME 2.0会如何处理“封面”?

BIBFRAME+RDA全新亮相:bfe 0.2.0发布

BIBFRAME编辑器(bfe)是为使用BIBFRAME词表编目而开发的软件,2013年Zepheira开发原型,与Zepheira合约结束后由LC接手开发,用于BIBFRAME项目的实验。开发者Kirk Hess前些天先后在推特和BIBFRAME邮件组发布消息,bfe 0.2.0版发布。“作为本次发布的一部分,我们也包括了8个纲要,为LC的BIBFRAME试验计划而创建,支持使用RDA的描述性编目”。

联机演示版已更新:BIBFRAME Editor
– 左侧栏现可选创建6类资源:单行资源、乐谱、连续出版物、地图、蓝光DVD、音频CD(比后述BIBFRAME纲要少2类)
– UI与原型基本相同,但增加了RDA条款号提示,以及到RDA Toolkit的链接(依赖于BIBFRAME到RDA的映射——BIBFRAME纲要)
– 查询使用id.loc.gov(按代码说明,应该可以自定义其他查询API)

代码发布在GitHub,公共域(可以拿来用):lcnetdev/bfe
– bfe可以当作通用的RDF数据编辑器,适用于各种浏览器编辑
– 提供3种运行方式:(1)在服务器上运行;(2)集成到其他项目;(3)克隆到本地使用。
– 使用BIBFRAME纲要提供HTML/UI输入单,能够集成“查找”服务,由外部Web API查询数据,实施者可定义输入并抽取输出
– bfe没有移植Zepheira原型的代码(但使用其UI设计)
– 目前支持BIBFRAME词表1.0版(bf:),计划到0.4版时支持BIBFRAME词表2.0(bf2:)(应该更新相应的BIBFRAME纲要就可实现)

同时在GitHub上发布的还有8个应用纲要BIBFRAME Profile
– 采用Zeheira开发的BIBFRAME应用纲要说明书制作
– 使用BIBFRAME词表1.0,以及LC试验实施中为“真实”使用情况所需的附加属性[元素](附加元素在bf2:命名空间)
– 标为v0.2.0的文件有10个,针对特定文献类型的是8个:
WEI-35mmFeatureFilm.json(bfe demo无)
WEI-Audio CD.json
WEI-BluRayDVD.json
WEI-cartographic.json
WEI-monograph.json
WEI-notated-music.json
WEI-serial.json
WEI-sound-recording.json(bfe demo无)
(WEI即Work, Expression, Instance——BIBFRAME术语和RDA术语混用)
找了个JSON Viewer,慢慢看BIBFRAME如何“支持使用RDA的描述性编目”。