重量级图书馆关联数据项目LD4P获得资助

尽管近来关联数据(LD/LOD)的前途不断受到质疑,但在美国图书馆界却仍然欣欣向荣,新资助项目源源不断。今年LOD最大新闻:
4月22日,斯坦福大学图书馆宣布Linked Data for Production (LD4P)项目获得安德鲁梅隆基金150万美元资助。项目为期两年(2016-2018),斯坦福主持,哥伦比亚、康奈尔、哈佛、普林斯顿大学及美国国会图书馆(LC)6家机构协作。

Linked Data for Production (LD4P)
项目维基首页介绍:“LD4P是六个机构间的一项合作(哥伦比亚、康奈尔、哈佛、国会图书馆、普林斯顿和斯坦福大学),在安德鲁梅隆基金提供的150万美元支持下,开始转换技术服务生产流程至关联开放数据(LOD)。转换的第一阶段将致力于【1】开发生产元数据为公有LOD的能力,【2】扩展BIBFRAME本体以包含图书馆必须处理的众多资源格式,【3】更广泛图书馆社区的参与以确保一个可持续、可扩展的环境。”(编号为本人所加)

LD4P准备已久,今年初ALA仲冬会议的BIBFRAME更新论坛上,LD4P曾集体亮相,3家参与馆做相关报告:普林斯顿(德里达特藏)、哥伦比亚(艺术收藏品)和康奈尔(嘻哈音乐传单)。今年夏天ALA年会也会有相关报告。从项目时间表看,其他3家关注重点是:斯坦福(表演音乐)、哈佛(地图、动态图像)、LC(音像与录音、印刷图片与照片、一般馆藏、BIBFRAME 2.0)。
各家都会对BIBFRAME作出评估,并做必要扩展。项目背景对BIBFRAME有较多涉及。

项目维基很多内容还在建设中。列出的相关项目4个(其中3个为官方IMLS资助,1个为机构内部项目[梅隆基金资助项目]):
BIBFLOW和Linked Open Data for Special Collections(即伊得诺伊大学的BIBFRAME项目),介绍见后“参见”
Western Name Authority File 和 National Strategy for Shareable Local Name Authorities:2016年美国IMLS资助的2个关联开放数据项目,分别资助犹他大学5万美元、康奈尔大学9.8万余美元。

2014年安德鲁梅隆基金曾资助康奈尔主持的Linked Data for Libraries (LD4L)项目100万美元,哈佛和斯坦福3家大学协作,寻求开发新的基于关联数据的工具和方法,以更好地描述图书馆的学术信息资源。LD4L同样为期两年(2014-2016),斯坦福在新闻发布中称,“两项目将协同工作、相互促进各自目标”。
参见LD4L项目维基:Linked Data for Libraries (LD4L)

via [BIBFRAME] Linked Data for Production / by Philip E. Schreur. 2016-5-9

参见:
ALA 2016仲冬会议的BIBFRAME更新论坛(2016-1-29;对LD4P有简单介绍,其中提到后加入的第7家马里兰大学最终未列入)
“德里达图书馆”关联数据计划(2016-1-29;普林斯顿的LD4P)
伊利诺伊大学的BIBFRAME项目(2016-1-17)[并非前述项目]
推动关联数据应用:《数据技术新视界——与汤贝克面对面》参会记录(2015-5-6;将BIBFLOW列为当时的4个项目之一)
小河尘在书社会的日志:Bibflow简介(2015-05-08)

BIBFRAME2.0类的变化

上月BIBFRAME词表2.0发布。从1.0到2.0,BIBFRAME的类有很大变化。

1.0顶级类为Resource,所有类都是其子类。有4个被定义为核心类,即作品、实例、规范、注释。核心类各有若干子类,其他类则没有子类。
2.0没有Resource,顶级类直接使用rdf:Resource,所有类都是其子类。有3个被定义为核心类,即作品、实例、单件。其中单件没有子类,而其他类不少有子类。
核心类的变化规范类被删除,其子类保留。注释类被删除,其子类HeldMaterial及其子类HeldItem合并为2.0的单件类,其他子类保留。

BIBFRAME 1.0:类53个、属性289个,术语合计342个;
BIBFRAME 2.0:类175个、属性197个,术语合计382个。
属性和类合计,2.0术语有所增加。其中1.0与2.0术语完全相同的类或属性合计约占1/3。
类与属性是不同类型的术语,本来是没有理由相加的。不过,BIBFRAME2.0相对1.0的一个重要变化,就是把1.0中很多属性重新定义为类(约50个),或者增加属性对应的类(与原有合计约60个),因而在类大大增加的同时、属性大大减少,把类和属性合并起来看就有一定的意义了。

除核心类外,BIBFRAME 2.0在类方面的主要变化体现在:
1、增加管理元数据(bf:AdminMetadata)及子类。参见:BIBFRAME Administrative Metadata
2、增加通用类:来源Source、状态Status(此两类分别合并原多个属性),附注Note(同时保留原属性)、 Capture
3、保留标识符(Identifier):原属性改为其子类。详见:BIBFRAME Identifiers
4、保留分类(Classification):原DDC、LCC、UDC、NLM4个分类法属性改为子类
5、取消类别(Category),原属性改名、同时增加4个对应类:内容、媒介、载体和体裁形式。详见:BIBFRAME Categories
6、作品所属子类(对应RDA内容类型)未变,仅三维实物改名Object。
7、实例:所属子类调整
– 保留5个(印刷品、档案、手稿、电子、触摸)
– 删除5个与发行方式有关的子类(专著、多部分专著、连续出版物、集成资源、收馆集),另增加发行方式类(Issuance)
– 增加12个载体描述子类(如数量、开本、基材等,同时保留原属性)
8、单件:新增相关类:子位置(Sublocation,同时保留原属性),使用与获取政策(UsageAndAccessPolicy)及其子类,等等。详见:BIBFRAME Items
9、题名(Title):原不同题名类型由属性变为子类,并有所增加,现包括:作品题名、实例题名、变异题名,以及变异题名4个子类(缩略题名、识别题名、总题名、并列题名),还有可能增加。详见:BIBFRAME Titles
10、提供者(Provider)改名提供活动(ProvisionActivity),原属性改为子类:出版、发行、制作、生产
11、增加MARC中通常放在载体描述项中的其他内容(部分同时保留原属性,可能改名):单位Unit、色彩ColorContent、插图Illustration、声音SoundContent、附件SupplementaryContent
12、增加适用不同类型资源特征的类(多半同时保留原属性),包括:
连续出版物:编号与时序(EnumerationAndChronology)及其子类,出版频率Frequency
数字特征(DigitalCharacteristic)及其子类
记谱类型(Notation)及其子类
投影特征(ProjectionCharacteristic)及其子类,AspectRatio
声音特征(SoundCharacteristic)及其子类
视频特征(VideoCharacteristic)及其子类
音乐相关(MusicEnsemble、MusicFormat、MusicInstrument、MusicMedium、MusicVoice)
地理信息(Cartographic,同时修改原专用属性)
学位论文(Dissertation,同时删除原专用属性)
13、关系词(Relator)改名贡献(Contribution):这是个重要变化。creator属性被删除,所有责任者都使用contributor属性,要记录具体责任,可使用外部职能属性(关系词表)。详见:BIBFRAME Roles
14、删除资源间关系(Related):改为属性relatedTo,具体关系属性为其子属性(极少数由类改属性的)

注:BIBFRAME 2.0词表:List View 上部 Class List 和 Property List 未列出子类、子属性。有子类的名称前有+标识,但有子属性的没有任何标识。

BIBFRAME词表2.0发布

去年BIBFRAME词表2.0草案发布时,LC曾希望听取意见后,能在2016年1月发布。推迟了三个月,BIBFRAME 2.0终于在2016-4-21宣布完成。来自BIBFRAME邮件组的消息:BIBFRAME vocabulary 2.0 available / by Sally McCallum
“这是一个主要进展,试图考虑对1.0词表的多方评论:[1]过去2年BIBFRAME邮件组的社区评论,[2]受邀专家的建议,[3]我们自己用1.0词表试验导致的问题,[4]GitHub上贴出的MARC到BIBFRAME转换程序所收到的评论。……图书馆正在修订工具、转换到2.0,用于今年晚些时候的新试验。”

LC的BIBFRAME网站也做了更新。模型和词表2.0网页包括如下内容:
词表:模型概述、类别视图、列表视图、RDF视图、RDF用法、(以RDF表达数据)指南
规范(2015年7项建议的修订版):题名、职能、单项、事件、标识符、管理元数据、类别
模型分析和讨论稿:2014年和2016年的二份音像报告,2015年的OCLC共同立场报告,2014年的纲要草案、关系草案(均注明修订中)
存档文件:其他失效的草案与讨论稿等,2011-2012年的项目公告

BIBFRAME 2.0模型如下,由原来的2层4核心类变成现在的3层3核心类
BIBFRAME 2.0 model

参见:BIBFRAME词表2.0草案发布(2015-11-4)