2017年BIBFRAME更新论坛

自2012年1月ALA仲冬会议起,美国国会图书馆(LC)会在每年2次的ALA冬、夏年会上举办BIBFRAME更新论坛。LC介绍BIBFRAME开发进展,邀请其他机构介绍与BIBFRAME相关的应用等,这些机构主要是高校和厂商,几乎不可缺的常客是OCLC和Zepheira(BIBFRAME初始协约开发者)。今年的2次已召开,会议报告如下:

2017年1月,ALA 2017仲冬会议更新论坛(BIBFRAME Update Forum at ALA Midwinter Meeting 2017
– LC近期开发更新
Update on Recent Developments at the Library of Congress / Sally McCallum(LC网络开发与MARC标准办公室主任)-
– LC试验2生产计划 【列在日程上,网站未提供PPT】
LC Plans for Production Pilot 2 / Beacher Wiggins(LC采访与书目获取部主任)
– 表演音乐关联数据:为音像产品与档案编目扩展BIBFRAME 2.0
Linked Data for Performed Music : an extension to BIBFRAME 2.0 for production & archival cataloging of sound recordings & music videos / Nancy Lorimer(斯坦福大学图书馆元数据部主任)
原标题:Music Development for BIBFRAME in LD4P (Linked Data for Production)
– 把MARC带到BIBFRAME
Bringing MARC forward to BIBFRAME / Wayne Schneider(Indexdata公司工程师)
– OCLC在作品上的工作
OCLC’s Work on Works / Roy Tennant(OCLC高级项目主任),Jean Godby(OCLC高级研究科学家)

2017年6月,ALA 2017年会更新论坛(BIBFRAME Update Forum at ALA Annual Conference 2017
– 国会图书馆试验二: 更完整、 更多参与者, 更多互动
Library of Congress Pilot Two: more complete, more participants, more interactive / Beacher Wiggins, Sally McCallum
– BIBFRAME作品与OCLC作品:定义模型,发现证据
BIBFRAME and OCLC Works: defining models and discovering evidence / Jean Godby, Diane Vizine-Goetz(OCLC高级研究科学家)
– LD4P曳光弹/示踪子弹:RDF套录编目管道
LD4P Tracer Bullet 1: an RDF copy-cataloging pipeline / Philip Schreur(斯坦福大学技术与获取服务助理馆长)
– 成为数据原住民:BIBFRAME可扩展性如何向图书馆提供了走向可伸缩的革命性进化之路
Becoming Data Native: How BIBFRAME Extensibility Delivers Libraries A Path to Scalable, Revolutionary Evolution / Eric Miller(Zepheira公司总裁)
原标题:Transformation, BIBFRAME, and the Library.Link Network

总结下BIBFRAME现状大体如下:
– LC目前的重点是第2阶段试验(Pilot 2),面向实际编目环境。除了已经完成的原有记录转换,更重要的是书目和规范的原编。
– OCLC与LC在协调对于FRBR“作品”的实践差异。OCLC的结论是WorldCat作品可以对应BIBFRAME创作作品,尽管有不同层次的属性。对于已有数据,作品识别算法仍需改进。
– 斯坦福大学等的关联数据生产(LD4P)项目,应用BIBFRMAE的进展:(1)BIBFRAME的表演音乐扩展(未来会有面向不同领域的更多扩展);(2)套录MARC记录转换为BIBFRAME并进而利用的流程,复杂的过程,有待自动化处理。
2016年的2次BIBFRAME更新论坛上也有LD4P项目的报告。
– 关联数据图书馆应用Library.Link(采用BIBFRAME 1.0变体bibfra.me)
– 厂商开始从MARC转向BIBFRAME之路

参见:
重量级图书馆关联数据项目LD4P获得资助(2016-5-10)
BIBFRAME和BIBFRA.ME(就差一个点)(2015-5-10)
LC和OCLC关于BIBFRAME和Schema书目扩展的白皮书(2015-2-12)

先前部分BIBFRAME更新论坛,参见:
LC书目框架转换行动:首届更新论坛(2012-2-7)
ALA 2014仲冬会议中的BIBFRAME(2014-2-5)
ALA 2016仲冬会议的BIBFRAME更新论坛(2016-1-29)
2016 ALA年会BIBFRAME更新论坛(2016-8-27)

BIBFRAME 2.0实施注册新增项目(附:意大利SHARE目录)

时隔三月,再去看 BIBFRAME 2.0实施注册(2017-4-26),新增了4项,按先后顺序,分别是:
BIBFRAME 2.0 Implementation Register
(4)2017-5-9 更新:Colorado College – Colorado Alliance of Research Libraries BIBCAT Pilot
美国的科罗拉多学院也是BF1.0实施注册者,2014-2-7有应用TIGER Web Catalog & Flask-BIBFRAME Extension
此次是科罗拉多研究图书馆联盟与厂商KnowledgeLinks.io合作的BIBCAT试验项目,从目录中随机抽取16万条MARC记录,是BIBFRAME与Schema.org的结合体,具体没看明白。源代码:https://github.com/KnowledgeLinks/alliance-bibcat
项目网址:bibcat.org,2017夏发布2.0版(目前显示升级中)。

(5)2017-6-7更新:Ex Libris, Alma
参见:艾利贝斯与哈佛图书馆合作开启“BIBFRAME路线图”(2017-5-12)

(6)2017-7-10入档:Library of the Hungarian National Museum
参见:匈牙利国家博物馆图书馆目录以BIBFRAME发布(2017-5-21)

(7)2017-7-20入档:@CULT – SHARE Catalogue in Linked Data
意大利 @CULT公司开发的7所大学的目录门户 SHARE — Scholarly Heritage and Access to Research,包含200万书目记录、34万规范记录 ,采用BIBFRAME词表的关联数据发布。不过预设的BIBFRAME导出/显示尚未提供(详见下)。
@CULT是位于罗马的系统厂商,近年也致力于语义网/关联数据应用。上述匈牙利国家博物馆图书馆目录项目中,@CULT承担数据转换与链接。

——— SHARE目录 ———
未来图书馆目录界面会是如何?SHARE有点与众不同,在界面上体现BIBFRAME的三层实体:
1、个人/作品
提供从作者(包括人名、团体、会议)或作品题名查找资源,有输入逐步提示功能。首页有SHARE目录简介,最下面的User Guide详解各种用法。
亮点在其结果显示页,也最能体现关联数据的作用。

– 查作者,进入作者页,显示作者个人信息,以及其作品。(如:Hamilton, Richard
中间是作者(可能有头像),下面连接其作品。
左侧上部是各种规范数据的链接:ISNI 国际标准名称标识符、Wikidata、美国国会图书馆、法国国家图书馆、VIAF 虚拟国际规范档。可链接到相应来源。
左侧下部是维基百科词条。
右侧是个人名称的不同形式(应该是通过左侧的规范数据对不同形式的名称做了合并处理,但并未强制做形式的统一)。和名称一样,可点击进入目录结果页。
右上部有三个输出选项(本页的所有信息):下载BIBFRAME、打印、发邮件。遗憾的是设定为.ttl格式的BIBFRAME文件为空。
该作者的作品列表在网页下部(不在截屏内),点击放大镜进入作品页(见下),点击题名进入目录结果页——特别注意是按“作品”汇集的,可能对应多个出版物(实例)。
SHARE目录-Person

– 查作品,进入作品页,显示作品以及其创作者。点击作品进入目录结果页。 (如:Choes and Anthesteria
左侧是出版物,可直接链接到各条书目记录(出版物/实例),小图标为收藏机构。
网页下部的创作者,点击放大镜进入作者页(见上),点击作者名进入目录结果页。
SHARE目录-Work

2、出版物(实例)
这是主界面,与单个输入框检索的流行方式类似:既可同时查题名、名称、主题,也可分别查,并对选择检索结果排序。另外有高级检索,不同检索途径组合之外,还可选择日期、文献类型(格式)、语言、书目层次(专著/连续)、出版国、收藏馆作限定。
检索之外,还提供按文献类型的浏览方式,方式是点击主界面下部的7个文献类型图标。结果页右侧有大量分面可供限定范围:格式、书目层次、作者、作品、出版社、语言、日期范围、出版日期、主题(个人、团体、会议、地理、论题、体裁/形式)。
出版物/实体现在检索结果的详细页,Info标签部分,可选择按MARC格式或BIBFRMAE显示——遗憾的是目前BF显示为空。

3、单件
作为多机构目录门户,在检索结果的详细页,Copy data标签,显示的即为单件,有链接到各机构OPAC。

LC提供2500万书目记录免费批下载(附LC在Library.Link)

2017年5月,美国国会图书馆(LC)宣布免费提供2500万条书目记录批下载。时间段为1968-2014年,应该就是2014年前LC制作的所有MARC记录。很多年前LC的书目记录就可以通过Z39.50逐条获取,但批量数据以前是付费订购的。虽说“主要供研究与开发利用”(MARC Open-Access),但因为并未限制使用目的,估计很多书目服务商听到消息第一时间就去下载备用了。
根据LC网站的 MARC Distribution Services (data set) 网页上的FAQ说明,本次免费提供的数据截止到2013年12月,以后可能每年更新。订购数据则更及时,目前截止2015年12月底,同时提供每日、每周更新。
开放MARC数据的目的是希望书目数据得到原有目的之外的、更广泛的利用。LC采访与书目访问部主任Beacher Wiggins在报道中说:“为了更有效的信息分享、更方便可视化与其他不可预知的分析,我们希望社会科学家、数据分析师、开发者、统计学者及其他人在工作中使用数据,对大数据集做创新工作,强化新知识的学习与生成”。
via Fortune: The Library of Congress Just Made 25 Million Records Available for Free (2017-5-17)

——— Library.Link中的LC书目数据 ———
今天看到Library.Link中,对LC书目记录经关联数据转换后发布。LC宣布开放数据是2017-5-17,数据被载入Library.Link是2017-6-12,发布是2017-6-15,可谓反应迅速。不知道是不是最早的公开发布应用。
关于Library.Link,参见:2016 ALA年会BIBFRAME更新论坛(2016-8-27)

LOC.Library.Link
LC像其他加入Library.Link的图书馆一样,有一个主页。如果有帐号,可以看访问统计。
右栏是“资源”,即由MARC记录转化后的Bibfra.me类(共16个)及数量,字顺排列:
Agent 2338223
Collection 667912 (由相关题名字段转换而来?)
Concept 6546780
CopyrightEvent 564
Family 25860
Form 9336
Instance 12898932
Meeting 228118
Organization 1200225
Person 4891149
Place 634135
ProviderEvent 6005730
Series 958273
Temporal 8906
Topic 303503
Work 13649505

每次在新形态下看发布的书目数据,总不免看到一些原本埋没着不知道的原始数据错误,如以前看分面OPAC,现在看关联数据。选择“个人”随意浏览,本当为人名,但排序在前几页的都是非字母开头的(标点符号、数字),有些可能是非拉丁字母转化的字符问题,还有相当部分应该是原始数据有问题。
比如有个”16 juli 1993″,根据题名返回到LC目录查原记录,LCCN=94124897(https://lccn.loc.gov/94124897),果然有:
7001_ |a “16 juli 1993.”
本书1993年出版,可能把500误作700了。

接下来还有不少以冠词A起始的,很有意思,比如:A 1st class boy, A British officer, A Californian, A lady of this city …
比如:A lady of this city
LC目录中查到原记录LCCN=16009701(https://lccn.loc.gov/16009701)
245 04 $a The life of the beautiful and accomplished danseuse, Mademoiselle Fanny … $c … Selected and comp. by a lady of this city.
700 0# $a A lady of this city.
原来还有这样直接用题名页上称呼做个人名称检索点。