LC提供2500万书目记录免费批下载(附LC在Library.Link)

2017年5月,美国国会图书馆(LC)宣布免费提供2500万条书目记录批下载。时间段为1968-2014年,应该就是2014年前LC制作的所有MARC记录。很多年前LC的书目记录就可以通过Z39.50逐条获取,但批量数据以前是付费订购的。虽说“主要供研究与开发利用”(MARC Open-Access),但因为并未限制使用目的,估计很多书目服务商听到消息第一时间就去下载备用了。
根据LC网站的 MARC Distribution Services (data set) 网页上的FAQ说明,本次免费提供的数据截止到2013年12月,以后可能每年更新。订购数据则更及时,目前截止2015年12月底,同时提供每日、每周更新。
开放MARC数据的目的是希望书目数据得到原有目的之外的、更广泛的利用。LC采访与书目访问部主任Beacher Wiggins在报道中说:“为了更有效的信息分享、更方便可视化与其他不可预知的分析,我们希望社会科学家、数据分析师、开发者、统计学者及其他人在工作中使用数据,对大数据集做创新工作,强化新知识的学习与生成”。
via Fortune: The Library of Congress Just Made 25 Million Records Available for Free (2017-5-17)

——— Library.Link中的LC书目数据 ———
今天看到Library.Link中,对LC书目记录经关联数据转换后发布。LC宣布开放数据是2017-5-17,数据被载入Library.Link是2017-6-12,发布是2017-6-15,可谓反应迅速。不知道是不是最早的公开发布应用。
关于Library.Link,参见:2016 ALA年会BIBFRAME更新论坛(2016-8-27)

LOC.Library.Link
LC像其他加入Library.Link的图书馆一样,有一个主页。如果有帐号,可以看访问统计。
右栏是“资源”,即由MARC记录转化后的Bibfra.me类(共16个)及数量,字顺排列:
Agent 2338223
Collection 667912 (由相关题名字段转换而来?)
Concept 6546780
CopyrightEvent 564
Family 25860
Form 9336
Instance 12898932
Meeting 228118
Organization 1200225
Person 4891149
Place 634135
ProviderEvent 6005730
Series 958273
Temporal 8906
Topic 303503
Work 13649505

每次在新形态下看发布的书目数据,总不免看到一些原本埋没着不知道的原始数据错误,如以前看分面OPAC,现在看关联数据。选择“个人”随意浏览,本当为人名,但排序在前几页的都是非字母开头的(标点符号、数字),有些可能是非拉丁字母转化的字符问题,还有相当部分应该是原始数据有问题。
比如有个”16 juli 1993″,根据题名返回到LC目录查原记录,LCCN=94124897(https://lccn.loc.gov/94124897),果然有:
7001_ |a “16 juli 1993.”
本书1993年出版,可能把500误作700了。

接下来还有不少以冠词A起始的,很有意思,比如:A 1st class boy, A British officer, A Californian, A lady of this city …
比如:A lady of this city
LC目录中查到原记录LCCN=16009701(https://lccn.loc.gov/16009701)
245 04 $a The life of the beautiful and accomplished danseuse, Mademoiselle Fanny … $c … Selected and comp. by a lady of this city.
700 0# $a A lady of this city.
原来还有这样直接用题名页上称呼做个人名称检索点。

LC联机目录实施响应式设计界面

【关键词:网站统计,响应式设计,可访问性,OpenURL】

2016年6月,美国国会图书馆(LC)联机目录实施响应式设计界面,以适应不同平台与设备。同时,响应式设计天然具有可访问性,即兼容ADA(美国残障人法案),这使得LC联机目录对包括残障人在内的所有用户可访问。该馆辅助技术专家使用多款屏幕阅读器,对可访问性做了测试。
本次界面更新源于LC的网站统计显示,越来越多用户从智能手机或平板访问图书馆网站功能。网站统计还为重新设计提供了很多信息,比如LC联机目录现在有自己的品牌(LOGO?),咨询馆员服务(Ask a Librarian)显著出现在每一页。
LC联机目录含1700万记录,描述LC的1.62亿馆藏;但1980年前编目的某些资料仅有卡片目录,供到馆研究人员使用(回溯尚未完成)。联机目录本身的功能及索引范围并无变化,新界面只是改善目录的可用性。新界面也提供了更大的设计灵活性,可有效扩展LC联机目录功能。目前新增功能两项:(1)Cite功能,可复制粘贴简单的引文信息到文本文件(可惜并非标准引文格式),(2)目录现支持OpenURL(图标为Find It!),可根据访问者所在IP,解析链接至可用的电子资源(应该类似于Google Scholar)。
不知道是否家中网速关系,访问速度有点慢。

以下为新的下拉菜单
LC联机目录菜单

关于可访问性,LC联机目录采用如下几个标准:
《美国国会图书馆Web可访问性准则》(Library of Congress web accessibility guidelines
W3C Web内容可访问性准则1.0,A级(W3C Web Content Accessibility Guidelines 1.0, level A
美国康复法案第508款(Section 508 of the Rehabilitation Act (29 U.S.C. 794d))

参见:About the LC Online Catalog

2016 ALA年会BIBFRAME更新论坛

今年ALA年会的BIBFRAME更新论坛报告上线:
BIBFRAME Update Forum at ALA -Powerpoints from presentations are now available(June 26, 2016)
4方面6个报告:
一、LC的BF试验:2个报告(第1阶段评估;下阶段试验)
参见:BIBFRAME试验项目培训资料(2016-4-2)
《LC有关BIBFRAME开发立场的声明》及试验进展(2016-4-1)
BIBFRAME试验第1阶段报告(2016-8-27)

二、LD4P:2个报告(1斯坦福的表演音乐;2哈佛的地图和动态图像-LD4L)
参见:重量级图书馆关联数据项目LD4P获得资助(2016-5-10)

三、Zepheira的LibraryLink网络:从2014年Libhub创始项目(libhub.org),到2015年bibfra.me,再到2016年图书馆链接网络(library.link)。目前该网络超过2千图书馆位置(指分馆数吧),1亿单件(典型目录转换一小时以内发布)
参见:BIBFRAME和BIBFRA.ME(就差一个点)(2016-5-10)

四、OCLC近期BIBFRAME相关活动3项:1再利用遗留数据(PCC-URI工作组),2扩展规范控制的范围(康奈尔IMLS项目:共享本地规范的国家战略),3定义创作性作品的新模型(与LC合作:对BF2草案提供专家反馈,书目描述中简化表达“地点”,调和其“作品”标识符)

参见:
ALA 2016仲冬会议的BIBFRAME更新论坛(2016-1-29)
(5个方面7个报告:LC;Casalini libri;LD4P:普林斯顿、哥伦比亚、康奈尔;OCLC;Zepheira)
推动关联数据应用:《数据技术新视界——与汤贝克面对面》参会记录(2015-5-6)
(有关BIBFRAME的4个项目:LC、LD4L、Bibflow、NLM)

——— 报告摘录:下阶段BIBFRAME试验 ———
Next BIBFRAME Pilot: Here is What It Takes (PPT, 313 KB) / Sally McCallum, Chief, Network Development and Standards Office
步骤1、修订词表和模型:2014年起,2016年4月布,更好地适应RDA,构建试验的所有工作的基础
步骤2、MARC到BF转换规范(建设中)
步骤3、MARC到BF转换程序
步骤4、文档准备:分离、合并和匹配
1、MARC题名规范->BF作品
2、MARC书目有统一题名无规范->BF作品使用统一题名信息
3、MARC书目无统一题名->创建BF作品描述
4、由MARC书目合并主题到BF作品描述、强化主题
5、MARC书目->分离为不同载体的BF实例描述),保留新BF作品和实例描述间的所有指针)
步骤5、准备基础架构(与其他任务同时,进行中):
1、使用带4Store三元组库的MarkLogic平台
2、主要移到内部平台到虚拟服务器
3、主要平台版本升级、增加新的三元组语义模块
4、无损移动LC关联数据服务(ID)而不中断ID服务
5、计划新载入BF文档到新语义环境
步骤6、修改BF输入编辑器和BF纲要编辑器(与其他任务同时)
步骤7、审核与增强关联数据服务(LDS)(与其他任务同时) :LDS(ID)是试验的组成部分,LDS向编辑器提供下拉与浏览信息,准备文档过程中为数据提供URI(步骤4),当移到新的MarkLogic版本时重新设计应用,基于试验1经验和2.0需求增强
步骤8,准备文档与保持培训