LC-PCC新RDA政策声明开始准备

2019年8月,4个有关测试版RDA工具包(新RDA)的LC-PCC任务组成立,标志着LC-PCC政策声明的准备工作开启(竟然才启动),见Program for Cooperative Cataloging网站“RDA and PCC”栏目

合集:LC-PCC Task Group on Aggregates in Beta RDA Toolkit: Charge [PDF; 132 KB] (August 2019)
数据出处:LC-PCC Task Group on Data Provenance in Beta RDA Toolkit: Charge [PDF; 99 KB] (August 2019)
历时作品:LC-PCC Task Group on Diachronic Works in Beta RDA Toolkit [PDF; 99 KB] (August 2019)
元素标签:LC-PCC Task Group on Element Labels in Beta RDA Toolkit [PDF; 163 KB] (August 2019)

RDA重构时承诺“尽可能保留现有条款”,以上4个应该是LC和PCC评估后认为新RDA有重要变化的部分,可对比3R计划常见问题所列发生重大变化的条款:合集、历时作品、关联说明语和非人类人物。元素标签曾因用词难以理解在RDA邮件组中被吐槽,但主要与显示有关,与编目本身关系不大。

关系说明语的变化是由附录中的取值词表,变成了正文中的元素。PCC曾在2018年11月发布《PCC关于NACO规范记录中应用关系说明语的指南》PCC Guidelines for the Application of Relationship Designators in NACO Authority Records (November 2018) [Word : 66 KB]。

各小组的职责是评估测试版RDA工具包中相关条款,就LC-PCC编目可能需要的LC-PCC政策声明提出建议。小组不负责编写实际的文档,仅建议应遵循的政策,以及因小组政策建议而需要修订的现有文档(如BSR、CSR、DCMZ1、NACO培训材料等)、需要创建的新文档(如新RDA用户贡献文档、应用配置文件等)。小组职责要求建议考虑书目和规范数据,特别注意MARC实施、处理遗留数据、关联数据使用等方面。

各小组将在2019-11-1前向PCC主席提交最终报告,经PCC政策委员会或PCC指导委员会批准后,由LC工作人员按最终报告的建议,编写LC-PCC政策声明,在2019-12-6前将其纳入测试版RDA工具包的内容管理系统(为RSC预期2019年底正式启用新RDA作好准备)。最终报告和PCC政策委员会的决定将会发布到PCC网站上共享。

参见:

新RDA关于Aggregate(合集)的条款(2019-4-7)
RDA信息源升级版:数据出处(2018-12-8)
新RDA的“历时作品”(2019-5-22)
新RDA常见问题(RDA重构计划常见问题-2019更新版)(2019-8-15)
稳定版与原RDA相比有哪些变化?(2019-5-19)
RDA进展:3R计划预计2019年底完成(2018-12-1)
RDA进展:3R计划预计2019年底完成;RDA未来几个月的内容变化(来自2018 RSC年会)

美国国会图书馆免费开放中国珍本古籍数字收藏

美国国会图书馆(LC)上月上线“中国珍本古籍数字收藏”(Chinese Rare Book Digital Collection)。以下译自 About this Collection:
本数字收藏取自LC亚洲部的5,300种中国珍本书籍。目前上线演示包括约1,000种,最终完成将包含近2,000种。
对于“珍本图书”的定义,是依据2000年东亚图书馆理事会(CEAL)出版的“中国珍本书籍国际联合目录项目编目指南”,指1796年以前出版的中文印刷书籍和装订手稿。【1796年为嘉庆元年,即清乾隆年间为止】
本收藏包括LC亚洲部最有价值的品种和版本,其中一些可以追溯到11或12世纪,是世界上唯一的现存副本。本新数字收藏汇集了印刷书籍、抄本、佛经、手绘图片作品、地方志和古代地图。这些材料涵盖了经典、历史、地理、哲学和文学等众多学科和主题。大多数是明朝(1368-1644)和清初(1644-1795)的版本,有近30种是宋朝(960-1279)和元朝(1279-1368)的版本。
LC认识到本收藏作为研究前现代中国的主要资源的价值,与台湾中央图书馆合作将这些中国珍本书数字化。本收藏中丰富的资源将引起那些对前现代中国研究中的各种主题进行研究的人们的兴趣,包括当地历史、地理、政治、社会和经济生活、教育、农业和生物学。

在LC发布的新闻中,还有如下说明:该在线收藏反映了向本馆新的以用户为中心的战略规划目标的进步:扩大访问,为每个用户创造宝贵的体验,促进与本馆的终身联系。见:
Centuries of Rare Chinese Books Now Online at the Library of Congress: More Than 1,000 Items Reflect Chinese Literature and Global Influence (2019-5-6)

看LC的2019-2023年战略规划,标题就是“增强图书馆体验”(Enriching the Library Experience: The FY2019-2023 Strategic Plan of the Library of Congress)。

—— 使用初体验 ——
不懂古籍,纯从检索角度体验。
1、最早版本:1102年北宋版《大藏經 : 十三種》,崇寧藏零本,残损严重。
2、图像:可逐页下载不同尺寸的jpeg及tiff高清大图(无水印)。
3、元数据:除网页外,提供MARCXML、MODS、Dublin Core3种格式记录,另有LCCN永久链接(到LC联机目录、因此有MARC21格式),还有IIIF的Manifest (JSON/LD)。
4、检索:汉字要求完全一致,不支持繁间同检。繁体字难免一字多形,不确定时建议用拼音查——为免漏检,必须接受误检。
5、浏览:提供多种分面,包括:原件格式(图书、手稿)、日期(每百年)、位置(文献主题涉及的地理区域)、贡献者、主题、语种等。
由分面容易看出数据问题:
(1)日期:目前1800-1899有173种、1900-1999有33种,显然都不符合珍本定义。
是不是日期标注有误呢?可能有部分是。
(2)原件格式:竟然有2种期刊?
点进去看都是光绪年间的《京報》。不仅不符合“珍本”定义,还应该作为1种才对?原件因为装订还是年份不同的原因,2种尺寸略有差别。
(3)语种:除汉语外,有少量其他语种,实际上大约都应该是汉语。
如其中有Chagatai:5种。查为“察合台”,始建于1222年的蒙古汗国——应该不会有自己的语言吧?5种只有1种《醫說 : 十卷》日期近似(1224年),文字完全是汉字。

LC提供2500万书目记录免费批下载(附LC在Library.Link)

2017年5月,美国国会图书馆(LC)宣布免费提供2500万条书目记录批下载。时间段为1968-2014年,应该就是2014年前LC制作的所有MARC记录。很多年前LC的书目记录就可以通过Z39.50逐条获取,但批量数据以前是付费订购的。虽说“主要供研究与开发利用”(MARC Open-Access),但因为并未限制使用目的,估计很多书目服务商听到消息第一时间就去下载备用了。
根据LC网站的 MARC Distribution Services (data set) 网页上的FAQ说明,本次免费提供的数据截止到2013年12月,以后可能每年更新。订购数据则更及时,目前截止2015年12月底,同时提供每日、每周更新。
开放MARC数据的目的是希望书目数据得到原有目的之外的、更广泛的利用。LC采访与书目访问部主任Beacher Wiggins在报道中说:“为了更有效的信息分享、更方便可视化与其他不可预知的分析,我们希望社会科学家、数据分析师、开发者、统计学者及其他人在工作中使用数据,对大数据集做创新工作,强化新知识的学习与生成”。
via Fortune: The Library of Congress Just Made 25 Million Records Available for Free (2017-5-17)

——— Library.Link中的LC书目数据 ———
今天看到Library.Link中,对LC书目记录经关联数据转换后发布。LC宣布开放数据是2017-5-17,数据被载入Library.Link是2017-6-12,发布是2017-6-15,可谓反应迅速。不知道是不是最早的公开发布应用。
关于Library.Link,参见:2016 ALA年会BIBFRAME更新论坛(2016-8-27)

LOC.Library.Link
LC像其他加入Library.Link的图书馆一样,有一个主页。如果有帐号,可以看访问统计。
右栏是“资源”,即由MARC记录转化后的Bibfra.me类(共16个)及数量,字顺排列:
Agent 2338223
Collection 667912 (由相关题名字段转换而来?)
Concept 6546780
CopyrightEvent 564
Family 25860
Form 9336
Instance 12898932
Meeting 228118
Organization 1200225
Person 4891149
Place 634135
ProviderEvent 6005730
Series 958273
Temporal 8906
Topic 303503
Work 13649505

每次在新形态下看发布的书目数据,总不免看到一些原本埋没着不知道的原始数据错误,如以前看分面OPAC,现在看关联数据。选择“个人”随意浏览,本当为人名,但排序在前几页的都是非字母开头的(标点符号、数字),有些可能是非拉丁字母转化的字符问题,还有相当部分应该是原始数据有问题。
比如有个”16 juli 1993″,根据题名返回到LC目录查原记录,LCCN=94124897(https://lccn.loc.gov/94124897),果然有:
7001_ |a “16 juli 1993.”
本书1993年出版,可能把500误作700了。

接下来还有不少以冠词A起始的,很有意思,比如:A 1st class boy, A British officer, A Californian, A lady of this city …
比如:A lady of this city
LC目录中查到原记录LCCN=16009701(https://lccn.loc.gov/16009701)
245 04 $a The life of the beautiful and accomplished danseuse, Mademoiselle Fanny … $c … Selected and comp. by a lady of this city.
700 0# $a A lady of this city.
原来还有这样直接用题名页上称呼做个人名称检索点。