美国国会图书馆免费开放中国珍本古籍数字收藏

美国国会图书馆(LC)上月上线“中国珍本古籍数字收藏”(Chinese Rare Book Digital Collection)。以下译自 About this Collection:
本数字收藏取自LC亚洲部的5,300种中国珍本书籍。目前上线演示包括约1,000种,最终完成将包含近2,000种。
对于“珍本图书”的定义,是依据2000年东亚图书馆理事会(CEAL)出版的“中国珍本书籍国际联合目录项目编目指南”,指1796年以前出版的中文印刷书籍和装订手稿。【1796年为嘉庆元年,即清乾隆年间为止】
本收藏包括LC亚洲部最有价值的品种和版本,其中一些可以追溯到11或12世纪,是世界上唯一的现存副本。本新数字收藏汇集了印刷书籍、抄本、佛经、手绘图片作品、地方志和古代地图。这些材料涵盖了经典、历史、地理、哲学和文学等众多学科和主题。大多数是明朝(1368-1644)和清初(1644-1795)的版本,有近30种是宋朝(960-1279)和元朝(1279-1368)的版本。
LC认识到本收藏作为研究前现代中国的主要资源的价值,与台湾中央图书馆合作将这些中国珍本书数字化。本收藏中丰富的资源将引起那些对前现代中国研究中的各种主题进行研究的人们的兴趣,包括当地历史、地理、政治、社会和经济生活、教育、农业和生物学。

在LC发布的新闻中,还有如下说明:该在线收藏反映了向本馆新的以用户为中心的战略规划目标的进步:扩大访问,为每个用户创造宝贵的体验,促进与本馆的终身联系。见:
Centuries of Rare Chinese Books Now Online at the Library of Congress: More Than 1,000 Items Reflect Chinese Literature and Global Influence (2019-5-6)

看LC的2019-2023年战略规划,标题就是“增强图书馆体验”(Enriching the Library Experience: The FY2019-2023 Strategic Plan of the Library of Congress)。

—— 使用初体验 ——
不懂古籍,纯从检索角度体验。
1、最早版本:1102年北宋版《大藏經 : 十三種》,崇寧藏零本,残损严重。
2、图像:可逐页下载不同尺寸的jpeg及tiff高清大图(无水印)。
3、元数据:除网页外,提供MARCXML、MODS、Dublin Core3种格式记录,另有LCCN永久链接(到LC联机目录、因此有MARC21格式),还有IIIF的Manifest (JSON/LD)。
4、检索:汉字要求完全一致,不支持繁间同检。繁体字难免一字多形,不确定时建议用拼音查——为免漏检,必须接受误检。
5、浏览:提供多种分面,包括:原件格式(图书、手稿)、日期(每百年)、位置(文献主题涉及的地理区域)、贡献者、主题、语种等。
由分面容易看出数据问题:
(1)日期:目前1800-1899有173种、1900-1999有33种,显然都不符合珍本定义。
是不是日期标注有误呢?可能有部分是。
(2)原件格式:竟然有2种期刊?
点进去看都是光绪年间的《京報》。不仅不符合“珍本”定义,还应该作为1种才对?原件因为装订还是年份不同的原因,2种尺寸略有差别。
(3)语种:除汉语外,有少量其他语种,实际上大约都应该是汉语。
如其中有Chagatai:5种。查为“察合台”,始建于1222年的蒙古汗国——应该不会有自己的语言吧?5种只有1种《醫說 : 十卷》日期近似(1224年),文字完全是汉字。