美国国会图书馆免费开放中国珍本古籍数字收藏

美国国会图书馆(LC)上月上线“中国珍本古籍数字收藏”(Chinese Rare Book Digital Collection)。以下译自 About this Collection:
本数字收藏取自LC亚洲部的5,300种中国珍本书籍。目前上线演示包括约1,000种,最终完成将包含近2,000种。
对于“珍本图书”的定义,是依据2000年东亚图书馆理事会(CEAL)出版的“中国珍本书籍国际联合目录项目编目指南”,指1796年以前出版的中文印刷书籍和装订手稿。【1796年为嘉庆元年,即清乾隆年间为止】
本收藏包括LC亚洲部最有价值的品种和版本,其中一些可以追溯到11或12世纪,是世界上唯一的现存副本。本新数字收藏汇集了印刷书籍、抄本、佛经、手绘图片作品、地方志和古代地图。这些材料涵盖了经典、历史、地理、哲学和文学等众多学科和主题。大多数是明朝(1368-1644)和清初(1644-1795)的版本,有近30种是宋朝(960-1279)和元朝(1279-1368)的版本。
LC认识到本收藏作为研究前现代中国的主要资源的价值,与台湾中央图书馆合作将这些中国珍本书数字化。本收藏中丰富的资源将引起那些对前现代中国研究中的各种主题进行研究的人们的兴趣,包括当地历史、地理、政治、社会和经济生活、教育、农业和生物学。

在LC发布的新闻中,还有如下说明:该在线收藏反映了向本馆新的以用户为中心的战略规划目标的进步:扩大访问,为每个用户创造宝贵的体验,促进与本馆的终身联系。见:
Centuries of Rare Chinese Books Now Online at the Library of Congress: More Than 1,000 Items Reflect Chinese Literature and Global Influence (2019-5-6)

看LC的2019-2023年战略规划,标题就是“增强图书馆体验”(Enriching the Library Experience: The FY2019-2023 Strategic Plan of the Library of Congress)。

—— 使用初体验 ——
不懂古籍,纯从检索角度体验。
1、最早版本:1102年北宋版《大藏經 : 十三種》,崇寧藏零本,残损严重。
2、图像:可逐页下载不同尺寸的jpeg及tiff高清大图(无水印)。
3、元数据:除网页外,提供MARCXML、MODS、Dublin Core3种格式记录,另有LCCN永久链接(到LC联机目录、因此有MARC21格式),还有IIIF的Manifest (JSON/LD)。
4、检索:汉字要求完全一致,不支持繁间同检。繁体字难免一字多形,不确定时建议用拼音查——为免漏检,必须接受误检。
5、浏览:提供多种分面,包括:原件格式(图书、手稿)、日期(每百年)、位置(文献主题涉及的地理区域)、贡献者、主题、语种等。
由分面容易看出数据问题:
(1)日期:目前1800-1899有173种、1900-1999有33种,显然都不符合珍本定义。
是不是日期标注有误呢?可能有部分是。
(2)原件格式:竟然有2种期刊?
点进去看都是光绪年间的《京報》。不仅不符合“珍本”定义,还应该作为1种才对?原件因为装订还是年份不同的原因,2种尺寸略有差别。
(3)语种:除汉语外,有少量其他语种,实际上大约都应该是汉语。
如其中有Chagatai:5种。查为“察合台”,始建于1222年的蒙古汗国——应该不会有自己的语言吧?5种只有1种《醫說 : 十卷》日期近似(1224年),文字完全是汉字。

IFLA对用RDA进行珍稀资料编目的调查结果

看到IFLA做这个调查,有点奇怪,毕竟RDA并不是IFLA制订的标准:
IFLA Survey on Rare Materials Cataloguing with RDA (2019-2-25)

IFLA珍本及特藏部做的这个调查结果共有3个文件:1、简单报告;2、反馈分析;3、世界各地区比较。

先看反馈分析(第2个文件),9个饼图看起来很快。采用率很高(44%),有点意外,毕竟连美国国会图书馆(LC)都没用RDA做古籍。
看到最后一个问题:9.如果有一个国际的、IFLA背书的使用RDA编目珍稀资料建议集,你们会不会看齐?——原来珍本与特藏部是想做一个这样的建议。

再看按地区比较(第3个文件),就看了第1页六个饼图,亚洲采用率竟然高达57%,不禁对调查结论感到担忧——样本有代表性吗?有多少馆参加了调查?是不是使用馆更有兴趣回复?

最后看调查报告(第1个文件),快速扫一遍,抓到几个点:
1、调查时间2018.4.6-6.6。
2、调查语言英语。
3、信息在珍本及特藏部网站及博客发布,并联系IFLA各地区分部请求转发通知【为什么不在人气更高的IFLA-L邮件组发?】。
4、收到131个有效回复(其中亚洲7个)。
5、结论:(对第9个问题有60%正面回答)表明国际图联作为标准提供者的作用是有价值的,但是,国际图联可以对不属于自己的标准提出建议吗?珍本和特藏部正在致力于有关RDA对于珍稀资料的立场文件……

《古今图书集成》网络版

    《古今图书集成》可以在CADAL(大学数字图书馆国际合作计划)的“古籍”部分查到并公开访问全文,实为中华书局影印本。
    今天看到《中国索引》2010年(第8卷)第4期载文“《古今图书集成索引》网络版推出”(p.60),前往一观。
    广西大学古籍整理研究所的《古今图书集成·索引&全书图像》,不但可以公开访问全文图像,还可以通过索引定位内容。
    “網站所擁有的全書圖像來自對1934年中華書局武英殿本影印本的掃描,本站所使用的索引自1984年我們開始編製《古今圖書集成索引》起,經歷了油印本(1984年,80萬字,三大本)、印刷本(1988年,275萬字,中華書局和巴蜀書社出版)、電子版1.0版(1998年,1200萬字,金海灣電子音像出版社和廣西師範大學出版社聯合出版)、電子版2.0版(2007年,3800萬,光盤版,待出版;2009年網絡版)等四個階段。索引數據不斷擴充完善。”上述文章称2010年制成网络版,网站留言最早是2010年4月。
    真是四分之一世纪的用心之作!采用传统索引方式,除“经纬目录”外,“索引部分建立52个标目式多字段索引,合计1189013条记录,共38359673字”。52个索引分别对应于图表类、列传类、引书类、文学艺术类、天文类、历史古籍类、行政区划类、医药卫生类、经济类、生物类、宗教类,适合精确检索
    默认为繁体字版,输入简体字检索无结果;可切换到简化字版。查到后直接点击可看全文图像。
    试用后感觉应当引入一些现代元素。目前索引已有近4千万字,与全文1亿7千万字相比已在一个数量级上,如能配上全文检索,则可兼备查全与查准。退而求其次,也可不分索引类型,提供全字段检索,降低使用门槛、扩大用户范围,使没有很多古籍知识背景的人,也能从中《古今图书集成》这样的大型类书中挖掘出可资利用的资料。
    另:网上有台湾的《故宮東吳數位古今圖書集成》的演示版,故宫博物院与东吴大学合作出品,依据底本是“故宮典藏的雍正四年銅活字版掃瞄而得的五十四萬張圖檔”,“數位內文一億七千萬字”,演示版“放了《古今圖書集成·曆象彙編》四個分典,專供網路測試之用”。查询结果为当页文字,无图像。
    该产品由汉珍数位图书股份有限公司经销,据称“市面上已經有兩種類似產品,正向各單位兜銷中。甲產品出自我們委託代工輸入的公司,再多辯解,也無法避免侵犯我們權益之嫌。乙公司的資料購自大陸盜賣我們的資料,缺字與圖像都沒有就上市。”确实也查到另两家产品。明明是岛内问题,怎么也扯上大陆?
    据维基百科“古今图书集成”条目:
⊙本書編成後,於雍正四至六年(1726年至1728年)由清內府用銅活字排印成64部(未計試印本樣本1套),稱「銅字版」,至今僅存十餘部,在國家圖書館與台灣故宮博物館皆有藏。
⊙民國23年(1934年)上海中華書局據康有為所藏雍正銅活字本影印之縮印線裝裝訂808冊(後8冊為考證),稱「中華版」,於1940年出齊,是迄今最通行之版本。
⊙1999年起該全書在台灣以雍正銅字版(書藏故宮博物館)為藍本製作電子化版本(由東吳大學中文系負責)出售。
———-《中国索引》的分割线———-
中国索引学会网站有历年《中国索引》OA(发布略有延迟,目前最新为2010年第1期)。