“明清妇女著作”数据库初探

今天加拿大麦吉尔大学东亚学系方秀洁(Grace S. Fong)教授来本馆介绍她主持的“明清妇女著作”数据库(MQWW), 她的2个学生介绍如何使用该数据库进行相关研究。
为参会做准备,昨晚今晨先探索了一番MQWW网站。以下结合个人使用及会上信息,对MQWW做简单概述。

明清妇女著作 = Ming Qing Women’s Writings
本数据库收录明清时期刊刻的女性诗歌及其他写作
合作图书馆】方教授从胡文楷《历代妇女著作考》中著录的4千余种作品起步,寻找明清时期妇女著作。据估计明清时期刊刻作品近5千种、存世约1/4(千余种),大多收藏在各图书馆的古籍部。因此从2003年起方教授与哈佛燕京图书馆合作扫描相关文献,并培训学生进行元数据著录,MQWW网站2005年上线。之后陆续与北京大学图书馆中山大学图书馆中国国家图书馆合作扫描文献,最新合作馆是华东师范大学图书馆香港中文大学图书馆,合计共6所合作图书馆。

收录数量】著作342部(近存世的1/3)、扫描图像5.5万余页,含诗词5.7万余、文1.8万余。由于收录的是明清时期“刊刻”的作品,因此本库内容范围并不限于明清时代,有少量早至周秦的各时期古代女性作品(比如虞姬有《和垓下歌》5种,据说还有西王母)。目前收录女性5028,还有男性1706——通常是作品集的前言后记、传记、编者评论等相关作者。

更新与元数据下载利用】每年12月更新,并提供元数据下载(Access格式)。下载数据包括:作品集信息(work, subwork)、单篇信息(poem)、作者信息(poet)、地区 (region)、朝代年号干支(cycle)、胡文楷《历代妇女著作考》收录作品(huwenkai)等,可用于数据挖掘。
方教授提示可结合ArcGIS显示地理分布,利用Gephi或SPSS做社会网络分析,并介绍她的一篇文章,以广东地区的别集为对象,利用Pajek可视化软件,揭示诗集中的序、同刊等展现的社会关系。

外链】查找到作品或人物后,会提供更多到外部数据库的链接。
对作品,本库提供扫描图像,也提供中國哲學書電子化計劃的全文链接。
对作者,本库提供到哈佛《中国传记数据库》(CBDB)的传记信息链接,点击后在弹出窗口显示。
本库的作者信息收录在CBDB中。由于女性传记在其他来源中少见,因此本库到CBDB的链接大多是本身提供出去的信息。但也有其他来源的,如:丘逢甲(是位男士)。
对链接依据很感兴趣,据说是由CBDB提供的,具体情况不详。刚才查到“虞姬”,发现弹出的是“虞汲”,再看URL:https://cbdb.fas.harvard.edu/cbdbapi/person.php?name=Yu%20ji,不禁哑然。再仔细看,原来CBDB提供了人名拼音相同的一系列ID,于是把所列40多个ID点了一遍,没有找到!再给一个在CBDB没有结果的例子“德宗宮人”,直接告诉你:No result.
据称MQWW提供给CBDB的数据近年没有同步更新(加入CBDB时由人工干预消歧)。不知道为什么CBDB上显示MQWW提供的传记数量是8300,而MQWW本身只有6918(最大ID也仅7614)。

检索与浏览】提供丰富的查找入口,包括各种途径浏览与检索。常见的人名、书名、关键词之外,还有地名、年代、婚姻……
地名浏览:上层(历史地名)会列出当时的下属地名,比如“江蘇(清)”包括上海及现属上海的县。我很感觉兴趣的是如何做的,包括历史地名对应现地名,可惜方教授说这部分做得很不好……。
年代浏览:提供朝代年号和干支浏览。清单在下载数据库的cycle表中,可以直接利用。
婚姻状态:原以为无非单身已婚。本着所有功能全看一遍的想法点进去,结果大大出乎意料,竟然有数十种(以下未含明显有误的“清”“清末民初”和用“、”分隔的其他2个):
不明、其他、后、女冠、妃、妃﹐女冠、妓、妓﹐女冠、妓﹐妾、妓﹐妾﹐尼、妓﹐尼、妓﹐正室、妾、妾﹐女冠、妾﹐寡婦、妾﹐尼、婢、婢﹐妾、宮女、宮女﹐女冠、宮女﹐妾、宮女﹐尼、宮女﹐正室、寡婦、尼、未嫁、正室、正室﹐后、正室﹐女冠、正室﹐寡婦、正室﹐寡婦﹐尼、正室﹐尼、皇后、繼室、繼室﹐寡婦、 继室、聘妾、聘室、貞女
其中有些是两种甚至三种状态的组合——好奇是先组(预先确定)还是后组(重复字段录入),看了录入单,似乎是后者。

联合国出版物的开放获取问题

2017年10月美国、以色列宣布退出UNESCO,国际图联(IFLA)即时发表声明《教育、科学和文化: 共同的目标需要共同的努力》:
Education, Science and Culture: Shared Objectives Need Shared Effort
声明并无实质性内容,只是“鼓励各方共同努力,寻求一个积极的解决办法”,颇有点吾国官方声明的风格。

在IFLA-L邮件组中,加州大学伯克利分校图书馆的Jim Church在对美国退出表示道歉的同时,提出了联合国出版物的开放获取问题,认为IFLA更应该就此发表声明(Re: [IFLA-L] IFLA Statement on Countries Announcing their Intention to Leave UNESCO):我也希望IFLA就“联合国信息与托存图书馆”问题作出声明。联合国尽管在《可持续发展目标》对获取信息作出承诺,但寻求通过与OECD的商业协议及基于订购的iLibrary,阻碍其出版物的开放获取。我敦促IFLA也就此问题发布公开声明,如同美国图书馆协会(ALA)作出的《关于恢复联合国托存图书馆系统的决议》。

看来是联合国出版物以数字形式原生出版以后,需要通过iLibrary订购提供,原来在136个国家的365个联合国托存图书馆,无法免费获取联合国出版物并向公众提供服务,这显然是一个巨大的倒退。ALA基于图书馆界的责任感,提出了解决方案,看来并无效果,因而期待IFLA出马。
中国有不少联合国文献托存馆,大致查了下,包括国家图书馆、上海图书馆、重庆图书馆、武汉大学图书馆、辽宁大学图书馆等,不知现况如何。

相关链接:
联合国图书馆(DHL, Dag Hammersköld Library
联合国数字存储库(DAG Repository)(建设中,目前含联合国官方文件的子集,联合国出版物的子集等,不完整)
联合国数字图书馆(UN Digital Library)(收录范围不详,可下载)
联合国iLibrary(UN iLibrary)(需订购)
UNESCO出版物(UNESCO Publishing)(付费购买)

———ALA《关于恢复联合国托存图书馆系统的决议》———
Resolution on the Restoration of the United Nations Depository Library System
2016年6月ALA理事会通过的上述决议,决议援引联合国文件,说明恢复托存图书馆项目的必要性。并提出如下5个方面建议:

美国图书馆协会(ALA)代表其成员敦促联合国采取步骤,确保通过下列方式,长期公平地获得其信息产品:
1、对世界上因特网上网费用太高且未得到广泛发展地区的国家,恢复印刷托存图书馆项目,从而确保在全世界范围内透明和随时获得联合国信息,并继续开展这一与其在线平台即联合国 iLibrary 和联合国数字储存库平行的项目;
2、为联合国托存图书馆项目提供免费访问 iLibrary 的机会,以确保联合国所有成员国平等地获取……
3、遵守托存图书馆2014年6月提交给联合国新闻部的就《咨询文件》提出的建议,及发表于《关于重新设计联合国托存图书馆项目的咨询文件的回应分析》之执行摘要,托存图书馆“从 DHL 接收全面综合服务,包括通过数字储存库分发有关的有偿/无偿出版物和文件”,包括执行和遵守数字保护政策,并考虑推迟联合国 iLibrary,以便与相应的利益攸关者(即DHL和联合国托存图书馆(UNDLs)进行协商;
4、鼓励联合国托存图书馆项目、联合国出版物和联合国新闻部充分合作和交流, 以确保尽可能广泛地查阅联合国文件和出版物;
5、尊重现有的联合国政策,其中规定”联合国出版物委员会根据DHL馆长的意见,并考虑到有关政府的意见,指定托存图书馆“(联合国文件:ST/AI/I89/Add.11/Rev. 2),任命一个工作小组研究这些问题,由DHL、出版物委员会和托存图书馆的代表组成。

BIBFRAME 2.0实施注册新增项目(附:意大利SHARE目录)

时隔三月,再去看 BIBFRAME 2.0实施注册(2017-4-26),新增了4项,按先后顺序,分别是:
BIBFRAME 2.0 Implementation Register
(4)2017-5-9 更新:Colorado College – Colorado Alliance of Research Libraries BIBCAT Pilot
美国的科罗拉多学院也是BF1.0实施注册者,2014-2-7有应用TIGER Web Catalog & Flask-BIBFRAME Extension
此次是科罗拉多研究图书馆联盟与厂商KnowledgeLinks.io合作的BIBCAT试验项目,从目录中随机抽取16万条MARC记录,是BIBFRAME与Schema.org的结合体,具体没看明白。源代码:https://github.com/KnowledgeLinks/alliance-bibcat
项目网址:bibcat.org,2017夏发布2.0版(目前显示升级中)。

(5)2017-6-7更新:Ex Libris, Alma
参见:艾利贝斯与哈佛图书馆合作开启“BIBFRAME路线图”(2017-5-12)

(6)2017-7-10入档:Library of the Hungarian National Museum
参见:匈牙利国家博物馆图书馆目录以BIBFRAME发布(2017-5-21)

(7)2017-7-20入档:@CULT – SHARE Catalogue in Linked Data
意大利 @CULT公司开发的7所大学的目录门户 SHARE — Scholarly Heritage and Access to Research,包含200万书目记录、34万规范记录 ,采用BIBFRAME词表的关联数据发布。不过预设的BIBFRAME导出/显示尚未提供(详见下)。
@CULT是位于罗马的系统厂商,近年也致力于语义网/关联数据应用。上述匈牙利国家博物馆图书馆目录项目中,@CULT承担数据转换与链接。

——— SHARE目录 ———
未来图书馆目录界面会是如何?SHARE有点与众不同,在界面上体现BIBFRAME的三层实体:
1、个人/作品
提供从作者(包括人名、团体、会议)或作品题名查找资源,有输入逐步提示功能。首页有SHARE目录简介,最下面的User Guide详解各种用法。
亮点在其结果显示页,也最能体现关联数据的作用。

– 查作者,进入作者页,显示作者个人信息,以及其作品。(如:Hamilton, Richard
中间是作者(可能有头像),下面连接其作品。
左侧上部是各种规范数据的链接:ISNI 国际标准名称标识符、Wikidata、美国国会图书馆、法国国家图书馆、VIAF 虚拟国际规范档。可链接到相应来源。
左侧下部是维基百科词条。
右侧是个人名称的不同形式(应该是通过左侧的规范数据对不同形式的名称做了合并处理,但并未强制做形式的统一)。和名称一样,可点击进入目录结果页。
右上部有三个输出选项(本页的所有信息):下载BIBFRAME、打印、发邮件。遗憾的是设定为.ttl格式的BIBFRAME文件为空。
该作者的作品列表在网页下部(不在截屏内),点击放大镜进入作品页(见下),点击题名进入目录结果页——特别注意是按“作品”汇集的,可能对应多个出版物(实例)。
SHARE目录-Person

– 查作品,进入作品页,显示作品以及其创作者。点击作品进入目录结果页。 (如:Choes and Anthesteria
左侧是出版物,可直接链接到各条书目记录(出版物/实例),小图标为收藏机构。
网页下部的创作者,点击放大镜进入作者页(见上),点击作者名进入目录结果页。
SHARE目录-Work

2、出版物(实例)
这是主界面,与单个输入框检索的流行方式类似:既可同时查题名、名称、主题,也可分别查,并对选择检索结果排序。另外有高级检索,不同检索途径组合之外,还可选择日期、文献类型(格式)、语言、书目层次(专著/连续)、出版国、收藏馆作限定。
检索之外,还提供按文献类型的浏览方式,方式是点击主界面下部的7个文献类型图标。结果页右侧有大量分面可供限定范围:格式、书目层次、作者、作品、出版社、语言、日期范围、出版日期、主题(个人、团体、会议、地理、论题、体裁/形式)。
出版物/实体现在检索结果的详细页,Info标签部分,可选择按MARC格式或BIBFRMAE显示——遗憾的是目前BF显示为空。

3、单件
作为多机构目录门户,在检索结果的详细页,Copy data标签,显示的即为单件,有链接到各机构OPAC。