初试“中国地方志数据库”(华中师范大学中国农村研究院)

2019年4月19日,华中师范大学政治科学高等研究院/中国农村研究院召开新闻发布会,收录量达31483册,计82735卷的“中国地方志数据库”(网址:http://lcd.ccnu.edu.cn)正式向社会开放。
via微信公众号“华中师范大学中国农村研究院”:一库知古今!中国地方志数据库正式上线开放(2019-4-19)

看到此消息,关心两点:一是全文的版权与使用,一是数据与功能。

—— 中国地方志数据库:版权与使用 ——
网站首页底下“使用声明”提供了版权相关说明:
“3、本数据库为我们购买、获赠,以及从网上公开渠道下载的数据汇集,任何单位或个人认为本数据库中的内容侵犯其知识产权,请及时向本数据库提出书面权利通知,并提供身份证明、权属证明及详细侵权情况证明。本数据库在收到上述法律文件后,将会依法尽快修改或者删除相关内容。”——感觉比较霸气,也许本身很有底气吧。
另外摘要“帮助”页面中常见问题,可了解其使用模式:
注册:……需要填写用户名称、真实姓名、密码、手机号、邮箱、出生年月、所在地区、学历、行业、所在单位,并通过手机验证码进行有效性验证……
积分:获取积分有两种途径,第一种是为我们捐献地方志获取积分。第二种是购买积分,该方式暂未开放。……
捐赠:第一步,捐赠之前您首先需要登录账号。 第二步,点击上面的“捐赠”按钮。第三步,您需要完善要捐献的地方志信息,并添加地方志,点击提交即可。特别说明:稀缺的地方志最多可以获得100分的积分。
下载:下载之前您需要获取积分,下载分为整本下载和分页下载,目前下载功能暂不开放。……每1积分可以下载10页地方志……

—— 中国地方志数据库:功能与数据 ——
关于数据库的功能与数据,由于没有注册、登录,只是表面浏览了一下。
地方志”页面:中间搜索框+查询结果,左栏分面限定、右栏统计
1、静态信息
首页提示:82736卷
左栏分面:
-地区级(全国、省、市、县、乡、村)
-年代层级(明代及以前、清、民国、1949年以后)
-地区名称(西南、西北、华南、华北、华中、华东、东北)
-分类(部门志、专业志、地方志、其他)
右栏统计
按年代统计:明代及以前4696,清38607,民国14786,1949年以后20086【合计78175】
按地区统计:山东7097,浙江6120,河南5781,江苏5729,河北4436【仅列前5】
【提示卷数82736与按年代统计的合计数量78175不符,原因?】

2、查询结果
分别选择年代分面:明代及以前1771,清29840,民国4
从结果清单看,其数量应该是书目种数,如此可以解释这里的数量与前述“右栏统计”的明显差距。但民国的数量差距过大,数据显然存在问题。
种与册在书目中时常是个问题,按新闻稿这里还涉及“卷”,数据统计恐怕更麻烦。比如《[万历]韩城县志八卷》有2条记录(卷一至卷四、卷五至卷八),通常意味着会算成2种,恐怕也是2册,但有8卷。

未注册无法查看详细的元数据,此点似乎不尽合理(点击“查看”提示:“出于对版权保护,地方志需要登录方可查看”),或许并没有更详细的元数据显示?不过仅目前的显示,也可看到4条民国记录中的2条元数据存在问题
其1:黄陂县地名志-黄陂县地名领导小组-1981年11月
年份:民国四年(从标题的责任者和年份都可以判断此信息有误)
其4:黄南藏族自治州概况
年份:民国四年;省份:西藏自治区(“自治州”应当是1949年以后的产物,并且黄南属于青海)
另外一条《民国邹平县志》也是“民国四年”,不知道此年有什么特别?查了下,《民国邹平县志》在不少收藏馆都是民国3年版。

题外感想:书目数据的质量,平时少人关注。做得好理所当然,做得不好也不大有感觉。只是当需要数据发挥作用时,问题就全显现了。