文献中个人资料的信度

领导布置为本校的“上海社科大师”写微信公众号文章,以响应上海市社会科学界联合会“礼赞上海社科大师”活动(参见:“礼赞上海社科大师”主题地铁专列,2018-05-23)。我对大师所在领域并不了解,如果为写而写,只能抄录已有资料,没多大意思,而且还会因为对原文的理解偏差而出错。如果作为搜集人物资料的结果,倒有可能发现与时代结合的亮点,写出来会更有可看性。当然,还有另外的理由。
这些社科大师都是名人,不乏评价介绍文章。但从查到的资料看,介绍文章中信息未必都准确,甚至某些可算得上第一手资料的亲历者回忆,也因年代久远记忆模糊而与事实不符。图书馆员不是领域专家,不可能写得比专家好。然而图书馆员坐拥日益丰富的全文数据库,又擅长查资料,应当修正可能的事实错误,并补充更丰富的信息——特别是由于时代原因曾被刻意省略的民国年间活动。

说到第一手资料,不免想到1980年代最流行的英语教科书《新概念英语》里,记者为统计非洲某国总统府台阶数量而身陷囹圄的故事(New Concept English, 第3册第5课:The facts)。因此,如果为资料信度排序的话,报刊上的活动报道可居前列,尤其是正规大报,绝对的第一手资料(小报有捕风捉影的可能)。比如《申报》中的消息(事前)和报道(事后)相当丰富,是了解民国年间人物活动、社会关系的绝佳来源。当然,报道中XXX博士之类的称呼,就不能作为是否获得博士学位的证据了。

事实类信息,以机构本身出版物为信度最高的资料。比如高校名录、年报,会有教职员名单、各级学生名单、当年毕业生名单、甚至校友名单(可确认毕业年份与学位)。当年《申报》上有不少任职信息,比如开学前后,报道某校聘定院长、系主任之类,通常也是可信的——在找不到机构本身出版物时,可作为信史。

对学术成就的评价,官方评奖的评语信度最高。比如本次“上海社科大师”名单下对各位的评语。
对本领域学术成就的评价,学会协会编写的出版物信度较高,尤其是周年庆出版物,通常不会因过度偏向某一个人而致事实出错。

个人回忆录或口述历史,我通常会放在第一手资料的最后。原因一是时间久远,一是情感偏向。
个人纪念文集中收录的纪念文章,通常属于个人回忆范畴,有时时间并不久远,但指向性太强,会有过誉风险。
名人集、名人录中收录的文章、条目,信度再低一级。因为不能确定作者是否真的了解所写名人,文章所据是否为第一手资料。

最后,如何发现事实错误?简单地说,不能只看纪念TA的文章——很多是抄来抄去的好嘛(如果我不查原始资料就写,我也只能抄)。要用全文搜索,查找提及TA的文章。浏览相关内容,会发现评价其他人时提及TA(比如纪念其他人)的文章,就可以比较评价的不同、事实的差异,发现进一步查找的线索。其实这通常是查评论报道文献时顺带的发现。
更辛苦的是,把报纸上有关TA的报道全部记录下来,然后发现根本没有很多文章中讲到的TA在某机构任职的任何信息。这个是特例,是个意外发现,如果作为经验总结的话,可以试着全文查:人名+机构名,也可以得出同样结论。但我其实在记录有关TA的报道的过程中,对TA有了全面的了解,写出了自以为很有可读性的介绍文章——当然这不是目的,我由这些报道作出了TA的社会关系云图,更期望能作出真正的社会关系图。

此为重拾文献检索之二。第一篇见:怎么查作者的英文姓名?(2019-1-10)

怎么查作者的英文姓名?

去年上海社联公布首批“上海社科大师”,本校有24人入选(向首批68位“上海社科大师”致敬!华东师大24位先生入选,2018-5-15)。年前本部门准备做一个专题库,开始分工搜集他们的资料。由此本人重新开始关注荒废已久的文献检索,此为第一篇。

——— 怎么查作者的英文姓名?———
看同事搜集萧孝嵘资料后写的介绍(将发表于馆微信公众号),萧孝嵘1919年毕业于上海圣约翰大学,1926年留学美国、1930年获得博士学位,在美国心理学刊物上发表过文章、得过奖,但介绍文中却没有文章或者期刊的英文原名——显然资料有重要缺漏。一问之下,她根本就不知道萧孝嵘英文姓名,也没有查过外文资料。
于是帮她做第一步,查萧孝嵘的英文姓名。

1、首先使用虚拟国际规范档VIAF),大多数出版过图书的人,图书馆会给Ta做一条规范记录,记录Ta的各种名称形式,VIAF就是多国规范记录的合集,一站式检索。用“萧孝嵘”查,VIAF有萧孝嵘的记录,共3种形式,德国国家图书馆(DNB)用的是汉语拼音,台湾用的是繁体汉字,Wikidata用的是简体汉字。点了Wikidata,没有英文名字。
2、接下来用“萧孝嵘”查谷歌/谷歌图书碰运气,看会不会正好有中英文同时出现(我先前搜集张耀翔资料时就这么好运),没有。
3、看来用中文查是走不通了,必须从英文入手。网上百科词条(如百度百科“萧孝嵘”)有一处英文看上去可以作为入口:“与导师一起创立至今仍负盛名的Harold Jones Child Study Center (柏克莱大学心理系儿童研究中心)”。Harold Jones显然是其导师姓名。查这个中心确实仍在,但无论中心网站还是维基百科词条Harold E. Jones Child Study Center,都没有出现与萧孝嵘姓名近似的人——无可否认,国内对名人的介绍常不免夸大其辞。
4、还是要走正常路:寻找萧孝嵘姓名的可能拼写法。民国年间,用韦氏音标的可能性很大。找出当年总结的“韦氏音标转换汉语拼音”(2005-2-3),拼出来是这样的:hsiao, hsiao jung
仍然谷歌。单查hsiao hsiao jung或hsiao jung hsiao查不到,用导师姓名Harold E. Jones + hsiao hsiao jung查,在若干个结果中,出现了 HSIAO, H. H. 和HSIAO, HSIAO H,很接近。最后是这个书目Bibliography on Mental and Physical Development,其中有他和导师合写或单写的论文,年代让我确认应该是萧孝嵘,实际拼写是:hsiao hsiao-hung。顺便也找出了他的2篇文章。
5、验证。用“hsiao hsiao hung”查谷歌,在谷歌图书上的学校出版物,确认萧孝嵘1919年毕业于圣约翰大学School of Chinese Literature and history。一举二得,完美的结果:
Catalogue of the Officers and Students of St. John’s University, September 1920-July 1921 …
St. John’s University (Shanghai, China), 1920. 第161页
Appendix G. Graduates from School of Chinese Literature and history
1919
……
萧孝嵘 Hsiao Hsiao-hung
……
6、博文写完待发,总觉得VIAF这里有点不对。再查一遍,点开第一个DNB记录
100 1 ‎‡a Xiao, Xiaorong‏ ‎‡d 1897-1963‏
400 0 ‎‡a Xiao Xiaorong‏ ‎‡d 1897-1963‏
400 0 ‎‡a Xiao Xiao rong‏ ‎‡d 1897-1963‏
400 1 ‎‡a Hsiao, Hsiao-hung‏ ‎‡d 1897-1963‏
400 1 ‎‡a Hsiao, Hsiao Hung‏ ‎‡d 1897-1963‏ ‎‡9 v:NUC pre 56‏
400 1 ‎‡a Hsiao, Hsiao-jung‏ ‎‡d 1897-1963‏
400 1 ‎‡9 U:Hans‏ ‎‡a 萧, 孝嵘‏ ‎‡d 1897-1963‏
400 1 ‎‡9 U:Hant‏ ‎‡a 蕭, 孝嶸‏ ‎‡d 1897-1963‏
400 0 ‎‡9 U:Hant‏ ‎‡a 蕭孝嶸‏ ‎‡d 1897-1963‏
一条完美的规范记录,包含汉语拼音、韦氏音标、实际使用名称、简体汉字、繁体汉字……。(台湾记录只有汉语拼音)
——其实只要第一步就可以!原来是找对了路径、没用对方法。

结论仍然是,查国人的英文姓名时,利用VIAF事半功倍:http://viaf.org

梁启超与历史统计学

近年兴盛的数字人文,在国际上早先曾称为人文计算。近日在查民国时期文献,不意发现吾国在当时也已有之。突出的例子就是1920年代梁启超提出的“历史统计学”(见后)。到1930年代,已有对“历史统计学”的研究:
杨成柏.历史统计学底根本问题.研究与批判,1935,1(1):75-78
朱谦之.史学与统计学.国立中山大学文学院专刊,1936,(3):33-73

两文介绍的研究论著大致相同(朱文含2译文),合并如下:
丁文江.历史人物与地理之关系.科学杂志,8(1)
梁启超.近代学风之地理的分布.清华学报,1(2)
朱君毅.现代中国人物之地理教育与职业的分布.心理,4(1)
朱君毅.中国历代人物之地理的分布.中华书局常识丛书第四十种,1932
张耀翔.中国人才产生地.心理杂志选存,第18篇
余天休.中国近三十年人物底分析.社会学刊,3(2)
禇绍唐.当代我国名人之地理的分布
桑原骘藏.由历史上观察的中国南北文化(原载东洋史论丛).文哲季刊,1(2)
亨丁顿.北中国与南中国(见:种族的品性).汉译:自然淘汰与中华民族性.[新月书店,1929]

—— 梁启超:历史统计学(摘录)——
1922年11月10日在南京东南大学史地学会讲演“历史统计学”【小标题本人添加】:
出处1:史统计学.史地学报,2(2):1-8
出处2:晨报副刊,1922-11-28:1-2;1922-11-29:1;1922-11-30:1-2

【名称来历】历史统计学,是用统计学的法则,拿数目字来整理史料推论史迹。这个名称,是我和几位朋友们杜撰的。严格的说:应该名为“史学上之统计的研究法”。因贪省便,姑用今名。但我们确信也是研究历史一种好方法,而且在中国史学界尤为相宜,我们正在那里陆续试验,成绩很是不坏。所以我愿意把我们所拟的方法介绍诸君,盼望多得些同志共同做去。
【目的】我们为什么想用这种方法研究历史呢?我们以为:欲知历史真相,决不能单看台面上几个大人物几桩大事件便算完结;最要的是看出全个社会的活动变化。全个社会的活动变化,要集积起来比较一番才能看见。往往有很小的事,平常人绝不注意者,一旦把他同类的全搜集起来,分别部居一研究,便可以发见出极新奇的现象而且发明出极有价值的原则。……
【举例:历史人物之地理分布】我多年想做一张表,将二十四史里头的人物分类:学者,文学家,政治家,军人,大盗,……等等,每人看他本传第一句“某某地方人也”;因此研究某个时代多产某种人,某人地方多产某种人、我这个计划曾经好几次和我的朋友丁文江先生谈起,他很赞成。后来他说:先且不必分类,只要把正史上有传的人的籍贯列下来再说。他自己便干起来了。现在还没有完全成功,只是把几个统一的朝代——汉唐宋明做成了,编出一张很有趣的“历史人物之地理分配表”如下:……
【想做而未能做的其他题目】现在请把我想做而未能做的题目,随便说几个请教诸君。
(一)我们试做一篇“历代战乱统计表”……根据这表研究他“为什么如此”,一定可以发明许多道理来。
(二)我们试做一篇“民族同化人物表”……此表若成,则于各外族同化程度及我们现在的中华民族所含成分如何,大概可以了解。
(三)我们试做一个“地方统治离合表”……有那么一张表,我们各地方进化退化之迹,自然有許多发明。
(四)我们试做一篇“历代著述统计表”……只把数目字列出,便可以知道某时代某种学问发达或衰落,某地方文化程度或高或低,或进化或退化。
(五)我们试做一篇“历代水旱统计表”……
像这种大大小小的统计题目,常常在我脑子里头转的,不下几十个。我也无暇细述,姑且举这五个不伦不类的讲讲。诸君举一反三,或者想出来的题目比我还多还好哩。