数字人文奖:2012-2017年

前一阵在数字人文微信群中看到2017数字人文奖投票中(要翻墙),今天看到已经揭晓。顺链接去看网站:
Digital Humanities Awards: Highlighting Resources in Digital Humanities
本数字人文(DH)奖为年度奖,始于2012年。如副题所称,主要突出数字人文资源。目前设5个类别,每个均评出冠亚季军,并列出所有提名项目及链接【以下中译只求形式一致、语法混乱勿介意】:
Best Use of DH For Fun 最好玩【2017年冠军:Cancionero Escolar
Best DH Data Visualization 最好看【2017年冠军:Mapping Islamophobia: Visualizing Islamophobia and Its Effects
Best Use of DH For Public Engagement 最好友【2017年冠军:Imágenes y Relatos de un Viaje Por Colombia
Best DH Tool or Suite of Tools 最好用【2017年冠军:Checklist for Digital Humanities Projects
Best DH Blog Post or Series of Posts 最好文【2017年冠军:The Programming Historian en español
本奖为纯民间奖项,不设奖金。候选项目/资源/博文完全由公众提名,也由公众投票决定结果。创始人James Cummings(牛津大学)为首的国际提名委员会由英国、美国、法国、日本、墨西哥5个国家的5名成员组成,其作用是确认提名项目/资源/博文符合3个基本条件:
1、是否数字人文
2、是否在正确的类别(可能移到更合适的类别)
3、是否当年推出/发布/主要更新
网站称“这些奖项旨在作为一项提高认识的活动,帮助把有趣的DH资源置于聚光灯下,并让DH用户(和普通公众)参与社区工作”。确实是个吸引眼球、增加曝光率的活动。
网站上历年奖项信息不但是个很好的信息源,也可供了解DH发展中的一些信息,特别是从一些统计信息。
2012年仅在奖项结果页中有每个类别的投票数量,此后每年都有专门的统计页,包括提名项目数,投票数量及投票者性别、国别统计。以下为除国别外的2012-2017年统计数据汇总:
年份
提名数-入选数(其中博文数)
投票数-有效票
女性(投票-提名)
男性(投票-提名)
其他(投票-提名)
2012
? – 63 (17)
按类别最高3161
2013
? – 58 (10)
1704 – 1644
490 – 24
339 – 39
5 – 1
2014
93 – 78 (15)
2162 – 2117
676 – 31
676 – 47
14 – 0
2015
140 – 54 (14)
1922 – 1862
723 – 68
770 – 50
5 – 0 / 未答364- 22
2016
77 – 47 (4)
1726 – 1652
841 – 25
588 – 22
3 – 0 / 未答220 – 0
2017
59 – 48 (4)
4130 – 4069
1725 – 24
1276 – 19
(略)
注:(1)2012-2013年入选数根据结果或提名页计数;(2)2017年性别选项除男性/女性外多达二十余种
几个印象:
1、总体上女性参与度高于男性(2015年除外),男性前几年提名热情高于女性。不知道是不是反映研究者群体数量;
2、参与度不稳定,但2017年投票数量激增;
3、投票数可以表明参与DH的热度,但入选数近两年几乎是最低的(即使去掉博文数量也较前3年低),说明新项目不多。

学术报告“另一个视界”与上图数字人文项目

出于对可视化的兴趣,周五(2017.8.11)去上海图书馆听学术报告。感谢上图开放学术资源让大家共享。

另一个视界:清华大学美术学院向帆副教授和朱舜山工程师学术讲座

会议通知中推荐的报告人微信公众号文章:
《数据追问-全国美展油画作品视觉化解读》
《我是不是有点皇亲国戚?》

报告安排在下午。可惜我在开讲没多久,就因收到私事信息急需处理,差不多一半时间在边听边开小差上网中。所幸前一晚先做了点功课,看过两位报告人的网站Z Lab,特别是其中的 Projects 板块,还能勉强跟上所讲内容。Z Lab网站共有11个项目(没有上述利用CBDB数据的家谱图),看过感觉一是可视化效果很酷炫(如微博地点钟的24小时);二是可视化设计也被作为一种实用的研究辅助工具(如热带森林数据可视化)。
本次报告涉及了Z Lab网站半数以上项目,听现场讲述比看介绍生动很多,尤其对“为什么会这么做”的解释,光看介绍是获取不到的。向帆老师把她的项目定位为现代艺术作品,而不是数字人文(或其他),至于被其他人用作分析工具,也被她视为作品的一部分,全国美展获奖作品分析就是一个典型例子。我的感觉,比如在CBDB家族谱系图、热带森林数据等,可视化应该更多是作为工具。当然由于向老师的美术背景,或许在设计时是作为艺术创作看待的。
问答阶段,向老师提到她也做了不少文本挖掘项目,比如张爱玲、海明威……,数字人文无疑。
听完比较“失望”的是,那些酷炫的效果,大多是朱舜山老师用代码写出来的,没有利用太多工具。视觉设计不易,实现也不具有可复制性。因此,只能是艺术品?两位老师珠联璧合,看得出在性格上也属互补型的。

——— 上海图书馆数字人文项目介绍 ———
当天上午是内部的上海图书馆数字人文项目介绍,希望请两位老师帮助改善可视化界面设计。
刘炜副馆长开场,夏翠娟做总体介绍,上图目前共有7个相关项目:1中国家谱总目(华人家谱总目——上海图书馆家谱知识服务平台),2盛宣怀档案,3名人手稿(上海图书馆名人手稿),4中文古籍联合目录及循证平台,5规范库(含人名、中国历史纪年、地理名词表、收藏机构名录等),6书目库,7上海历史文化时空再造——武康路。其中1、3、4、7后续由各自项目主管(抱歉没听清姓名)做详细演示,尤其是可视化部分。
向老师在看到名人手稿部分时指出:一般的可视化(饼图柱图之类),掩盖了最最让人感动的部分。——话说得没错,只不过图书馆是整理资料的,就像朱老师在整理全国美展获奖作品基础资料时所说的somebody:Somebody has to do the dirty work. 面对海量文献中充满个性化的内容,要当作艺术作品来创作,真的会使项目没有截止期的。
向老师问得最多的问题是:应用场景,用户需求。——或者说用例、故事,确实是需要首先考虑,也是当前图书馆做项目需要强调的,比如最近LD4社群“调和与实体解析工作组”正在征求用例(关联数据的“调和”与“解析”) 。
与邻座tsingove交换意见,作为基础设施的话,有时可能并不针对特定场景(当然那也是场景),提供数据就好,至于怎么用,留给第三方来开发。上图接连两年举办的关联数据竞赛,就是这种设想的体现。夏MM也解释,如古籍系统的某些预设应用,也是咨询过馆内领域专家的,是作为示范,让研究者了解数据可能怎么用,进而提出更多应用场景。
上午会议结束时,Keven总结数字人文项目中三方的角色:图书馆员作为领域专家与计算机开发者之间的桥梁。朱老师补充:要加上第四方设计师,了解用户体验。

“数字人文:大数据时代人文研究前沿与探索”学术研讨会

“数字人文:大数据时代人文研究前沿与探索”学术研讨会:2017.7.1-2 南京大学

周末两天,有幸通过网络收看本次研讨会。会议内容相当丰富,30多个报告,既有介绍工具、开阔眼界的,也有各种应用、有的令人脑洞大开。
直播视频流畅,现场感强,手机随时截屏、比现场拍照还方便。可惜因各种俗务在外奔波,只看了约1/3的报告——看过的几个报告简单笔记附后。
总体观感:
1、数据库仍是必须的基础,但仅仅有数据库是不够的。
2、数字人文两大利器:GIS、可视化。
3、在CBDB、CHGIS的感召下,合作、开放越来越成为一种潮流,像是迟到的春天终于要来了。

——— 报告笔记 ———
主题演讲:
Peter Bol(哈佛大学), Making Conceptual Leaps and Finding the Right Tools
包弼德教授用流利的中文讲工具的重要性,及各种工具介绍。
项洁(台湾大学),数字人文的能与不能
报告标题改为“从取用到分析,从群体到个人:数位人文的演进思考”。台湾的“数位典藏与数位人文国际演讨会”今年将举办第8届了。介绍台湾历史数位图书馆THDL,提供给学者的数字人文研究工具DocuSky,及应用案例。
– 范毅军(台湾中研院),地理資訊與空間人文─建構虛擬時空框架的設想、具體實踐與應用
(只看了开头)

数字史学的方法与案例:
舒健(上海大学),民国天主教期刊出版状况初探——基于汉语基督教书目文献数据库的研究
书目元数据的挖掘。书目元数据当然也是可以挖掘的。
邱伟云(山东大学),词汇、概念、话语:数字人文视野下中国近代“未来”观的建构与再现
来自台湾的邱伟去,介绍近代报刊全文中“未来”一词的变化与同现词分析。略为简单,比如没有考虑到UU毕业论文中涉及的词语可能的含义变迁。“未来”或许含义比较单一,其他词则未必。
曹志红(中国科学院大学),徘徊于传统史学与数字史学之间的中国历史动物研究:以华南虎为例
“虎”在历史文献中的不同视角,自然的、社会的甚至药物的,以及地理分布。非常有意思的研究。
王哲(上海财经大学)、马欢(复旦大学),近代海关数据的整理与旧海关生态圈的初步构想
英国人积累下的中国海关数据,丰富而复杂。也是一项大的基础工程。

历史地理信息系统(HGIS)(下)
潘威、小林雄河(陕西师范大学),东亚历史台风信息系统建设与近三百年东亚台风活动研究的进展
中日韩朝台风数据。
朱本军(北京大学),GIS与战国历史地理研究
用地理地形数据分析历史地名的位置。
胡恒 (中国人民大学),GIS所见“冲繁疲难”与清代政治地理格局初探——兼核验《缙绅录》中相关数据的准确性
清代为行政区给的4种标签“冲繁疲难”,地理分布特征。
陈刚(南京大学),南京城市古旧地图数据库设计及历史城市形态学研究
南京古地图出版,用地图做了不少有意思的研究。接下来要做的是地图的数字化:只看到地图元数据层面的设计,似乎还没有深入到地图本身。
徐永明、唐云芝(浙江大学),《全元诗》作者的地理分布的可视化呈现
报告标题改为“数字人文与我的古代文学研究”,介绍工具,以及《全元诗》外更多研究。
程星华、胡迪、刘龙雨等(南京师范大学),面向公众的三国历史WebGIS的设计与实现
报告人是南京师范大学地理学的本科生,游戏化的三国历史GIS,很有意思。