学术报告“另一个视界”与上图数字人文项目

出于对可视化的兴趣,周五(2017.8.11)去上海图书馆听学术报告。感谢上图开放学术资源让大家共享。

另一个视界:清华大学美术学院向帆副教授和朱舜山工程师学术讲座

会议通知中推荐的报告人微信公众号文章:
《数据追问-全国美展油画作品视觉化解读》
《我是不是有点皇亲国戚?》

报告安排在下午。可惜我在开讲没多久,就因收到私事信息急需处理,差不多一半时间在边听边开小差上网中。所幸前一晚先做了点功课,看过两位报告人的网站Z Lab,特别是其中的 Projects 板块,还能勉强跟上所讲内容。Z Lab网站共有11个项目(没有上述利用CBDB数据的家谱图),看过感觉一是可视化效果很酷炫(如微博地点钟的24小时);二是可视化设计也被作为一种实用的研究辅助工具(如热带森林数据可视化)。
本次报告涉及了Z Lab网站半数以上项目,听现场讲述比看介绍生动很多,尤其对“为什么会这么做”的解释,光看介绍是获取不到的。向帆老师把她的项目定位为现代艺术作品,而不是数字人文(或其他),至于被其他人用作分析工具,也被她视为作品的一部分,全国美展获奖作品分析就是一个典型例子。我的感觉,比如在CBDB家族谱系图、热带森林数据等,可视化应该更多是作为工具。当然由于向老师的美术背景,或许在设计时是作为艺术创作看待的。
问答阶段,向老师提到她也做了不少文本挖掘项目,比如张爱玲、海明威……,数字人文无疑。
听完比较“失望”的是,那些酷炫的效果,大多是朱舜山老师用代码写出来的,没有利用太多工具。视觉设计不易,实现也不具有可复制性。因此,只能是艺术品?两位老师珠联璧合,看得出在性格上也属互补型的。

——— 上海图书馆数字人文项目介绍 ———
当天上午是内部的上海图书馆数字人文项目介绍,希望请两位老师帮助改善可视化界面设计。
刘炜副馆长开场,夏翠娟做总体介绍,上图目前共有7个相关项目:1中国家谱总目(华人家谱总目——上海图书馆家谱知识服务平台),2盛宣怀档案,3名人手稿(上海图书馆名人手稿),4中文古籍联合目录及循证平台,5规范库(含人名、中国历史纪年、地理名词表、收藏机构名录等),6书目库,7上海历史文化时空再造——武康路。其中1、3、4、7后续由各自项目主管(抱歉没听清姓名)做详细演示,尤其是可视化部分。
向老师在看到名人手稿部分时指出:一般的可视化(饼图柱图之类),掩盖了最最让人感动的部分。——话说得没错,只不过图书馆是整理资料的,就像朱老师在整理全国美展获奖作品基础资料时所说的somebody:Somebody has to do the dirty work. 面对海量文献中充满个性化的内容,要当作艺术作品来创作,真的会使项目没有截止期的。
向老师问得最多的问题是:应用场景,用户需求。——或者说用例、故事,确实是需要首先考虑,也是当前图书馆做项目需要强调的,比如最近LD4社群“调和与实体解析工作组”正在征求用例(关联数据的“调和”与“解析”) 。
与邻座tsingove交换意见,作为基础设施的话,有时可能并不针对特定场景(当然那也是场景),提供数据就好,至于怎么用,留给第三方来开发。上图接连两年举办的关联数据竞赛,就是这种设想的体现。夏MM也解释,如古籍系统的某些预设应用,也是咨询过馆内领域专家的,是作为示范,让研究者了解数据可能怎么用,进而提出更多应用场景。
上午会议结束时,Keven总结数字人文项目中三方的角色:图书馆员作为领域专家与计算机开发者之间的桥梁。朱老师补充:要加上第四方设计师,了解用户体验。

D-Lib Magazine停刊:一个时代的终结

D-Lib Magazine最新期 July/August2017(v.23, no.7/8)发表编者按:The End of an Era,宣布本期(第265期)后停止正常出版。
D-Lib可说是本学科最有影响力的开放获取电子期刊。创刊于距今整整22年的1995年7月,在当年无疑是激进之举。准月刊(有时双月合刊),定期在网上发布,累计发表文章过千(不包括短文)。
对于停刊,编者Laurence Lannom说明的理由有三:财务支持减弱,高质投稿量文章减少,“数字图书馆”一词从听着是创新到变得有点多余。因而“是时候功成身退了”。最后一个理由恐怕在前几年就已经日益明显。

听到D-Lib停刊,我的第一个反应是,那些文章怎么办?编者按称,在可预见的将来,主办机构CNRI(Corporation for National Research Initiatives)仍将维持整个D-Lib档案在线(也就是说不会影响其访问与引用),也欢迎长期存档的建议。
D-Lib目前还有4个全内容镜像站点,分别在澳大利亚国立大学,德国下萨克森州立图书馆和格廷根大学图书馆,台湾中央研究院,葡萄牙国家图书馆(ABOUT D-LIB MAGAZINE),但愿也能保留。

——— 那些D-Lib上的文章 ———
不同人会有不同的印象深刻的D-Lib文章,我的几篇围绕RDA:
尤记RDA编制过程中,2007年初Karen Coyle, Diane Hillmann发表的那篇语出惊人的“20世纪的编目规则”(Resource Description and Access (RDA): Cataloging Rules for the 20th Century)。文章不仅影响到RDA,也影响到整个图书馆界的关联数据应用。
同期(v.13, no.1/2 (Jan/Feb 2007))还有现任RSC主席Gordon Dunsire介绍RDA/ONIX框架的文章(Distinguishing Content from Carrier: The RDA/ONIX Framework for Resource Categorization)。
当RDA尘埃落定后,几位作者(Diane Hillmann, Karen Coyle, Jon Phipps, Gordon Dunsire)又在2010年1/2月合期发表了宣传RDA词表的文章(RDA Vocabularies: Process, Outcome, Use)。与RDA作为编目规则关系不大,继续的是其关联数据应用。

最后看下1995年第1卷第1期,有3篇文章。第1篇是OCLC的Stuart Weibel介绍都柏林核心元数据的文章:Metadata: the foundations of resource description ,这是第1届DC会议(DC1: OCLC/NCSA Metadata Workshop)报告概要。如今,DC/DCTerms名列被用最多的关联数据用词表。

时间飞逝,“数字图书馆”时代终结了?

机构库开源软件Hydra改名Samvera

Hydra是基于Fedora的开源软件,可用于机构库或特藏库等。Hydra为希腊神话中的九头蛇,作为项目显示其多用途。Samvera则为冰岛语“亲密无间”,表达协同工作。

Hydra is now Samvera (7 July 2017)(Digital Preservation Coalition 新闻)
Hydra项目始于2008年,由英国赫尔大学、美国弗吉尼亚大学、斯坦福大学和Fedora发起,目前有35个成员参与软件开发与支持。可根据需要部署,包括本地定制工具套件 Hyrax,通用全包解决方案 Hyku,多媒体库 Avalon
考虑到现在已不再是一个项目,为反映社区的重要性,成员同意改名为Samvera社区,反映软件未来通过协作活动发展及持续的相互支持。

Samvera

官网:http://www.samvera.org
Samvera是草根开源社区,为图档博创建最佳的经典数字资产管理解决方案。针对不同内容类型,提供灵活、丰富的用户界面。

Samvera基于4个主要组成部分:
Fedora存储库软件,提供健壮、持久的存储库层,维持和管理数字对象管理。
Solr索引,提供快速访问有关机构资源的信息。
Blacklight,Ruby on Rails插件,在Solr之上,提供分面搜索、浏览和定制的对象视图。
Samvera宝石:Ruby on Rails组件,集成构建基块,形成完整、灵活且可扩展的数字存储库解决方案。

SAMVERA PARTNERS
网页上部为成员名录,下部为非成员但使用产品的机构,以下几个有使用Hydra制作的机构库/特藏库链接:
* Digital Commonwealth (Massachusetts Collections Online) (https://www.digitalcommonwealth.org/) 图档博大型库
* Johns Hopkins University (levysheetmusic.mse.jhu.edu/) 乐谱特藏库(在线浏览、PDF下载)
* Museum of the Performing Arts (MAE) of the Theatre Institute of Barcelona (colleccions.cdmae.cat) 大型库
* Northeastern University (repository.library.northeastern.edu) 机构库(示范性)

关于Hydra,参见论文
几种典型新型开源机构知识库软件的比较分析 / 张旺强 祝忠明 卢利农(中科院国家科学图书馆兰州分馆). 现代图书情报技术, 2014-02-25
开源仓储软件在清华大学图书馆的研究应用与思考 / 曾婷; 董丽; 邹荣; 姜爱蓉 图书馆杂志 2012-05-15
文末“思考与建议”值得参考,特别是“永久的数据,短暂的系统”。