“数字人文:大数据时代人文研究前沿与探索”学术研讨会

“数字人文:大数据时代人文研究前沿与探索”学术研讨会:2017.7.1-2 南京大学

周末两天,有幸通过网络收看本次研讨会。会议内容相当丰富,30多个报告,既有介绍工具、开阔眼界的,也有各种应用、有的令人脑洞大开。
直播视频流畅,现场感强,手机随时截屏、比现场拍照还方便。可惜因各种俗务在外奔波,只看了约1/3的报告——看过的几个报告简单笔记附后。
总体观感:
1、数据库仍是必须的基础,但仅仅有数据库是不够的。
2、数字人文两大利器:GIS、可视化。
3、在CBDB、CHGIS的感召下,合作、开放越来越成为一种潮流,像是迟到的春天终于要来了。

——— 报告笔记 ———
主题演讲:
Peter Bol(哈佛大学), Making Conceptual Leaps and Finding the Right Tools
包弼德教授用流利的中文讲工具的重要性,及各种工具介绍。
项洁(台湾大学),数字人文的能与不能
报告标题改为“从取用到分析,从群体到个人:数位人文的演进思考”。台湾的“数位典藏与数位人文国际演讨会”今年将举办第8届了。介绍台湾历史数位图书馆THDL,提供给学者的数字人文研究工具DocuSky,及应用案例。
– 范毅军(台湾中研院),地理資訊與空間人文─建構虛擬時空框架的設想、具體實踐與應用
(只看了开头)

数字史学的方法与案例:
舒健(上海大学),民国天主教期刊出版状况初探——基于汉语基督教书目文献数据库的研究
书目元数据的挖掘。书目元数据当然也是可以挖掘的。
邱伟云(山东大学),词汇、概念、话语:数字人文视野下中国近代“未来”观的建构与再现
来自台湾的邱伟去,介绍近代报刊全文中“未来”一词的变化与同现词分析。略为简单,比如没有考虑到UU毕业论文中涉及的词语可能的含义变迁。“未来”或许含义比较单一,其他词则未必。
曹志红(中国科学院大学),徘徊于传统史学与数字史学之间的中国历史动物研究:以华南虎为例
“虎”在历史文献中的不同视角,自然的、社会的甚至药物的,以及地理分布。非常有意思的研究。
王哲(上海财经大学)、马欢(复旦大学),近代海关数据的整理与旧海关生态圈的初步构想
英国人积累下的中国海关数据,丰富而复杂。也是一项大的基础工程。

历史地理信息系统(HGIS)(下)
潘威、小林雄河(陕西师范大学),东亚历史台风信息系统建设与近三百年东亚台风活动研究的进展
中日韩朝台风数据。
朱本军(北京大学),GIS与战国历史地理研究
用地理地形数据分析历史地名的位置。
胡恒 (中国人民大学),GIS所见“冲繁疲难”与清代政治地理格局初探——兼核验《缙绅录》中相关数据的准确性
清代为行政区给的4种标签“冲繁疲难”,地理分布特征。
陈刚(南京大学),南京城市古旧地图数据库设计及历史城市形态学研究
南京古地图出版,用地图做了不少有意思的研究。接下来要做的是地图的数字化:只看到地图元数据层面的设计,似乎还没有深入到地图本身。
徐永明、唐云芝(浙江大学),《全元诗》作者的地理分布的可视化呈现
报告标题改为“数字人文与我的古代文学研究”,介绍工具,以及《全元诗》外更多研究。
程星华、胡迪、刘龙雨等(南京师范大学),面向公众的三国历史WebGIS的设计与实现
报告人是南京师范大学地理学的本科生,游戏化的三国历史GIS,很有意思。

ORCID 2017上海研讨会:笔记与联想

本着了解ORCID应用进展的想法,报名参加了 ORCID 2017上海研讨会。参会者以图书馆界为主、出版界次之,研究人员/科研管理只占很小部分,并且这小部分似乎下午都已不在场。
1、ORCiD /ɔ:kid/
拼单词就out了。官网Logo中间有个小写,但文字中通常全大写。

2、这是ORID首次在中国大陆召开的会议,有从北京来参会的出版界人士。据ORCID中国区总监胡昌杰介绍,大陆注册人数估计35万(根据机构邮箱、国内常用邮件服务),仅次于美国。机构会员情况:
大陆4家(清华大学,中科院文献情报中心,中科院高能物理研究所,中国农业科学院)
香港7家(8所大学中除香港科技大学)
台湾9家(未列出)

3、中科院文献情报中心曾有 iAuthor.cn 网站提供ORCID注册(“中国科学家在线”平台正式上线,2014-10-30),已是过去完成时(今天发现网站无法访问、烂尾了)。
如果个人需要ORCID号,直接到ORCID官网,免费注册 。官网有给ORCID号生成二维码功能,有国别选项,仅20多个国家、不含中国——此选项含义不明,会议问答阶段说明,注册信息中不含国家,如更换国籍无须更新个人信息。

4、可使用API利用ORCID数据
API有3等,免费的公共API有查询功能,基本会员API和高级会员API有不同的更新记录权限(成员资格与费用,3-120万不等)。更新记录将丰富会员单位下属个人ORCID信息,并且增加个人信息的可信度。

5、个人ORCID数据目前由CrossRef提供基于DOI的自动更新,也可如上由会员单位更新。否则的话,只能由个人自己更新,自己更新信息的可信度级别较低。ORCID本身不提供其他通报功能。
已注册了ORCID的都了解,目前中文成果基本上没有自动更新。没有国外发文的话,目前注册这个号码作用尚未能体现。这也是最后专家讨论阶段,社科文献出版社集刊运营中心副主任柴宁提问的:人文社科为什么要用它?

6、科研信息管理需要用到个人ID,以区别姓名相同或者姓名形式相同的情况 。目前有不少通行的个人ID,通常需要并行使用,才能拼出相对完整的个人成果。
香港理工大学图书馆研究支援部主任谢佳燕(Janice Chia)介绍,理大在学校层面推进ORCID注册,其学者库将ORCID与Scopus author ID、ResearcherID整合,以获取相对完整的个人成果信息。该馆Researcher Profile网页也列出了本次报告介绍的数据整合流程。
上海交通大学图书馆潘卫副馆长介绍,上交大机构知识库目前根据学校需求,侧重研究者数据管理,近期目标是实现学院年度成果考核,要求成果精确归属(自动判断+认领),同时减少对成果的反复识别。因此下决心对全校数千研究人员做人名规范,除以上3种个人ID,还使用ISNI及一些专业平台的作者ID。上交大自身并推动在DRAA电子资源谈判中,增加数据获取的权利

7、图书馆界关注个人ID,是因为它能区分同名者、汇聚研究者成果,属于传统图书馆学编目中的规范控制范畴。但是,如会议最后提到的,研究者才是ORCID的主角,如何让研究者愿意使用,方便其工作,才是ORCID是否能够成功的关键。目前国内已有期刊要求作者、审核者提供ORCID,除此之外呢?

8、会议赞助商Nature和Science的报告,关注点在提高科研成果的可信度,因为近年科学丑闻太多。
Nature Research大中华区执行主编印格致(Ed Gerstner)讲加强透明度,如通过研究数据的开放获取、研究预注册、提高成果的可重复性。
AAAS亚太业务开发总监初晓英讲要求研究者声明自己的责任,采用贡献元数据+责任方式(Credit)词表。
两家方向一致,思路不同。前者通过开放,实现第三方监控;后者是要求自律。尽管看到元数据、受控词表感觉很亲切,但我不相信自律,更相信开放的制度设计。

2017-6-23 update:
官网上的会议主页,PPT已上线(figshare.com在线浏览+下载)
– 会上初晓英提到有篇用ORCID数据做的科学家流动研究文章发表在Science系列,文章中那个跳槽最多、在10个国家工作过的人现在到了上海大学。文章中译版:
用ORCID追踪全球科学家的流动(原文作者John Bohannon & Kirk Doran)
除了很炫的可视化图。其中还提到ORCID存在的问题:(1)用户偏年轻化;(2)不同国家用户数量与研究人员数量不匹配,如西班牙和葡萄牙偏高,因为这两个国家的科研资助机构都要求科学家使用ORCID;(3)学术界研究人员有更大发表论文压力,因而比产业界的科学家更积极地注册。
– 会后反馈。包括:(1)问卷调查:评介会议、报告、场地、建议等——第一次见到给每个报告评分的问卷。(2)收集参会者ORCID号,如果没有,也可即时注册——既收集信息、也是推广。为免干扰,在此就不提供链接了。

澳大利亚图情协会《图情职业未来》报告2017版

2013年,澳大利亚图情协会(ALIA)就职业未来举行了一个调查,提出3个方面的问题
– 图书馆将如何与用户保持关联?
– 机构和个人将在本行业的体验会有哪些变化?
– “图书馆和信息专业人员”是否仍然是必要和理想的职业?
根据收到的回复,2014年5月发布了7个针对不同类型图书馆的专门报告。3年后的2017年5月,ALIA更新了所有7个报告:

Future of the Library and Information Science Profession

以下摘译自第1份报告“行动清单”,包括10个主题、4项工作清单及结论。

重新审视当年的10个主题,认为没有变化:
1 图书馆和信息管理:相同的技能,不同的解释
2 公平:人们对图书馆的热爱是由我们对公平和公正社会的贡献所支撑的。
3 机会均等:我们帮助克服优势和劣势之间的差距。
4 资金:图书馆用户和资助者对我们的服务价值有不同的认识。
5 图书馆体验:其他人提供信息, 但没有其他人提供图书馆体验。
6 模拟和数字:我们将需要在网上和现实生活中看起来很好、工作良好。
7 更多而不是更少空间:在我们的未来图书馆中更多的空间为人、更少的空间为书。
8 延伸馆藏预算:更多内容, 以多种格式-我们将需要聪明地用我们的钱。
9 社群创建内容:图书馆将帮助读者从令人惊讶的创造者那里得到各种各样的新内容。
10 难以想象的技术:技术将继续对我们的工作和我们提供的服务产生巨大的影响。

报告主体是该协会2013-2017年在7个方面的工作。然后是4项工作清单
1 图书馆和信息服务将需要着重于用户体验, 不仅在内容方面, 而且在现实世界和网上服务的外观和感觉。
2 用户数据,征得同意后,将在为个人定制图书馆体验中发挥重要作用。
3 网站将需要更大的关注, 使他们从纯粹的功能性设备, 到方便、引人入胜和有用的图书馆体验的一部分。
4 收集、保管和传播社区所创造内容的机会将开放供调查。

最后是结论
变化是常态。我们必须时刻警惕因为技术进步而来的下一波创新浪潮, , 通常, 但并非总是如此。资金问题是不变的。很少有足够的资金来进行核心服务, 探索新的项目, 提供替代的格式, 并投资于建筑物的结构。
宣传的必要性是为常态。强烈的价值和影响的声明是值得的, 但人们记忆短暂。对图书馆和信息专业人员提供什么,他们需要得到定期提醒。当宣传具有创造性、智慧和持久性,有可能找到创新所需的资金。