第五届全国文献编目工作研讨会:笔记

2017.11.22-23,参加在洛阳举行的第五届全国文献编目工作研讨会(会议通知),这是连续第4次参加本系列研讨会。由于新规,本次会议改由中图学会信息组织专委会承办,会前还参加了专委会的工作会议。
会议实际仍由国家图书馆中文采编部具体操办,会务安排也一如既往地好。第一天大会报告,上午提问冷场、下午提问也很少,原以为第二天分会场3个报告安排3小时太久,会冷场或提前结束,实际上编目员可能属于慢热型,各组差不多都用满了3小时,报告人时间充分,提问讨论也比较踊跃,结束真到了12点。下午二点前进入闭幕式会场,看到滚动播放的图片,包括分会场讨论的鲜活场景,感慨于会务组的工作效率。
在闭幕式上被司莉老师贴了一个“最具奉献精神”的标签。其实如与来接我的郝嘉树MM所说,开博的初衷是为了分享,但到后来纯粹是作为自己整理思想的笔记本,所以在微信“朋友圈没有,便当不存在”(王波语)的时代,完全没有开公众号的想法——同时也因为鄙视微信的封闭性,不想为它提供内容。

——— 大会报告 ———
第一天大会报告6个:
1、刘炜(上海图书馆):智慧时代的信息组织
报告分3个部分:(1)大数据时代的文献编目;(2)信息组织的历史和未来;(3)从关联数据到智慧数据。Keven对文献编目的宏观认识远超我等只知埋头拉车者。很想摘录几页PPT,但这样博文就太长了,只好放弃——话说最后的“新编目”肯定不是现在编目员的活了,或者说编目员没活了?

2、王军(北京大学信息管理系):面向用户体验的信息组织:电商的生态化经营&图书馆的创新服务
分析用户购物旅程上的信息组织:全局导航、品类导航(分类),搜索词推荐(词表)、条件过滤、结果筛选(分面)……。用电商网站解释什么叫“以用户为中心”:经营的不是商品,是顾客。对于图书馆经营、编目及图书馆目录服务,应该是有启示的。

3、胡小菁(华东师范大学图书馆):国际编目标准现状与进展 2015-2017
介绍IFLA标准规范(2017新标准,UNIMARC、ISBD进展)、BIBFRAME编制进展、RDA更新现状。后来想起BIBFRAME应用竟然忽略了上图,很不应该。好在分会场发言中有许磊代表上图的报告,弥补了我的缺漏。
报告后提问,对于我在解释国际编目原则声明中“表达性”时举RDA一人多身份例,郝嘉树质疑单人多个规范的合理性。我其实对此也曾有过困惑,但后来认识到一人一身份其实只是为了管理方便,并不是基于用户需求的。但感觉回答时没有很好地表达。后来卜书庆老师在她报告前先答此问题,认为从用户任务角度,比如弘一法师和李叔同,显然应该使用不同身份。

4、罗翀(国家图书馆外文采编部):国家图书馆RDA本地化梦想的编织与实现
罗主任上届也讲相同主题。2年间国图的RDA本地化有了很大进展,2017年3月起国家图书馆所有外文语种的编目都开始采用RDA编目,有3本相关图书将出版:《RDA百日通》《国家图书馆RDA本地政策声明(NLC PS)》等。报告中还提到国图已经受邀参加RDA理事会(希望我没听错),感觉RDA在中国的前景似乎亮堂不少。不过,对NLC PS未能如其他国家政策声明那样提供开放访问的电子版,我还是觉得有点遗憾的——至少出个简化版?

5、卜书庆(《中图法》编委会常务副主编、国家图书馆):《中图法》最终用户的知识服务体系方案研究
报告详细介绍《中图法》编制中的“最终用户服务版”。感觉是分面改造简化版,但后台还是会连接到《中图法》。
报告没有说明这个版本会以什么方式向最终用户提供服务,毕竟《中图法》网络版是收费的。
提问阶段,华东政法大学同仁在收费之外,还问到专业分类需要细化的问题。卜老师的回答是:分类法不能代替主题法,专指由主题解决。这一年做了比较多的学位论文分类,对此非常认同。

6、贾君枝 (山西大学经济与管理学院):名称规范档的共建共享
报告全面梳理了各国名称规范档的发展史,以及共享模型(分布式、关联式、中心式、中心链接式),最后提出了中文名称规范档共享发展的3个步骤:步骤1,中心式,实现中文规范档的共享;步骤2,建立与外部数据集的连接(百度百科、维基百科);步骤3:加入VIAF。
报告中提到目前wikidata中有CALIS规范记录链接(CALIS ID),经询问喻爽爽主任,明确这是对方主动收割,并非CALIS与之合作(可见数据公开发布的好处)。关于VIAF,多年前曾询问国图为何不加入VIAF,当时理由是数据质量有待完善,后得知准备好加入时,却遭遇政治障碍,想做好事情当真不易。另外,报告中把中文名称规范联合数据库归入“分布式”,或许并不洽当,因为据我所知是有中心库的。

——— 分会场 ———
第2天上午分会场。共有3个分会场、每场3个报告(基于各自的会议论文),根据自己兴趣,正好走遍3个分会场,最后参与了第1分会场的讨论。

1、首先到第3分会场:许磊(上海图书馆):CNMARC与BIBFRAME映射及其实现——以上海联编中文普通图书数据为例
报告基于实际完成的工作,因而有许多体验,但由于时间关系,有些未能展开。比如报告中提到“作品的边界”,不知道上图是如何确定“作品”的。
提问时,郝嘉树MM问:谁来把这些数据关联数据化?Keven(称在现场给许磊以支持)回答是:机助,由计算机采集结构化信息……将来不可能靠人工。现在急于发布,目的就是让其他行业觉得我们这个行业是有价值的,无需别人重新发明轮子。Keven同时呼吁行业一起来做,坦言上图人员不足,开发之外,后续数据处理还有大量工作。分会场主持人喻爽爽主任表达出合作意愿:CALIS新成立数据中心、有懂MARC的,同时也有高校作为强大后盾。

3、接着到第2分会场:释贤才(龙泉图书馆)非古籍类佛学文献编目工作的实际与分析
本人开会不多,在专业会议中却也多次见到龙泉寺贤才馆长身影,可以想见他每年开会频率不低。记得以前曾听他讲过佛教分类法,了解不少,这次继续了解佛教文献编目。报告中也包含给分类号,与普通图书不同,很有启发。不过对一些字段用法就很想提些建议,比如用统一题名优于编目员自拟题名,再比如内部准印号用设置可检索的自定义编号而不是用一般附注,等等。同时我也不认为应当太多强调某类文献在编目上的特殊性,这不利于编目标准化。不过最终只是听了其他同行的提问,自己并未发言就赶往下一站了。

3、最后到第1分会场:李菡(国家图书馆外文采编部)RDA的自我完善及对国家图书馆RDA本地政策声明更新机制的启示
到时报告已过半,印象最深的是对RDA条款变化的统计分析(详见会议论文)。
针对RDA本地政策声明,主持人上图纪陆恩主任和北大图书馆张明东老师都提到中文问题。可是,前天的专委会上汪东波主任似乎在等《资源描述》国家标准批准后依之修订《中国文献编目规则》。
然后又是国图与CALIS差异的老问题。罗翀主任强调考虑国图以前实践。我建议未来可以仿照LC-PCC PS模式,做一个NLC-CALIS PS,明确两家的区别到底在哪里(可能没什么差别也未可知)。

接下来是报告外的编目工作问题讨论:
海南馆黄海萍老师提出:学完RDA不知道怎么用,想用于实物编目。我的回答是:可以用RDA,有相应规则。(当然实际培训时,多以图书为对象,所以如做实物编目,需要自己去看规则)
另一位老师提问:外包后自己不编目,年轻编目员如何成长?本人最感受益的是中山大学朱美华老师的分享:中大2004率先外包,数据质量一直由编目员把关,外包公司人员深度培训3个月上岗,但上传记录只能是本馆编目员。新编目员做6-12个月后,参加CALIS考试拿证书。本馆与中大一样,是CALIS的B+级馆,无需个人证书即可上传记录,看来也有必要向中大学习,以促进年轻编目员水平的提高。

——— 资料 ———
前几届报告资料下载地址:全国图书馆联合编目中心。本届当可期待。
论文集:《回顾与展望:新媒体时代下信息组织方法的创新与发展——第五届全国文献编目工作研讨会论文集》国家图书馆出版社,2017年11月。ISBN 978-7-5013-6288-2

历届会议参见:
2010年第二届-南京:
第二届全国文献编目工作研讨会·第一天
第二届全国文献编目工作研讨会·第二天
第二届全国文献编目工作研讨会·随感(2010-6-3)
2013年第三届-厦门:第三届全国文献编目工作研讨会:RDA相关(2013-10-23)
2015年第四届-重庆:第四届全国文献编目工作研讨会:随感几则(2015-10-25)

学术报告“另一个视界”与上图数字人文项目

出于对可视化的兴趣,周五(2017.8.11)去上海图书馆听学术报告。感谢上图开放学术资源让大家共享。

另一个视界:清华大学美术学院向帆副教授和朱舜山工程师学术讲座

会议通知中推荐的报告人微信公众号文章:
《数据追问-全国美展油画作品视觉化解读》
《我是不是有点皇亲国戚?》

报告安排在下午。可惜我在开讲没多久,就因收到私事信息急需处理,差不多一半时间在边听边开小差上网中。所幸前一晚先做了点功课,看过两位报告人的网站Z Lab,特别是其中的 Projects 板块,还能勉强跟上所讲内容。Z Lab网站共有11个项目(没有上述利用CBDB数据的家谱图),看过感觉一是可视化效果很酷炫(如微博地点钟的24小时);二是可视化设计也被作为一种实用的研究辅助工具(如热带森林数据可视化)。
本次报告涉及了Z Lab网站半数以上项目,听现场讲述比看介绍生动很多,尤其对“为什么会这么做”的解释,光看介绍是获取不到的。向帆老师把她的项目定位为现代艺术作品,而不是数字人文(或其他),至于被其他人用作分析工具,也被她视为作品的一部分,全国美展获奖作品分析就是一个典型例子。我的感觉,比如在CBDB家族谱系图、热带森林数据等,可视化应该更多是作为工具。当然由于向老师的美术背景,或许在设计时是作为艺术创作看待的。
问答阶段,向老师提到她也做了不少文本挖掘项目,比如张爱玲、海明威……,数字人文无疑。
听完比较“失望”的是,那些酷炫的效果,大多是朱舜山老师用代码写出来的,没有利用太多工具。视觉设计不易,实现也不具有可复制性。因此,只能是艺术品?两位老师珠联璧合,看得出在性格上也属互补型的。

——— 上海图书馆数字人文项目介绍 ———
当天上午是内部的上海图书馆数字人文项目介绍,希望请两位老师帮助改善可视化界面设计。
刘炜副馆长开场,夏翠娟做总体介绍,上图目前共有7个相关项目:1中国家谱总目(华人家谱总目——上海图书馆家谱知识服务平台),2盛宣怀档案,3名人手稿(上海图书馆名人手稿),4中文古籍联合目录及循证平台,5规范库(含人名、中国历史纪年、地理名词表、收藏机构名录等),6书目库,7上海历史文化时空再造——武康路。其中1、3、4、7后续由各自项目主管(抱歉没听清姓名)做详细演示,尤其是可视化部分。
向老师在看到名人手稿部分时指出:一般的可视化(饼图柱图之类),掩盖了最最让人感动的部分。——话说得没错,只不过图书馆是整理资料的,就像朱老师在整理全国美展获奖作品基础资料时所说的somebody:Somebody has to do the dirty work. 面对海量文献中充满个性化的内容,要当作艺术作品来创作,真的会使项目没有截止期的。
向老师问得最多的问题是:应用场景,用户需求。——或者说用例、故事,确实是需要首先考虑,也是当前图书馆做项目需要强调的,比如最近LD4社群“调和与实体解析工作组”正在征求用例(关联数据的“调和”与“解析”) 。
与邻座tsingove交换意见,作为基础设施的话,有时可能并不针对特定场景(当然那也是场景),提供数据就好,至于怎么用,留给第三方来开发。上图接连两年举办的关联数据竞赛,就是这种设想的体现。夏MM也解释,如古籍系统的某些预设应用,也是咨询过馆内领域专家的,是作为示范,让研究者了解数据可能怎么用,进而提出更多应用场景。
上午会议结束时,Keven总结数字人文项目中三方的角色:图书馆员作为领域专家与计算机开发者之间的桥梁。朱老师补充:要加上第四方设计师,了解用户体验。

“数字人文:大数据时代人文研究前沿与探索”学术研讨会

“数字人文:大数据时代人文研究前沿与探索”学术研讨会:2017.7.1-2 南京大学

周末两天,有幸通过网络收看本次研讨会。会议内容相当丰富,30多个报告,既有介绍工具、开阔眼界的,也有各种应用、有的令人脑洞大开。
直播视频流畅,现场感强,手机随时截屏、比现场拍照还方便。可惜因各种俗务在外奔波,只看了约1/3的报告——看过的几个报告简单笔记附后。
总体观感:
1、数据库仍是必须的基础,但仅仅有数据库是不够的。
2、数字人文两大利器:GIS、可视化。
3、在CBDB、CHGIS的感召下,合作、开放越来越成为一种潮流,像是迟到的春天终于要来了。

——— 报告笔记 ———
主题演讲:
Peter Bol(哈佛大学), Making Conceptual Leaps and Finding the Right Tools
包弼德教授用流利的中文讲工具的重要性,及各种工具介绍。
项洁(台湾大学),数字人文的能与不能
报告标题改为“从取用到分析,从群体到个人:数位人文的演进思考”。台湾的“数位典藏与数位人文国际演讨会”今年将举办第8届了。介绍台湾历史数位图书馆THDL,提供给学者的数字人文研究工具DocuSky,及应用案例。
– 范毅军(台湾中研院),地理資訊與空間人文─建構虛擬時空框架的設想、具體實踐與應用
(只看了开头)

数字史学的方法与案例:
舒健(上海大学),民国天主教期刊出版状况初探——基于汉语基督教书目文献数据库的研究
书目元数据的挖掘。书目元数据当然也是可以挖掘的。
邱伟云(山东大学),词汇、概念、话语:数字人文视野下中国近代“未来”观的建构与再现
来自台湾的邱伟去,介绍近代报刊全文中“未来”一词的变化与同现词分析。略为简单,比如没有考虑到UU毕业论文中涉及的词语可能的含义变迁。“未来”或许含义比较单一,其他词则未必。
曹志红(中国科学院大学),徘徊于传统史学与数字史学之间的中国历史动物研究:以华南虎为例
“虎”在历史文献中的不同视角,自然的、社会的甚至药物的,以及地理分布。非常有意思的研究。
王哲(上海财经大学)、马欢(复旦大学),近代海关数据的整理与旧海关生态圈的初步构想
英国人积累下的中国海关数据,丰富而复杂。也是一项大的基础工程。

历史地理信息系统(HGIS)(下)
潘威、小林雄河(陕西师范大学),东亚历史台风信息系统建设与近三百年东亚台风活动研究的进展
中日韩朝台风数据。
朱本军(北京大学),GIS与战国历史地理研究
用地理地形数据分析历史地名的位置。
胡恒 (中国人民大学),GIS所见“冲繁疲难”与清代政治地理格局初探——兼核验《缙绅录》中相关数据的准确性
清代为行政区给的4种标签“冲繁疲难”,地理分布特征。
陈刚(南京大学),南京城市古旧地图数据库设计及历史城市形态学研究
南京古地图出版,用地图做了不少有意思的研究。接下来要做的是地图的数字化:只看到地图元数据层面的设计,似乎还没有深入到地图本身。
徐永明、唐云芝(浙江大学),《全元诗》作者的地理分布的可视化呈现
报告标题改为“数字人文与我的古代文学研究”,介绍工具,以及《全元诗》外更多研究。
程星华、胡迪、刘龙雨等(南京师范大学),面向公众的三国历史WebGIS的设计与实现
报告人是南京师范大学地理学的本科生,游戏化的三国历史GIS,很有意思。