欧洲BIBFRAME研讨会

欧洲图书馆界一直走在关联数据应用的前列。2008年瑞典国家图书馆率先发布全国联合目录Libris为关联数据,十年后的2018年6月再次率先上线关联数据系统LibrisXL,取代其原有图书馆自动化系统Voyager的核心部分,词表基于BIBFRAME 2.0。而美国国会图书馆(LC)自2011.5.13启动“书目框架转换行动”(Bibliographic Framework Transition Initiative),研发BIBFRAME近8年、已历多轮试验,还没宣布何时“转换”——LC背负的MARC负担实在太重。

欧洲BIBFRAME研讨会(EBW)自2017年首次召开,已成为每年9月召开的年会。会期2天(2018年会前另有1天培训),报告人不限于欧洲,报告数量远超美国图书馆协会冬夏两个年会期间LC主办的BIBFRAME更新论坛,是了解BIBFRAME应用进展的最佳来源。第3次年会将于2019年9月17-18日在瑞典国家图书馆举办。

European BIBFRAME Workshop 2017 (2017.9.26-27,法兰克福德国国家图书馆)【会议报告
2017年会议成果:《对ILS投标者的BIBFRAME期望》(BIBFRAME Expectations for ILS Tenders, 2018-02)
会前介绍博文:BIBFRAME在欧洲启动?2017欧洲BIBFRAME研讨会(2017-5-18)

European BIBFRAME Workshop 2018 (2018.9.17-19,意大利,Casalini Libri & European University Institute)
2018年会议成果:《就RDA与BIBFRAME致信RDA指导委员会》( Letter to the RDA Steering Committee about RDA and BIBFRAME, 2018-12-13)
会议报告【一句话概览】
培训1:BF入门
培训2:宏观
培训3:Casalini的BIBFRAME项目/SHARE VDE
培训4:转换和调和
培训5:瑞典联合目录Libris XL采用BIBFRAME2为主的本体KBV,用MarcFrame转换到JSON-LD
培训6:开源关联数据编辑器CEDAR
培训7:LC的BIBFRAME编辑器
培训8:PCC的ISNI试验项目(2017.7-2018.7)
报告1:BIBFRAME开发(Pilot 2)
报告2:LD4P状态更新
报告3:语义网在匈牙利国家Széchényi图书馆
报告4:加拿大BIBFRAME现状 [貌似没做什么]
报告5:生产中的BIBFRAME:瑞典联合目录Libris XL
报告6:用BIBFRAME的匈牙利通用目录
报告7:SHARE-VDE:项目如何满足BIBFRAME模型
报告8:乔治华盛顿大学实验:1 Schema.org的Action,2 MARC中URI
报告9:芬兰国家图书馆通过BIBFRAME转换到Schema.org/对转换程序的评价
报告10:图书馆关联数据的3个选择:BIBFRAME 2.0,,Schema.org,链接MARC,提出BF到schema映射项目
报告11:截屏1997年FRBR开始的历年重要文件、模型、PPT
报告12:PCC自2015年起为关联数据所做准备
报告13:MARC转换到BIBFRAME过程中书目家族抽取评估
报告14:PCC任务组:URI、BIBFRAME
报告15:FOLIO [更像是拉客广告]
报告16:重用作为缓存

2018上海图书馆学会学术年会散记

回顾四十年 展望新时代——2018上海市图书馆学会学术年会(会议网站)

【人气】上海图书馆学会年会一向不缺人气,今年更是爆棚。预定700个名额恐怕已是历年之最,12月3日下午网上报名悄悄开放,据说2小时即满额,我4点12分报名第683名。后来有些机构集体报名,最终人数是966名。12月14日清早到会场,按分组微信扫码签到、领资料,速度很快。有报名没来的、也有没报名来的,实际到场据报也有950多名。秉承开放传统,会议还有网络直播,微信朋友圈有远程听会晒感受的。
【太极】本次年会由本校信管系、图书馆及知网联合承办。馆领导承接了会前的暖场活动,表演太极拳。作为太极拳学员一枚,参与义不容辞。结果是,很多人看后称之为舞蹈。
【冷】会场的气温不是暖场能提升的,“冷”将会是本次年会的专属关键词。上午主会场安排在中北校区体育馆,大概只有这里能容纳这么多人吧。正巧体育馆所在区域电路维护,已经限电半个月(只有照明电)。为此次会议前一天临时开来发电车,据说半夜开启空调。当天到会场就没觉得有空调,开幕式坐着越听越冷,于是趁颁奖环节回家加衣裤。
【大会报告】9点50分返回会场时,原定10点开始第一个报告已经开始,葛剑雄教授讲古代中国“开而不放、传而不播”。同事在微信朋友圈分享了澎湃专访|葛剑雄:古代中国“开而不放、传而不播”(2018-1-29),现场内容比专访更丰富。
接下来的2个报告围绕会议主题“回顾四十年 展望新时代”,分别是科技情报事业发展回顾与思考(上海图书馆馆长陈超)和上海市图书馆学40年(华东师范大学范并思教授)。陈馆长语调平铺直叙,中间又停顿过长,让人怀疑是不是为了填满1小时报告时间——后来才明白是现场电脑PPT换页反应过慢所致。老槐的报告,PPT是专门为16:4的屏幕准备的,效果较好,内容么,不免有自吹自擂之嫌。
最后一个报告人是清华大学教授陆达,其实是CNKI广告,不过现在厂商的报告也是很有内容、不乏前瞻的。可惜报告按日程开始时已近12点,大批人饥寒交迫陆续离场觅食去了。
上午主会场结束时还有一个彩蛋,播放当天现场照片,相当不错,办会实在辛苦。会务宣布还有一些餐券可供现场临时报名者领用,不知有多少临时报名者还在场。本校参会者没有餐券,到食堂自己刷校园卡午餐,然后回家睡个午觉。
【分会场】下午8个分会场,总算温暖了。先参加第4分会场(资源建设专业委员会分会场),安排得很满,上下半场共11个报告,中场还有特邀专家互动,见到台上久违的顾犇主任和王松林教授。我的报告《从数字化到数据化:编目的未来之路》是上月在厦门召开的CALIS中西文编目员研讨会报告的简化版,安排在下半场第一个,开讲已经是16:20。[update: 完整版PPT已上传Academia.edu]
接下来赶去第1分会场,参加本系创立四十周年座谈会。到时已近尾声,听到了系友于建荣、凌建平、西南大学系主任张敏及2位在读学生的发言。最后赵星主任讲了我的N个身份,要我讲几句,这真不是我擅长的——讲了自己研究生是情报检索方向,在图书馆工作三十年却没有做过相关工作;现在更多关注编目,回忆刁维汉老师当年拿AACR2给我们上西编课。会后与张敏及邓小昭略聊而别。
【培训】本次年会首次增加半天,12月15日上午还有2场。我参加了关联数据技术培训,也是有网络直播的。夏翠娟的“领域本体的设计和RDF数据的编码”,张永娟的“学习SPARQL、理解SPARQL”,陈涛的“关联数据可视化技术分享”,都是经验之谈、非常实用有收获的培训。

“知识组织与检索语言学术研讨会”笔记

12月3-4日在广州参加“知识组织与检索语言学术研讨会”。第一天15个报告,每个报告40/25分钟,内容丰富又排得很满,有难得请到的大咖(头衔都是一长串的),以下选择若干报告概述个人听后感(省略头衔,姓名前数字为报告序号)。第二天是《中图法》编委会工作会议,有幸蹭会,不方便分享内容。
特别有感触的一件事是,第一天晚上5点半,会议还在进行中,会场投影率先罢工。于是体验了一把前电脑时代的学术会议:随薛春香老师报告,努力在头脑中再现内容——实际感受是,PPT可视化确实极大地改变了人的思维方式,弱化了人的具象能力。其实这种现象在电视代替广播时就已经开启,虚拟现实/增强现实必将加速推进这种趋势。

——— 知识组织与检索语言学术研讨会:听后感 ———
1 马费成(武汉大学):大数据环境下用户需求信息组织
对“用户信息需求”加以组织,很新鲜的概念。通过什么方式?“用户需求信息词表”吗?没有提到,并且从报告看本体方法被排除在外。提到DC、SKOS、FOAF甚至FRBR,似乎与用户需求并无直接关系。报告立意很高,但感觉目前还是初步框架,没提供太多实质性内容。

3 李广建(北京大学):用网络数据揭示非正式交流过程
从公开的网络信息(学术新闻)分析人文社会科学领域的线下/现场的非正式交流,包括不同领域的活跃度、专家所在高校分布、交流的政府机构、跨省交流……可视化展示。由于时间所限,似乎没有说明哪些属于“非正式交流”,比如到政府机构算非正式交流?

5 黄水清(南京农业大学):古文信息处理:概念、现状与趋势
报告涉及古文信息的数字化、智能处理和人文计算(数字人文),但数字人文部分只是一带而过,没有展开说明。个人很赞同其中观点:(图情界)选择人文计算问题,应当是研究者有想法但无法实现的,而不是研究者也无法解决的,比如《红楼梦》的作者。

8 常春(中国科学技术信息研究所):知识组织生态系统研究进展
报告内容比较学术化。我关注的是作为研究对象的《汉语主题词表》。一直觉得国家投入巨资编制词表,应该开放才能最大化其利用,终于听到好消息,《汉语主题词表》服务系统刚上线(中信所主页有显著链接)。不提供批量下载,但有很丰富的服务,目前有6个版块:术语服务、文本分词、自动标引、主题分析、学科分类、知识树DIY。可以对用户提供的1.5万字以内文本提供分析。
据说里面不但含有词表中的词,还有其他来源的400万词汇(用于辅助分词)。有兴趣可以去探索一番:http://ct.istic.ac.cn/

9 贾君枝(中国人民大学,今年刚从山西大学转会):数据起源描述框架及其应用
数据起源(或来源)的3个描述框架:开放起源模型、W7模型和Prov。之前关注过W3C的Prov,但并不了解其使用。报告介绍了2个案例:2014美国国家气候评估报告和欧洲起源项目-器官移植。
查了下几个链接:
PROV-Overview (W3C Working Group Note 30 April 2013)
Open Provenance Model Vocabulary Specification (6 October 2010) :文件格式很像W3C文件,作者:Jun Zhao (Image Bioinformatics Research Group, Department of Zoology, University of Oxford)
W7 model 似乎出自一篇文章:Sudha Ram, Jun Liu. A New Perspective on Semantics of Data Provenance http://ceur-ws.org/Vol-526/InvitedPaper_1.pdf: In the W7 model, provenance is conceptualized as a combination of seven interconnected elements including “what”, “when”, “where”, “how”, “who”, “which” and “why”.

11 章成志(南京理工大学):基于全文内容分析的算法使用行为与影响力研究
针对“计算机算法”这一特定问题的“全文”文献计量分析,依据专业词典等做数据标注,目标之一是可以根据要求推荐算法。有技术含量,又有实用价值,很高大上。
不免联想到评审时经常看到的文章:找个数据库、用关键词搜一堆文章,做一堆没有任何悬念、意义不明的统计分析+可视化;换一组关键词,又是一篇文章……如此循环往复,可至无穷。

12 范炜(四川大学):《情报语言学辞典》语义化进展
张琪玉《情报语言学辞典》的语义化,是对词条的深度结构化,而不只是简单地标注为:术语、解释、见/参见。计划2019中发布beta版,期待。

14 卜书庆(国家图书馆):《中图法》的发展历程与发展方向探讨
中图法发展史的很好总结(后两阶段应该更多是在试验与研究,还没有上线):
1975-1999:创建、统一(多用户/多资源版)、一体化(分类主题)
1999-2009:机读化、电子化(光盘版)、网络化(Web版)
2010-2013:语义化、关联化、可视化
2014- :自动化(智能化),最终用户服务化
今年10月曾给内蒙中小学图书馆员曾介绍过《中国分类主题词表》网站,可以免费注册使用3级类目,支持分类法全文及主题词检索。早年试用情况参见:中国分类主题词表Web版试用记(2010-3-4),网址现为:http://cct.nlc.cn/

15 曹树金(中山大学):大数据环境的知识组织
其中“面向(用户)情景的知识组织”很有意思,情景如何描述和组织?没讲答案,可关注。
因为会议安排太满,又临时增加14《中图法》报告,作为会议协办者,曹教授只能牺牲自己的报告了,讲5分钟实在太短。