SWIB19:语义网在图书馆会议(报告概要)

第11届语义网在图书馆会议(SWIB19)将于2019年11月25-27日在德国汉堡举行。第1天下午是培训讲习班;第2-3天会议,主旨发言分别是Saskia Scheltjens和曾蕾教授。会议议程有报告摘要,可以先了解大致情况。

首次SWIB会议2009年举办,会名缩写来自德文(SEMANTIC WEB IN BIBLIOTHEKEN),历届会议报告也大都来自欧州。本次会议可见欧洲对语义网/关联数据在图书馆应用探索深入,尤其是多国的国家图书馆。

培训班(半天)

教授相关软件的实际操作,可了解语义网/关联数据在图书馆领域的在用工具。今年有5个培训:

  • 1、Jupyter Notebooks入门(交互式笔记本)
  • 2、用Cocoda映射受控词表
  • 3、OpenRefine入门【参见:OpenRefine数据处理工具(2016-7-9)】
  • 4、用Annif自动化主题标引
  • 5、动手IIIF:如何安装、配置和准备简单的IIIF服务(国际图像互操作框架International Image Interoperability Framework)

第1天会议

1、(主旨报告)永远在两者之间:图档博关联开放数据(LODLAM)的异同、机遇与责任 / Saskia Scheltjens(荷兰国立博物馆)

2、在Data.Bibliotheken.nl上发布关联数据 / René Voorburg(荷兰国家图书馆)荷兰国家图书馆的data.bibliotheken.nl,目前以schema.org序列化,正在进行基于LRM和PREMIS的模型。

3、2千万个URI和芬兰图书馆界主题索引的全面改革 / Matias Frosterus等(芬兰国家图书馆)从叙词表YSA转换到本体YSO;不仅全国联合目录Melinda转换,还有开源转换程序提供其他图书馆本地使用。

4、进出:西班牙国家图书馆的图书馆数据和关联数据之间的工作流程 / Ricardo Santos(西班牙国家图书馆)由VIAF标识符数据包文件抽取Wikidata标识符,加载到规范记录;再从Wikidata提取8万多人的属性信息,丰富规范数据。

5、从原始数据到更丰富的数据:汇总元数据时的经验教训 / Julia Beck(德国法兰克福大学图书馆)汇总德语文化遗产机构的演艺元数据(异构数据)于VuFind搜索门户

6、NAISC:图书馆领域的权威关联数据互连方法 / Lucy McKenna等(爱尔兰都柏林三一学院)继续SWIB 2018曾介绍的NAISC,创建实体(如人、地点或作品)间链接,采用PROV-O作为基础本体加以扩展。

7、酷和BnF帮:法国国家图书馆关于处理永久标识符的一些想法 / Raphaëlle Lapôtre(法国国家图书馆)

第2天会议

1、(主旨报告)用于数字人文的智慧数据 / 曾蕾(美国肯特州立大学)

2、数字资源和研究数据:链接且可用 / Florian Kräutli等(德国马克斯·普朗克科学史研究所)马克斯·普朗克人文数字研究基础设施(MP-DRIH),基础架构的中心是知识图谱,使用CIDOC-CRM作为通用模型,采用基于语义数据平台Metaphactory的软件系统ResearchSpace使用生成的图谱。

3、BIBFRAME内外的数据建模 / Tiziana Possemato(意大利@Cult and Casalini Libri公司)依据BIBFRAME,Share-VDE已进入生产阶段。扩展BF本体,增加概念:超级作品、主实例。【其用户界面与早先的Share目录类似。参见:BIBFRAME 2.0实施注册新增项目(附:意大利SHARE目录)(2017-7-25】

4、图书馆目录的实证评估 / Péter Király(德国GWDG)用工具分析MARC目录的问题:字段/子字段/指示符、词典取值等错误;计算完整性,基于FRBR用户任务运行功能分析。

5、简单应用纲要/应用程序配置文件设计 / Karen Coyle / Tom Baker(DCMI)2019.4成立的DCMI AP兴趣小组的工作

6、SkoHub:通过ActivityPub基于KOS的内容联合 / Adrian Pohl等(德国hbz)/ Felix Ostrowski(graphthinking GmbH)2家企业合作的SkoHub项目,利用社交网络协议ActivityPub,发送和订阅受控词表中定义的主题的通知。

7、提出丰富的关联开放数据集视图:S路径原型和data.bnf.fr中FRBR化数据的可视化 / Raphaëlle Lapôtre等(法国国家图书馆,法国国家信息与自动化研究所)data.bnf.fr团队与人机交互研究团队ILDA合作,设计交互数据可视化界面“S路径”,使用户可以更直观地导航关联开放数据。S路径对于揭示数据源中的缺陷、可视化建模特性以及显示可用于与最终用户进行通信的数据趋势非常有用。

8、目标词汇表映射 / Niklas Lindström(瑞典国家图书馆)

9、在OCLC研究部的关联数据Wikibase原型中表示图书馆元数据的经验教训 / Karen Smith-Yoshimura(美国OCLC)

参见:
OCLC关联数据Wikibase原型系统项目(附:图书馆关联数据:从幻灭到生产)(2018-11-24)
OCLC发布报告:用Wikibase创建图书馆关联数据(2019-10-10)
用Wikibase创建图书馆关联数据:通道项目的经验(2019-10-15)

欧洲BIBFRAME研讨会

欧洲图书馆界一直走在关联数据应用的前列。2008年瑞典国家图书馆率先发布全国联合目录Libris为关联数据,十年后的2018年6月再次率先上线关联数据系统LibrisXL,取代其原有图书馆自动化系统Voyager的核心部分,词表基于BIBFRAME 2.0。而美国国会图书馆(LC)自2011.5.13启动“书目框架转换行动”(Bibliographic Framework Transition Initiative),研发BIBFRAME近8年、已历多轮试验,还没宣布何时“转换”——LC背负的MARC负担实在太重。

欧洲BIBFRAME研讨会(EBW)自2017年首次召开,已成为每年9月召开的年会。会期2天(2018年会前另有1天培训),报告人不限于欧洲,报告数量远超美国图书馆协会冬夏两个年会期间LC主办的BIBFRAME更新论坛,是了解BIBFRAME应用进展的最佳来源。第3次年会将于2019年9月17-18日在瑞典国家图书馆举办。

European BIBFRAME Workshop 2017 (2017.9.26-27,法兰克福德国国家图书馆)【会议报告
2017年会议成果:《对ILS投标者的BIBFRAME期望》(BIBFRAME Expectations for ILS Tenders, 2018-02)
会前介绍博文:BIBFRAME在欧洲启动?2017欧洲BIBFRAME研讨会(2017-5-18)

European BIBFRAME Workshop 2018 (2018.9.17-19,意大利,Casalini Libri & European University Institute)
2018年会议成果:《就RDA与BIBFRAME致信RDA指导委员会》( Letter to the RDA Steering Committee about RDA and BIBFRAME, 2018-12-13)
会议报告【一句话概览】
培训1:BF入门
培训2:宏观
培训3:Casalini的BIBFRAME项目/SHARE VDE
培训4:转换和调和
培训5:瑞典联合目录Libris XL采用BIBFRAME2为主的本体KBV,用MarcFrame转换到JSON-LD
培训6:开源关联数据编辑器CEDAR
培训7:LC的BIBFRAME编辑器
培训8:PCC的ISNI试验项目(2017.7-2018.7)
报告1:BIBFRAME开发(Pilot 2)
报告2:LD4P状态更新
报告3:语义网在匈牙利国家Széchényi图书馆
报告4:加拿大BIBFRAME现状 [貌似没做什么]
报告5:生产中的BIBFRAME:瑞典联合目录Libris XL
报告6:用BIBFRAME的匈牙利通用目录
报告7:SHARE-VDE:项目如何满足BIBFRAME模型
报告8:乔治华盛顿大学实验:1 Schema.org的Action,2 MARC中URI
报告9:芬兰国家图书馆通过BIBFRAME转换到Schema.org/对转换程序的评价
报告10:图书馆关联数据的3个选择:BIBFRAME 2.0,,Schema.org,链接MARC,提出BF到schema映射项目
报告11:截屏1997年FRBR开始的历年重要文件、模型、PPT
报告12:PCC自2015年起为关联数据所做准备
报告13:MARC转换到BIBFRAME过程中书目家族抽取评估
报告14:PCC任务组:URI、BIBFRAME
报告15:FOLIO [更像是拉客广告]
报告16:重用作为缓存

2018上海图书馆学会学术年会散记

回顾四十年 展望新时代——2018上海市图书馆学会学术年会(会议网站)

【人气】上海图书馆学会年会一向不缺人气,今年更是爆棚。预定700个名额恐怕已是历年之最,12月3日下午网上报名悄悄开放,据说2小时即满额,我4点12分报名第683名。后来有些机构集体报名,最终人数是966名。12月14日清早到会场,按分组微信扫码签到、领资料,速度很快。有报名没来的、也有没报名来的,实际到场据报也有950多名。秉承开放传统,会议还有网络直播,微信朋友圈有远程听会晒感受的。
【太极】本次年会由本校信管系、图书馆及知网联合承办。馆领导承接了会前的暖场活动,表演太极拳。作为太极拳学员一枚,参与义不容辞。结果是,很多人看后称之为舞蹈。
【冷】会场的气温不是暖场能提升的,“冷”将会是本次年会的专属关键词。上午主会场安排在中北校区体育馆,大概只有这里能容纳这么多人吧。正巧体育馆所在区域电路维护,已经限电半个月(只有照明电)。为此次会议前一天临时开来发电车,据说半夜开启空调。当天到会场就没觉得有空调,开幕式坐着越听越冷,于是趁颁奖环节回家加衣裤。
【大会报告】9点50分返回会场时,原定10点开始第一个报告已经开始,葛剑雄教授讲古代中国“开而不放、传而不播”。同事在微信朋友圈分享了澎湃专访|葛剑雄:古代中国“开而不放、传而不播”(2018-1-29),现场内容比专访更丰富。
接下来的2个报告围绕会议主题“回顾四十年 展望新时代”,分别是科技情报事业发展回顾与思考(上海图书馆馆长陈超)和上海市图书馆学40年(华东师范大学范并思教授)。陈馆长语调平铺直叙,中间又停顿过长,让人怀疑是不是为了填满1小时报告时间——后来才明白是现场电脑PPT换页反应过慢所致。老槐的报告,PPT是专门为16:4的屏幕准备的,效果较好,内容么,不免有自吹自擂之嫌。
最后一个报告人是清华大学教授陆达,其实是CNKI广告,不过现在厂商的报告也是很有内容、不乏前瞻的。可惜报告按日程开始时已近12点,大批人饥寒交迫陆续离场觅食去了。
上午主会场结束时还有一个彩蛋,播放当天现场照片,相当不错,办会实在辛苦。会务宣布还有一些餐券可供现场临时报名者领用,不知有多少临时报名者还在场。本校参会者没有餐券,到食堂自己刷校园卡午餐,然后回家睡个午觉。
【分会场】下午8个分会场,总算温暖了。先参加第4分会场(资源建设专业委员会分会场),安排得很满,上下半场共11个报告,中场还有特邀专家互动,见到台上久违的顾犇主任和王松林教授。我的报告《从数字化到数据化:编目的未来之路》是上月在厦门召开的CALIS中西文编目员研讨会报告的简化版,安排在下半场第一个,开讲已经是16:20。[update: 完整版PPT已上传Academia.edu]
接下来赶去第1分会场,参加本系创立四十周年座谈会。到时已近尾声,听到了系友于建荣、凌建平、西南大学系主任张敏及2位在读学生的发言。最后赵星主任讲了我的N个身份,要我讲几句,这真不是我擅长的——讲了自己研究生是情报检索方向,在图书馆工作三十年却没有做过相关工作;现在更多关注编目,回忆刁维汉老师当年拿AACR2给我们上西编课。会后与张敏及邓小昭略聊而别。
【培训】本次年会首次增加半天,12月15日上午还有2场。我参加了关联数据技术培训,也是有网络直播的。夏翠娟的“领域本体的设计和RDF数据的编码”,张永娟的“学习SPARQL、理解SPARQL”,陈涛的“关联数据可视化技术分享”,都是经验之谈、非常实用有收获的培训。