Sinolio=集成FOLIO和Sinoipa编辑器

在2021年第5届欧洲BIBFRAME研讨会(BIBFRAME Workshop in Europe 2021)上,有2个关于FOLIO和Sinoipa编辑器的报告:

Sinopia是LD4P项目的RDF编辑器,可以BIBFRAME和其他本体进行编目,最初基于美国国会图书馆BIBFRAME编辑器。有关这两个编辑器,可参见本次会议的另一个报告:两个编辑器的故事(A tale of two editors

关于Sinolio的报告在会议网站上仅有简介:开源关联数据编辑器Sinopia正在探索2021年秋季的FOLIO集成。这项工作非正式地称为 Sinolio(Sinopia 和 FOLIO 的组合),重点将放在API级与像BIBFRAME这样的Sinopia资源集成在FOLIO Inventory的馆藏、实例和单件中具有代表性的作品、实例和单件。

关于Sinopia和FOLIO的报告也包含Sinolio的一些信息,摘译如下:

作为安德鲁W.梅隆基金支持的LD4P3(闭环) 项目的一部分,康奈尔大学和斯坦福大学正在探索将Sinopia RDF编辑器与FOLIO开源图书馆服务平台集成的工作。概念整合证明将允许实施FOLIO的图书馆使用Sinopia为其部分馆藏提供丰富的书目描述,同时继续将MARC用于其他项目。RDF数据将存储在Sinopia中,同时也在FOLIO Inventory中存储足够的数据,以允许Sinopia中描述的资料的收集管理和流通。这种集成将是使RDF成为图书馆编目主流部分的重要一步,有助于将关联数据编织到日常图书馆工作流程中,并弥合MARC和LOD(关联开放数据)世界之间的差距。
康奈尔大学2021年7月全面实施 FOLIO。FOLIO本身没有RDF编目工具,FOLIO+Sinopia=用 BIBFRAME维护其目录部分的路径,无需单独的系统或额外的操作记录。Sinopia将提供BIBFRAME存储与编辑。Sinopia+FOLIO=Sinolio。Sinolio ETL(抽取、转换、加载)工作流程:i. 从Sinopia中提取RDF,ii. 转换为FOLIO典藏记录,iii. 通过Okapi API加载。

Sinopia编辑器可注册试用:stage.sinopia.io

参见:2021欧洲BIBFRAME研讨会信息(2021-10-17)

Share-VDE在图书馆关联开放数据中的作用

【Share-VDE的前世今生】

Share-VDE始于2016年。

2017年,意大利@CULT公司在BIBFRAME 2.0实施注册(BIBFRAME 2.0 Implementation Register)中添加了其开发的7所大学的目录门户:SHARE — Scholarly Heritage and Access to Research,包含200万书目记录、34万规范记录,采用BIBFRAME词表的关联数据发布。以FRBR化目录界面,呈现作者的增强信息。参见:BFRAME 2.0实施注册新增项目(附:意大利SHARE目录)(2017-7-25)

2018年BIBFRAME更新论坛,Casalini Libri(书目和规范数据提供者,PCC成员)、@Cult(ILS、发现工具、语义网解决方案厂商)介绍其与16个北美研究图书馆合作的Share-VDE项目(https://share-vde.org),用URI强化MARC记录。目录界面与SHARE相同,只是收录内容不同吧。参见:2018年BIBFRAME更新论坛(2018-11-14)

2019年初BIBFRAME更新论坛,斯坦福大学介绍LD4P2项目使用SHARE-VDE转换记录为BIBFRAME。参见:ALA 2019仲冬会议的BIBFRAME更新论坛(2019-2-17)

2020年LD4P3项目,Share-VDE作为托管编目环境,成为项目重要的协作者。LD4系列项目至此“闭环”,意在关联数据环境下创建一个完整周期的工作模型,进行图书馆元数据的创建、共享和重用。参见:关联数据编目走向现实——新项目LD4P3及LD4社区(2020-12-10)

2021年9月第5届欧洲BIBFRAME研讨会,公司介绍技术上重构的Share-VDE 2.0(https://svde.org/)。参见:2021欧洲BIBFRAME研讨会信息 (2021-10-17)

【Share-VDE声明】

与此同时,Share-VDE咨询委员发布了一个声明,描述该计划在图书馆关联开放数据的更广泛背景下的作用,内容包括SVDE概述、数据模型、LOD、PCC数据池、工具和发现(以下为谷歌翻译,仅少量人工干预,如链接数据->关联数据)

Share-VDE在图书馆关联开放数据中的作用(Share-VDE’s Role in Library Linked Open Data

概述

Share-VDE(虚拟发现环境)项目自 2016 年最初的 Share-VDE 原型以来一直是图书馆关联开放数据和 BIBFRAME 使用的领导者。 通过汇集来自欧洲和北美许多图书馆的数据,Share-VDE在异构环境中展示了 BIBFRAME 的强大功能。 Share-VDE 植根于美国国会图书馆开发的 BIBFRAME 数据模型,但扩展到来自许多图书馆的图书馆数据,显示了合作的力量。成员图书馆与 Casalini 和 @Cult 的开发团队合作,贡献了他们的数据、时间和资源来开发 Share-VDE。

数据模型

作为图书馆生态系统中的 BIBFRAME 节点,Share-VDE 提供丰富的数据,可与其他 BIBFRAME 节点互操作。 Share-VDE 将来自成员图书馆的 MARC 规范和书目数据汇集在一起,用权威实体对其进行丰富,并将数据聚类到 BIBFRAME 实体中。 Share-VDE 工作组详细审查了聚类,并扩展了 BIBFRAME 模型以满足现实世界的需求并反映参与图书馆的数据。数据模型的这种发展产生了 Share-VDE Opus(一种 bf:Work),它将所有相关内容表达组合或聚集在一起并代表原始/创造性作品,从而促进与 IFLA LRM 的互操作性。

关联的开放数据

Share-VDE 基础设施基于 LOD 平台,该平台旨在能够自动化创建和发布关联开放数据的过程,而不管数据源格式如何。 Sapientia 集群知识库在 RDF(因此作为关联开放数据)中可用,并可通过 SPARQL 端点和 API 查询访问。

PCC数据池

基于这项开发工作,Share-VDE 被 LD4P3 基金选中来创建 PCC 数据池。 Share-VDE 与 LD4P、OCLC 和 PCC 合作,将所有 BIBCO 和 Conser MARC 编目整合在一起。 Share-VDE 数据模型和聚类算法被应用于创建 PCC 质量 BIBFRAME 数据的开放池。 PCC 数据池将作为编目员使用 Sinopia 创建本地生产的 BIBFRAME 的可信数据源,以及任何用户都可以使用的关联开放数据。

工具

除了其他开发工作之外,Share-VDE 团队还在创建工具来处理数据。 Share-VDE 数据模型预计,在大量自动化实体集群中,某些集群或关系链接将不准确。 J.Cricket 编辑器提供了一种将直接用户专业知识应用于维护 Sapientia 集群知识库的方法。成员图书馆与开发团队也一直在探索和推荐外部数据源,以将其合并到为集群知识库提供数据的规范数据流中。此外,他们正在研究新的规范工具和服务,以与 BIBFRAME 模型保持一致并扩大规范数据的使用。

发现

最后,Share-VDE 带来了许多其他 BIBFRAME 项目所缺少的关键元素——发现。正如 Share-VDE 名称所示,Discovery 从一开始就是该项目的重点。 Share-VDE 发现基于 BIBFRAME,使用实体模型。与基于记录的目录不同,Share-VDE 侧重于作品和作者元素。这种新模型通过专注于原始作品而不是单个图书馆中的特定实例,避免了基于 MARC 的目录中存在明显重复记录的长期问题。这种方法超越了关联数据的丰富(例如数据卡),成为了一种新的发现方法。这是对 BIBFRAME 生态系统的一个巨大补充,展示了关联数据改善用户体验的力量。

总结

Share-VDE 是一个 BIBFRAME 节点,在新兴的书目生态系统中提供可与图书馆和其他 BIBFRAME 节点交换的权威数据。数据模型和工具是由一个强大的合作社区开发的。 Share-VDE 计划是该生态系统的领导者,并支持最终目标:促进丰富和结构化数据的重用,并为研究社区提供新一代获取知识的工具。

鲁迅语录与笔名(鲁迅著作全编系统)

最近周令飞讲自己身为鲁迅孙子压力山大的故事很火。杨敏MM在微信中转发的那篇(鲁迅孙子火上了热搜!点开前没想到这么好笑!/ 浦东青年,2021-10-26),文后附了若干鲁迅的名言警句,并称“鲁迅先生真的说过”——这些年真真假假的鲁迅语录太多了,因此我留言说“我还是很怀疑下面的鲁迅语录是不是真的”。图匪回复说“查北京鲁迅纪念馆网站的鲁迅文献全文数据库即可”,杨敏MM立刻查出:北京鲁迅博物馆的“鲁迅著作全编在线检索系统”,可查证迅哥儿语录真伪[耶]http://www.luxunmuseum.com.cn//wap/

北京鲁迅博物馆(北京新文化运动纪念馆)http://www.luxunmuseum.com.cn/

与上述手机页面(wap)把全文检索放在页面最醒目位置不同,主网站的检索入口很隐蔽,很是找了一阵:

首页——学术研究——在线检索系统 http://www.luxunmuseum.com.cn/cx/

“此系统为鲁迅著作全编系统”,除一站式检索框外,还有3个版块,很方便分门别类使用:

  • 文章浏览(著作、书信、日记、专题)
  • 高级搜索(著作、书信、日记、笔名)
  • 综合统计(全编总字数、单集总字数、单篇总字数,体裁、署名,书信总量、个人书信总量;使用频率最高的前20个字:的、一、不、是、有、了、我、人、之、十、来、日、二、在、也、以、得、上、为、这)

一站式搜索可选“全文”“标题”“署名”。需注意的是,搜索是字符串“完全一致”检索,因此如果“语录”多一个字或者文中少一个字是检不出的。如果想知道鲁迅是否说过类似的话,要适当减少字词搜索。

除此之外,系统使用体验还是相当不错的。结果一览包括:集名、篇名、署名、发表刊物、年/月/日、检索词条内容(上下文片断)、内容(查看正文)。提供了足够多的信息,还可点击链接到全文,搜索词在文中以红字显示。

看到高级搜索中的“笔名”,特别感兴趣。以前编目讲到人名规范,常举鲁迅作例子,有时还会顺便提及鲁迅有一百多个笔名。但这是听来的,鲁迅到底有哪些笔名,自己并不清楚。本网站列出了154个:

* “老师”* EL* EL.* ELEF.* F.S* L* L.* L.S* L.S.* L.S* Лусин* 丁萌* 不堂* 且介* 丰之余* 丰瑜* 乐贲* 乐雯* 令斐* 令飞* 仲度* 何家干* 何干* 余铭* 佩韦* 俟* 倪朔尔* 儒牛* 元艮* 公汗* 冥昭* 冬华* 动轩* 卂* 华圉* 及锋* 史癖* 史贲* 名知* 周乔峰* 周作人* 周卓* 周建人乔峰* 周树人* 周玉材* 周豫才* 周遐寿* 周鲁迅* 唐丰瑜* 唐俟* 培良* 士繇* 姜珂* 子明* 孟弧* 孺牛* 它音* 宓子章* 家干* 封余* 崇巽* 巴人* 常庚* 干* 幹* 庚* 庚言* 庚辰* 康伯度* 康郁* 张承禄* 张沛* 张禄如* 心印* 戛剑生* 敖* 敖者* 敬一尊* 旁* 旅隼* 明瑟* 晏熬* 晓角* 景宋* 曼雪* 朔尔* 未署名* 杜德机* 某生者* 树* 树人* 树人建人* 栾廷石* 桃椎* 梦文* 楮冠* 洛* 洛文* 游光* 焉于* 燕客* 白在宣* 白舌* 白道* 直* 直入* 石介译* 神飞* 符灵* 索士* 索子* 罗怃* 美子* 翁隼* 老师* 自树* 苇索* 苗挺* 茅盾鲁迅* 茹纯* 荀继* 莫朕* 虞明* 许广平* 许遐* 豫* 豫广* 豫才* 豫才丰是草* 赵令仪* 越丁* 越侨* 越客* 越山* 迅* 迅行* 遐观* 邓当世* 铁木社* 长庚* 阿二* 阿法* 隋洛文* 隼* 霍冲* 风声* 飞* 鲁讯* 鲁迅* 鲁迅茅盾* 鲁迅许广平* 黄凯音* 黄棘* 齐物论

以上有若干是2人同署名,如“树人建人”“茅盾鲁迅”“鲁迅茅盾”“鲁迅许广平”等,不应视为笔名;另外还看到有作品全集中其他作者(如“许广平”为《且介亭附集》写后记而列入)。

值得注意的是,其中有“令飞”,用过7次,包括1907-1908年写的4篇文章,以及1930-1934年致许寿裳的3封信——落款竟然用二十多年前的笔名(弟令飞),可见鲁迅晚年曾用来对老友自称。20年后此名用于长孙,不知许广平先生出于什么考虑?