EBSCO收购关联数据公司Zepheira

EBSCO信息服务公司上月底宣布收购Zepheira,一家关联数据基础架构提供商:EBSCO Information Services Acquires Linked Data Infrastructure Provider, Zepheira (2020-2-27)

熟悉BIBFRAME开发过程者一定知道Zepheira及其创始人兼首席执行官Eric Miller。2011年美国国会图书馆(LC)启动书目框架转换行动,2012年委托Zepheira建模,2013年初BIBFRAME模型发布、2014年初BIBFRAME词表发布,后来被称为BIBFRAME 1.0。从2013年到2017年,每年2次的BIBFRAME更新论坛,都有Eric Miller的报告。2016年LC推出BIBFRAME 2.0后,Eric Miller在论坛上的报告都围绕Library.Link网络( http://library.link/),一种使用BIBFRAME,把图书馆目录(MARC格式)和图书馆服务信息等转换为关联数据发布,方便通过搜索引擎等网络发现的服务。【相关博文

EBSCO在2015年首次与Zepheira合作,主要在NoveList®Select的数据丰富服务,为搜索阅读资源的用户提供额外的检索点。在其产品(也是一个部门)NoveList的2016年博文有详细介绍:NoveList Amplifies the Power of Linked Data with the Release of NoveList Select for Linked Data(2016-9-29)

其中提到:NoveList和Zepheira之间的持续合作关系已帮助整个Library.link网络的图书馆将成千上万个目录记录转换为数百万个有价值的关联数据资源。为关联数据添加NoveList Select可以将图书馆的关联数据威力提高多达十倍的检索点和连接。例如,Arapahoe Library District开始时有24.5万条MARC记录,然后通过Linked Library Service将其转换为130万个关联数据资源。当添加NoveList Select for Linked Data时,这些连接增加到超过300万。

产品页面(NoveList Select for Linked Data)介绍说:NoveList Select for Linked Data使用NoveList的精选和高度结构化的数据(例如阅读相似推荐、吸引力因子和其他读者信息)来增压关联数据。 这种丰富功能可为关联数据至少增加2-10倍的数据检索点。 更多的数据检索点意味着更多的可见性和更多的相关性。页面还提供了4对数据强化前后对比例子,不但检索点增加,链接内容也更丰富。比如点击作者,链接到的页面提供丰富的作者结构化信息,作品、研究作品,并推荐相似作者等。

在常见问题中(Linked Library Service FAQs)如此介绍Library.Link:library.link是一种幕后体系结构,其中链接的数据已发布并在网络上可见。Web搜索引擎对网络进行爬网以生成搜索结果,然后将其指向您的图书馆。 网络中有超过1000个图书馆位置。

FAQ还介绍了所用的数据格式,以及为什么要使用多种格式:

4种主要关联数据格式:Bibframe, Schema.org, 都柏林核心(DC), 脸书开放图谱(Facebook Open Graph)。再加许多其他的。为什么发布多种格式很重要?因为没有一种可以满足所有关联数据需求的格式。Bibframe是专门为图书馆社区开发的,但是大多数搜索引擎都使用schema.org,而Facebook Open graph用于社交数据。所有这些数据网都可以相互连接,因此数据与不同格式的兼容性越强,连接就越紧密

联合国关联数据服务平台上线

2019年底,联合国图书馆(达格·哈马舍尔德图书馆)宣布上线关联数据服务平台:联合国关联数据服务平台

平台界面有联合国六种官方语言:阿拉伯语、汉语/中文、英语、法语、俄语和西班牙语。目前提供2项服务:

1、联合国书目信息系统叙词表UNBIS Thesaurus

UNBIS叙词表是联合国项目、基金和区域委员会所用受控词表的数据库,用以描述联合国发布成果(议会文件、出版物、报告等)。新平台提供了经过改进的界面,并增加了六种联合国官方语言的功能。尽管术语随着时间而变化,但其受控词表仍可通过始终如一地识别同一概念上的材料来进行主题搜索。

2、可持续发展目标SDG

针对联合国经济社会事务部(DESA)可持续发展目标分类法,为联合国2030可持续发展议程之17个目标及其指标提供IRI标识符。相关实体链接到UNBIS叙词表术语及由联合国环境署维护的SDG接口本体。部署这些通用标识符是为了提供基础设施的关键元素,这将使联合国系统组织和利益相关者可以将其SDG资源映射到语义网上可用的有关SDG的不断增长的知识库中。

参见:

OCLC获梅隆基金资助开发实体管理基础设施

OCLC新闻:OCLC awarded Mellon Foundation grant to develop infrastructure to support linked data management initiatives (2020-1-9)

项目称为“Entity Management Infrastructure”,摘要信息如下:

时间:2年(2020.1-2021.12)

费用:Andrew W. Mellon Foundation资助243.6万美元,OCLC提供所需另一半费用

新闻稿摘译:

  • OCLC将使用资助来发布对于作品和人物的权威性和易于访问的实体描述,作为持久性集中式基础结构的一部分。基础结构将在外部词表和规范档中聚合到这些作品和人物的其他表示形式的关联。
  • OCLC成员关系和研究副总裁兼首席策略师Lorcan Dempsey表示:“要使关联数据普遍使用,图书馆需要可靠和持久的标识符以及它们所依赖的关键实体的元数据。该项目开始建立基础架构并推动整个领域的发展。”
  • OCLC将与LD4P社区(由斯坦福大学图书馆牵头、同样由梅隆基金资助的参与“关联数据生产项目”的图书馆)合作,以确保系统与图书馆关联数据环境的发展相匹配。
  • OCLC期望提供多种访问实体基础结构的选项,其中一些选项可免费提供给图书馆社区,而其他选项则可通过订阅获得。OCLC将通过网络发布实体的URI和元数据,并将为图书馆员工提供编辑、充实和添加到这组实体的方法。OCLC还将提供API,以扩展这些实体在图书馆内外的工作流程中的采用和集成。

【个人理解的“实体管理基础设施”概要】

  • “实体”仅包括“作品”和“人物”
  • 实体标识符(URI)
  • 关联(sameAs)现有规范档(猜测如VIAF、WorldCat Identity和WorldCat Work)和外部词表(比如Wikidata、ISNI……)中的实体
  • 聚合实体的元数据描述(作品和个人的各种相关信息)
  • 与LD4P合作开发【参见:LD4相关博文
  • 基础设施访问:编辑(专业用户贡献),API(应用)
  • 基础设施使用模式:免费+订阅