基于BIBFRAME的上海图书馆家谱本体发布

今年6月,夏MM在“数字人文与语义技术”(2014年图书馆前沿技术论坛)上做了《以书目框架建模的上图家谱知识库系统》的报告,介绍上海图书馆已经用BIBFRAME构建了家谱本体。
昨天(11月21日),上海图书馆在网站上[(update 2014-11-23)以关联数据形式]发布了基于BIBFRAME的家谱本体,目前为第一版(V1.0):
上海图书馆家谱本体:http://gen.library.sh.cn

网站长得和BIBFRAME词表很像,也提供了类似的模型视图、类视图和列表视图三种浏览模式。不过,在可视化及浏览导航上,比bibframe.org对人的可用性要好,有助于从整体上快速了解该本体:
– 模型视图:提供了5个类(核心类?)的可视化图示,分别是:
BF的作品Work、实例Instance、拥有单件HeldItem
自定义的家族Family、个人Person
– 类视图:左侧以等级方式展开所有类,包括:
BF类17个(除顶级类bf:Resource)
自定义shlgen类5个

当然比形式更值得关注的是内容,尤其是针对家谱资源的扩展内容。从类视图看,扩展的5个类(及属性)分别是:
(1)bf:Family的子类shlgen:Family(包括属性:始祖、支祖、始迁祖、名人、散居地)
(2)bf:Person的子类shlgen:Person(包括属性:字、名、行、号、家族、迁徙、时代)
(3)bf:Event的子类shlgen:Event
(4)shlgen:Event的子类shlgen:Migration(包括属性:原居地、迁居地)
(5)shlgen:FamilyName(包括属性:姓氏值)
扩展同名子类(而不是直接采用BF类)的目的,是要定义家谱独特的属性(见上)或类(迁徙事件)。
据了解,设置顶级类shlgen:FamilyName(姓氏),是为了未来扩展更多(超出家谱资源本身的)属性,比如姓氏的发源地、变迁等。

从列表视图看,上图家谱本体的类与属性的数量是:
– 类(Class):23个 = 18个BF类 + 5个shlgen类
– 属性(Property):49个 = 31个BF属性 + 2个FOAF属性 + 16个 shlgen属性(“事件”目前未出现在类视图中)

参见:
Bibframe.org的类与属性发布(2014年1月27日)
当时BIBFRAME定义了52个类、266个属性

数字人文 vs 电子科学(“数字人文与语义技术”会议报告随记)(2014年6月20日)

[update 2014-11-23] 网站的“发布说明”对该本体做了介绍(见下),右侧栏还有相关的论文及会议报告链接(Publications & Presentations(资料)),目前有如下三个:
– 刘炜,夏翠娟:《书目数据新格式BIBFRAME及其应用》大学图书馆学报,2014,1
– 夏翠娟:以书目框架建模的上图家谱知识库系统
– 夏翠娟,刘炜,张磊,朱雯晶:《基于书目框架(BIBFRAME)的家谱本体设计》图书馆论坛,2014,11

———-上海图书馆家谱本体第一版(V1.0)发布说明(全文抄录)———-
上海图书馆家谱本体是上海图书馆家谱知识库系统的前期成果,是为了更深入地对上海图书馆丰富的家谱馆藏资源进行基于内容的深度加工而设计的本体模型,包括一套术语词表。本体模型基于书目框架(BIBFRAME)而设计,词表也复用了BIBFRAME和FOAF的某些术语,同时根据家谱的特殊性自定义了少量术语。复用自BIBFRAME的术语前缀为bf,如bf:Work,自定义的术语前缀为shlgen,如shlgen:Person。

上海图书馆家谱本体此次在本网站发布的是第一版(V1.0),随着家谱数据的处理和家谱知识库系统建设的进一步深化,将来会进一步扩展。

本网站对上海图书馆家谱本体的发布采用了关联数据技术,遵循关联数据的四原则。
术语均赋予了URI,如http://gen.library.sh.cn/vocab/Person。
实现内容协商,如用普通的浏览器访问http://gen.library.sh.cn/vocab/Person,系统将返回Html页面,当用语义浏览器或语义代理(程序)访问http://gen.library.sh.cn/vocab/Person,系统返回关于Person的RDF/XML数据。 用W3C的RDF Validator可以体验。

本网站提供三种视图模式供用户浏览: 模型视图(Model View)、 类视图(Class View)和 列表视图(List View)。
模型视图(Model View):可视化地展示了家谱本体类和属性间的关系。
类视图(Class View):通过父类和子类的层级关系浏览类和属性。
列表视图(List View):按照类和属性名的首字母顺序排列展示类和属性。