上图关联数据技术与应用研讨班参加记

2012年7月20-22日,在上海图书馆举办了“从文献编目到知识编码:关联数据技术与应用”专题研讨班。
本次研讨班与会者120多人,不乏如来自中信所、国科图的关联数据高手,也有业内资深专家,还包括如北大、深大馆长(想起十多天前在北京的RDA培训,也曾遇到深大馆长)──当然这些馆长本身也是专家。NSTL的超级科技词表STKOS项目组来了19位(来自不同单位),深大、厦大、国图、深圳职业技术学院等也都有多人参加(非会议官方信息,仅就本人接触得知)。

从研讨班日程可以看到,会议内容涉及了关联数据从理论与基本知识,到发布与消费的方方面面──平台和工具(如查询语言、可视化软件),案例及可用资源,知识产权等。
我的题目是《RDA的实施与本地化》(Slideshare,目前被墙),感觉与会议主题不是很搭,得到K师、夏MM及远洋师的启发与帮助,也仔细看了与会者提问集锦,尽可能使内容有针对性,侧重RDA元素集及词汇表的注册,也涉及MARC、ISBD、FR系列元数据注册,在远洋师的提示下,在开讲前加上了WorldCat关联数据所用schema.org的图书馆扩展。这些在设计关联书目数据时,都是重要的备选项。

———-用关联数据做什么(一家之言)———-
自己对关联数据本身所知不多,一直觉得发布关联书目数据应该是国家图书馆、大型联合目录的事,一般图书馆没有什么必要。不过前些天为某刊审一篇稿,是用本体加关联数据解决单个图书馆中各种异构资源silo问题的,发现自己的想法或许并不正确。今天曾蕾老师的“联合仓储数据做成可关联元数据的方法及案例”中有一个近似的例子,不过LODE-BD项目联合的是性质相同的书目数据。对于有百万以上书目数据、加上其他复杂资源的图书馆,这件事过于宏大,只能待技术成熟,至少有最佳实践后再考虑。

于是兴趣点就在除发布书目数据外,一般图书馆还能用关联数据做些什么事情。首先自然是消费,将关联数据mashup到OPAC等(具体内容及方式待探索),会议的收获是了解了更多的消费内容与方式(包括可视化)。
另外在听会中,了解到关联数据在揭示关系方面的功能,忽然悟到,除了单纯的发布和消费外,或许更有意思的是“发布+消费”方式,即以关联数据形式发布特色数据,进而揭示出隐藏的关系,乃至以可视化方式展示。想到学位论文数据库就是个很好的数据源,可以由元数据中的导师信息,揭示出师承关系──硕导、博导、同门等等。

———-会议照片———-
会议办得相当用心。会议注册时设计了提问,了解与会者的需求;会议PPT及相关资料在报到时随U盘发送;最后阶段的unconference,不知道是不是首次引入国内图书馆界?

[update 2012-7-23] 上图搭建利用RelFinder可视化展现关系的平台:

http://lod.library.sh.cn/relfinder/(点击看毛泽东和林彪的关系图

还有:


第一次收到专为会议制作的杯子:关联数据的五星排行。拿着天天喝茶,让关联数据深深地印入头脑中。


雨师席地而坐,时刻准备着为夏MM做助教──会场两个显示屏,一个放PPT,另一个用来实时访问网站做演示。

另外为会上分发了为60周年馆庆制作的《上海市中心图书馆一卡通分布图册》,印有各馆基本信息的二维码,提供的链接是发布为关联数据的各中心图书馆页面(访问网址:http://data.libnet.sh.cn:8080/)。再次体会到上图那种遵循标准的素质,比如采用vcard格式,而不是自定义的。

(图片来自CHUX的新浪微博)

———-会议资料链接———-

研讨班日程安排(将链接最终版PPT)
FOAF制作指南
关联数据讨论组邮件列表:(lldchina@groups.163.com)刚建立,欢迎所有感兴趣者加入

IFLA编目部常委会快讯(37期)·RDA消息

SCAT新闻──IFLA编目部常委会快讯,半年刊。最近的2012年6月号(第37期,PDF),有相当多涉及RDA的消息。
SCATNews: Newsletter of the Standing Committee of the IFLA Cataloguing Section. ISSN 1022-9841

———-ISBD———-
JSC与IFLA的ISBD评审组、ISSN网络2011年11月在格拉斯哥召开的协调会(a harmonization meeting)。会议成果:“各方同意,协调的目的是使RDA、ISSN和ISBD记录功能上可互操作,即在一个标准下有效的记录应当能被映射到任一其他标准。我们认识到,某些问题将花更多时间解决,而一些问题可能被证明是不可调和的,但可以采取一些措施减轻这些差别的影响。”(参见:RDA与ISBD和ISSN的协调。在“RDA在中国的实施和挑战”研讨会上,在向芭芭拉提问时,我认为协调会并不顺利,芭芭拉的回答是协调会结果不错)
另外,JSC提名编目部常委、德国国家图书馆的Christine Frodl(目前也是JSC成员)接任ISBD评审组的JSC联络员。

———-芬兰消息———-
已准备采用芬兰版ISBD统一版(附芬兰例子),并推荐作为芬兰所有图书馆描述已出版图书馆资源的国家标准。
芬兰国家图书馆已经决定采用RDA标准,未来将推荐RDA作为芬兰图书馆中资源描述的国家标准。通过同时采用ISBD统一版,我们相信已经迈出了走向FRBR和RDA的一步。
[芬兰的两步方式:目前推荐全国以ISBD统一版为标准,而国家图书馆先采用RDA,全国日后改用RDA]
(芬兰)RDA计划:2011年春,芬兰国家图书馆决定采用RDA作为新的描述标准,之后成立准备在芬兰实施RDA的计划。RDA将作为芬兰图书馆的资源描述标准,在2014/2015年得到实施
RDA计划始于翻译该标准为芬兰语,以现有资源,估计需至少两年。
根据RDA为芬兰所有图书馆界做资源描述培训将从2013年开始。
在芬兰,正在开发一个新图书馆系统,在设计时考虑FRBR模型和与RDA兼容的资源描述。
芬兰国家图书馆为欧洲RDA兴趣小组EURIG成员。

———-中国图书馆编目界近日活动 / 顾犇———-
2012年5月,中国国家图书馆出版社与ALA就RDA中文翻译签订协议。翻译团队由中国国家图书馆员工及CALIS专家组成。翻译版预计2012年底完成,2013年初出版
李恺(曾为中国首都图书馆编目员、将成为雪城大学信息学院研究生)于2012年3月做了“中国图书馆员的RDA认知度”网上调查。他将在2012年6月的ALA年会期间,在ALCTS的“世界范围的RDA”分会场上,谈与中国RDA实施有关的近期发展及相关问题。(会议见:RDA Worldwide,PPT在评论中)
同时,中国国家图书馆正计划于7月初主办二天的RDA培训及一天的RDA中国实施研讨会(参见)。JSC主席Barbara B. Tillett博士将提供培训并参加研讨会,会议期间,中国编目专家将讨论中国实施RDA的问题、挑战与策略(参见)。
7月下旬,上海图书馆学会将主办图书馆编目与知识编码研讨会,有一些RDA与关联数据的报告。(参见:“从文献编目到知识编码:关联数据技术与应用”专题研讨班
中国主要图书馆将使用RDA对西文资源进行编目,因为他们的很大比例书目记录是通过套录后增加本地字段创建的。对中文资源编目,还要考虑更多问题。RDA最终是否会用于中文资料编目?RDA是否会用作《中国图书馆编目规则》未来版本的基础?均尚未决定,也不会在一两年内决定
———-欧洲考虑采用RDA:欧洲RDA兴趣小组(EURIG)———-
法国国家图书馆Françoise Leresche(略)
———-美国国家RDA实施准备(略)———-
———-编目命名空间更新———-
Gordon Dunsire(FRBR命名空间项目高级顾问)
ISBD命名空间:已开发ISBD第0项内容和媒介类型词表与RDA内容和载体类型词表的映射草案,在SCATNews第36期的ISBD评审组新闻中已报道。在赫尔辛基(年会)讨论前,正广泛接受评论。ISBD和RDA元素集的校准备和命名空间映射草案已接近完成,也将在赫尔辛基(年会)前提供讨论。

剑桥倚天屠龙史

看到游园推荐的一本相当有趣的书:
《剑桥倚天屠龙史》
原名:The Cambridge History of Chinese Kongfu in Yuan Dynasty
作者:Dr. Jean-Pierre Sean
译者:新垣平

此书实际上是网名为新垣平的人、托名Jean-Pierre Sean所著,或者说,两个名称实为一个人的不同笔名。
见过有多人合用一个笔名的,一个人在不同作品中用多个笔名更是常见,但一个人在一部作品中用多个笔名倒是第一次见到。

最近正好对检索点感兴趣,于是根据《中国文献编目规则》、RDA和AACR2探究一番编目时如何选择检索点。

———-《中国文献编目规则》第二十二章 个人名称标目———-
根据《中国文献编目规则》(第二版),通常情况下,依据个人名称检索点选取原则,Jean-Pierre Sean为作者,应作为检索点(701字段;22.1.1.2a),新垣平为译者,也应作为检索点(702字段;22.1.1.2b)。这是通常做法。
但依据确定个人名称标目(形式)的原则(22.2.1.3),就与前述原则冲突了:
a. 一个人一般只能有一个规范的标目名称。
d. 个别作者在不同历史时期或不同领域以不同名称题署文献,都很知名,……可酌情分别建立标目,并作相关参照。
由于在同一部作品中出现,既非不同时期、又非不同领域,不符合d的规定,只能选择一个做规范标目──也就是说,在书目记录中只能做一个检索点。不同名称在规范记录里反映。
如此,根据22.1.1.2a选择“作者”Jean-Pierre Sean吗?由于这是个外国人名,根据22.2.4.6d,无中译名称应根据《世界人名翻译大辞典》等权威工具书译出其姓或名称。手头没有工具书,查了一下,Sean一般译做“肖恩”──估计没人想得到用这个名称去查。
或者,还是应该根据22.2.4.2b,存在多个笔名(网名),应选择最著称的为标目,用“译者”新垣平?二者相比,似乎用后者更合理。

———- RDA 9.2.2.8 有多个身份的个人 ———-
RDA的规定比较宽松,没有时间和领域的限定:“如果个人有一个以上身份,选择与每个身份相关的名称作为该身份的首选名称。个人有一个或多个笔名(含联合笔名),或其真名与一个或多个笔名,均构成多个身份。”在举例中,M.W.Ranney在不同作品中使用多个笔名,均作为首选名称。
也就是说,这里作者和译者均可作为规范检索点。

在芭芭拉的RDA培训中(模块4 个人、家族和团体),举了一个例子《猪小姐的生活指南》,或许与《剑桥倚天屠龙史》有些类似:
Miss Piggy’s guide to life / by Miss Piggy as told to Henry Beard
100 0# $aMiss Piggy.
245 10 $aMiss Piggy’s guide to life /$cby Miss Piggy as told to Henry Beard.
700 1# $aBeard, Henry.

在WorldCat中查到的记录,均以Henry Beard为作者,忽略了猪小姐。
AACR2,22.2B2“单独的书目身份”说明,以不同类型作品作为建立多个身份的条件,与《中国文献编目规则》更接近。

———-疑问———-
对于鲁迅这样有N多笔名的人,按RDA的规定,分别给每个笔名(不包括变异形式)做检索点吗?然后通过连接规范记录,实现集中不同笔名的所有作品?
这种做法或许也不是没有理由的。从《剑桥倚天屠龙史》这样的特例看,在书目中均提供检索点的方式还是合理的。另外前两天刚听某位同行说,有读者对查鲁迅却查到并未署名为鲁迅(实为鲁迅所作)的作品很生气。看来在书目中集中同一作者所有作品的方式,还不见得受读者欢迎。
更人性化的方式或许是,通过规范记录提示读者,鲁迅还有其他笔名呢,要不要也看一看呢?