第五届全国文献编目工作研讨会:笔记

2017.11.22-23,参加在洛阳举行的第五届全国文献编目工作研讨会(会议通知),这是连续第4次参加本系列研讨会。由于新规,本次会议改由中图学会信息组织专委会承办,会前还参加了专委会的工作会议。
会议实际仍由国家图书馆中文采编部具体操办,会务安排也一如既往地好。第一天大会报告,上午提问冷场、下午提问也很少,原以为第二天分会场3个报告安排3小时太久,会冷场或提前结束,实际上编目员可能属于慢热型,各组差不多都用满了3小时,报告人时间充分,提问讨论也比较踊跃,结束真到了12点。下午二点前进入闭幕式会场,看到滚动播放的图片,包括分会场讨论的鲜活场景,感慨于会务组的工作效率。
在闭幕式上被司莉老师贴了一个“最具奉献精神”的标签。其实如与来接我的郝嘉树MM所说,开博的初衷是为了分享,但到后来纯粹是作为自己整理思想的笔记本,所以在微信“朋友圈没有,便当不存在”(王波语)的时代,完全没有开公众号的想法——同时也因为鄙视微信的封闭性,不想为它提供内容。

——— 大会报告 ———
第一天大会报告6个:
1、刘炜(上海图书馆):智慧时代的信息组织
报告分3个部分:(1)大数据时代的文献编目;(2)信息组织的历史和未来;(3)从关联数据到智慧数据。Keven对文献编目的宏观认识远超我等只知埋头拉车者。很想摘录几页PPT,但这样博文就太长了,只好放弃——话说最后的“新编目”肯定不是现在编目员的活了,或者说编目员没活了?

2、王军(北京大学信息管理系):面向用户体验的信息组织:电商的生态化经营&图书馆的创新服务
分析用户购物旅程上的信息组织:全局导航、品类导航(分类),搜索词推荐(词表)、条件过滤、结果筛选(分面)……。用电商网站解释什么叫“以用户为中心”:经营的不是商品,是顾客。对于图书馆经营、编目及图书馆目录服务,应该是有启示的。

3、胡小菁(华东师范大学图书馆):国际编目标准现状与进展 2015-2017
介绍IFLA标准规范(2017新标准,UNIMARC、ISBD进展)、BIBFRAME编制进展、RDA更新现状。后来想起BIBFRAME应用竟然忽略了上图,很不应该。好在分会场发言中有许磊代表上图的报告,弥补了我的缺漏。
报告后提问,对于我在解释国际编目原则声明中“表达性”时举RDA一人多身份例,郝嘉树质疑单人多个规范的合理性。我其实对此也曾有过困惑,但后来认识到一人一身份其实只是为了管理方便,并不是基于用户需求的。但感觉回答时没有很好地表达。后来卜书庆老师在她报告前先答此问题,认为从用户任务角度,比如弘一法师和李叔同,显然应该使用不同身份。

4、罗翀(国家图书馆外文采编部):国家图书馆RDA本地化梦想的编织与实现
罗主任上届也讲相同主题。2年间国图的RDA本地化有了很大进展,2017年3月起国家图书馆所有外文语种的编目都开始采用RDA编目,有3本相关图书将出版:《RDA百日通》《国家图书馆RDA本地政策声明(NLC PS)》等。报告中还提到国图已经受邀参加RDA理事会(希望我没听错),感觉RDA在中国的前景似乎亮堂不少。不过,对NLC PS未能如其他国家政策声明那样提供开放访问的电子版,我还是觉得有点遗憾的——至少出个简化版?

5、卜书庆(《中图法》编委会常务副主编、国家图书馆):《中图法》最终用户的知识服务体系方案研究
报告详细介绍《中图法》编制中的“最终用户服务版”。感觉是分面改造简化版,但后台还是会连接到《中图法》。
报告没有说明这个版本会以什么方式向最终用户提供服务,毕竟《中图法》网络版是收费的。
提问阶段,华东政法大学同仁在收费之外,还问到专业分类需要细化的问题。卜老师的回答是:分类法不能代替主题法,专指由主题解决。这一年做了比较多的学位论文分类,对此非常认同。

6、贾君枝 (山西大学经济与管理学院):名称规范档的共建共享
报告全面梳理了各国名称规范档的发展史,以及共享模型(分布式、关联式、中心式、中心链接式),最后提出了中文名称规范档共享发展的3个步骤:步骤1,中心式,实现中文规范档的共享;步骤2,建立与外部数据集的连接(百度百科、维基百科);步骤3:加入VIAF。
报告中提到目前wikidata中有CALIS规范记录链接(CALIS ID),经询问喻爽爽主任,明确这是对方主动收割,并非CALIS与之合作(可见数据公开发布的好处)。关于VIAF,多年前曾询问国图为何不加入VIAF,当时理由是数据质量有待完善,后得知准备好加入时,却遭遇政治障碍,想做好事情当真不易。另外,报告中把中文名称规范联合数据库归入“分布式”,或许并不洽当,因为据我所知是有中心库的。

——— 分会场 ———
第2天上午分会场。共有3个分会场、每场3个报告(基于各自的会议论文),根据自己兴趣,正好走遍3个分会场,最后参与了第1分会场的讨论。

1、首先到第3分会场:许磊(上海图书馆):CNMARC与BIBFRAME映射及其实现——以上海联编中文普通图书数据为例
报告基于实际完成的工作,因而有许多体验,但由于时间关系,有些未能展开。比如报告中提到“作品的边界”,不知道上图是如何确定“作品”的。
提问时,郝嘉树MM问:谁来把这些数据关联数据化?Keven(称在现场给许磊以支持)回答是:机助,由计算机采集结构化信息……将来不可能靠人工。现在急于发布,目的就是让其他行业觉得我们这个行业是有价值的,无需别人重新发明轮子。Keven同时呼吁行业一起来做,坦言上图人员不足,开发之外,后续数据处理还有大量工作。分会场主持人喻爽爽主任表达出合作意愿:CALIS新成立数据中心、有懂MARC的,同时也有高校作为强大后盾。

3、接着到第2分会场:释贤才(龙泉图书馆)非古籍类佛学文献编目工作的实际与分析
本人开会不多,在专业会议中却也多次见到龙泉寺贤才馆长身影,可以想见他每年开会频率不低。记得以前曾听他讲过佛教分类法,了解不少,这次继续了解佛教文献编目。报告中也包含给分类号,与普通图书不同,很有启发。不过对一些字段用法就很想提些建议,比如用统一题名优于编目员自拟题名,再比如内部准印号用设置可检索的自定义编号而不是用一般附注,等等。同时我也不认为应当太多强调某类文献在编目上的特殊性,这不利于编目标准化。不过最终只是听了其他同行的提问,自己并未发言就赶往下一站了。

3、最后到第1分会场:李菡(国家图书馆外文采编部)RDA的自我完善及对国家图书馆RDA本地政策声明更新机制的启示
到时报告已过半,印象最深的是对RDA条款变化的统计分析(详见会议论文)。
针对RDA本地政策声明,主持人上图纪陆恩主任和北大图书馆张明东老师都提到中文问题。可是,前天的专委会上汪东波主任似乎在等《资源描述》国家标准批准后依之修订《中国文献编目规则》。
然后又是国图与CALIS差异的老问题。罗翀主任强调考虑国图以前实践。我建议未来可以仿照LC-PCC PS模式,做一个NLC-CALIS PS,明确两家的区别到底在哪里(可能没什么差别也未可知)。

接下来是报告外的编目工作问题讨论:
海南馆黄海萍老师提出:学完RDA不知道怎么用,想用于实物编目。我的回答是:可以用RDA,有相应规则。(当然实际培训时,多以图书为对象,所以如做实物编目,需要自己去看规则)
另一位老师提问:外包后自己不编目,年轻编目员如何成长?本人最感受益的是中山大学朱美华老师的分享:中大2004率先外包,数据质量一直由编目员把关,外包公司人员深度培训3个月上岗,但上传记录只能是本馆编目员。新编目员做6-12个月后,参加CALIS考试拿证书。本馆与中大一样,是CALIS的B+级馆,无需个人证书即可上传记录,看来也有必要向中大学习,以促进年轻编目员水平的提高。

——— 资料 ———
前几届报告资料下载地址:全国图书馆联合编目中心。本届当可期待。
论文集:《回顾与展望:新媒体时代下信息组织方法的创新与发展——第五届全国文献编目工作研讨会论文集》国家图书馆出版社,2017年11月。ISBN 978-7-5013-6288-2

历届会议参见:
2010年第二届-南京:
第二届全国文献编目工作研讨会·第一天
第二届全国文献编目工作研讨会·第二天
第二届全国文献编目工作研讨会·随感(2010-6-3)
2013年第三届-厦门:第三届全国文献编目工作研讨会:RDA相关(2013-10-23)
2015年第四届-重庆:第四届全国文献编目工作研讨会:随感几则(2015-10-25)

《日本目录规则》2018年版(暂名)

在RDA开发过程中,日本一直跟踪进展,最终决定不直接采纳,而是对应RDA编制(修订)本国的编目规则。参见:编制中的新《日本目录规则》(2013-4-20)

新《日本目录规则》(新NCR)由日本国会图书馆(NDL)与日本图书馆协会(JLA)目录委员会合作编制,目前暂名《日本目录规则》2018年版,计划与2018年底出版。与RDA一样,从开始编制到最终发布,时间总是比计划的往后推,耗时在5年以上。本国还没有动静,未来走向将如何?

由两机构网站获得的新NCR时间线如下:
【2010.6 RDA工具包上线】
2010.9.17 JLA目录委员会发表修订NCR的首个文档:『日本目録規則』の改訂に向けて
【2013第一季度,编制国开始采用RDA】
2013.2.21 JLA的修订方针与计划:『日本目録規則』改訂の方針と進捗状況
2013.9.30 确定由JLA与NDL合作编制
JLA目录委员会:『日本目録規則』改訂におけるNDLとの連携について
NDL馆藏书目部:新しい『日本目録規則』の策定に向けて
2015.2.27 部分章节草案发布
2015.9 修订时间表变化:『日本目録規則』改訂スケジュールの見直しについて
2016.3.3 部分章节草案发布
2016.11.1 部分章节草案发布
2016.12.15 部分章节草案发布
2017.2.3 最终草案全文发布
2017.7.31 公开征求意见结束
2017.10 修订时间表变化:『日本目録規則 2018 年版』(仮称)策定スケジュールの見直しについて
2018.3 以PDF形式发布“预备版”
2018.12 印刷本出版,PDF形式发布

参见:
– 日本图书馆协会目录委员会网站:「日本目録規則(NCR)2018年版」(仮称)
包含编制过程相关信息与资料链接,以及2017.2.3最终草案全文
– 日本国会图书馆网站:新しい『日本目録規則』(新NCR)
包含2017年2月3日最终草案及各部分对应的2015-2016年较早草案(旧案)全文

RDA到BIBFRAME的映射报告

PCC下属BIBCO(单行出版物)和CONSER(连续性资源)分别提出了各自的“标准记录”到BIBFRAME的映射表,同时两个映射任务组也提交了最终报告,总结映射结论及问题。9月时PCC BIBFRAME任务组曾在PCC邮件组公开征求反馈。

PCC的“标准记录”,实际就是目前的完整级记录,作为RDA应用纲要,有RDA条款(元素)与MARC21字段子字段的映射,最新版目前见各自项目的首页
BIBCO Standard Record (BSR) RDA Metadata Application Profile (September 6, 2017 revision)
CONSER Standard Record (CSR) RDA Metadata Application Profile (September 6, 2017 revision)
参见:BIBCO标准记录(BSR)及解读(2016-3-6)

此次标准记录到BIBFRAME的映射,实际上就是RDA到BIBFRAME的映射,即在原应用纲要(前4项)基础上增加6个栏目,包括:
RDA条款与元素、RDA条款号、注释、MARC字段子字段
RDA-RDF(RDA注册属性)、环境(三元组)、LC BF 2.0(属性)、期望值、任务组对BF2.0注释、问题

BIBCO的映射基于CONSER,报告也基本上认同后者观点,因此看CONSER报告就可以获取绝大部分信息。两个报告目前在PCC首页的“What’s New, Decisions, Policies, and Guidelines”部分。
CONSER报告中看到的几个特别关注点:
1、强调机器可执行性(actionable),这方面RDA和BIBFRAME都有需要改进的地方。内容散见于报告各个部分,如下:
– BIBFRAME的date属性推荐值是文字,我们建议使用机器可执行的“类型文字”
– 建议PCC最佳实践应该在可行的情况下,除当前RDA规则要求的转录数据外,鼓励提供可执行数据(如出版、生产、发行、制作)
– BIBFRAME的连续出版物首期、末期属性期望值是文字……记录为机器可操作数据会强化连续出版物描述信息的可用性
– RDA载体特征变化:数量尺寸变化,以往用附注,关联数据环境中建议再用1个带与日期相关的数量属性
– BIBFRAME中使用RDA注册的取值词表,包括:内容、媒介和载体类型,频率,附注类型,职能(关系说明语),体裁形式(作品形式)
– BIBFRAME用空节点+ISSN作为文字。当ISSN有LOD时,推荐链接到ISSN URI

2、关于FRBR四层WEMI与BIBFRAME三层WII,以及FRBR对连续出版物的适用性(“建模与关系”部分)
BIBFRAME关系属性只比RDA关系说明语省略了2个:augmented by (work),complemented by (work)(报告最后建议BIBFRAME增加)。
顺序关系如先前、后续在FRBR模型中为作品-作品关系,在BIBFRAME模型中仍为作品-作品关系,在BIBFRAME中表达相对简单。
垂直或水平关系(如语言版本、补编、部分)因FRBR作品/内容表达合为BF作品而成为很大挑战。
更大的挑战来自IFLA-LRM,建议每个连续出版物作品只有1个内容表达、1个载体表现,导致连续出版物的每个版本和格式作为1个独特的作品,其关系为作品层关系【!】……如果连续出版物的每个新实例也作为单独作品,作品到实例的属性不再需要……

3、管理元数据
如果已经没有记录结构,(基于记录的)描述级管理元数据在关联数据环境中过时了。

——— CONSER报告摘录 ———
Report to the PCC BIBFRAME Task Group: Final Report of the CONSER CSR to BIBFRAME Mapping Task Group

概要
总的来说, 小组发现BIBFRAME可以容纳描述连续出版物资源所需的信息,主要以静态文本字符串。我们还发现,BIBFRAME提供了比MARC环境更大的潜力来揭示连续出版物之间的关系。然而,我们发现,在我们的讨论中出现了一些常见的问题,包括:考虑描述/著录的变更,表示编号和年代信息,以及解决使用机器可执行的URI和使用静态文本字符串间的矛盾。我们还反复讨论了表达连续出版物间关系的复杂性,并有很多关于FRBR和BIBFRAME模型之间差异的对话, 以及在何种程度上实际的连续出版物符合那些模型。我们认为,BIBFRAME的进一步开发可以解决我们在映射工作中遇到的这些挑战。

对CONSER/PCC的建议
1、建议CONSER探索技术与基础结构相关方法,顺应更改连续出版物描述数据的需求
2、建议PCC馆日期尽可能使用类型文字
3、建议PCC最佳实践鼓励在当前RDA条款要求的转录数据之外,尽可能提供可操作数据
4、建议CONSER和BIBFRAME开发界一起开发共同结构,表达可用于连续出版物描述的各种环境的编号和年代信息
5、对变更书目信息或编号和年代信息,PRESSoo和其他关联数据词表的建模可能更详细或健壮。建议CONSER为此目的探索PRESSoo和其他关联数据词表
6、建议PCC建立工作组,承担继续监控(连续出版物前景)活动
7、建议PCC和BIBFRAME界一起识别必要的管理和起源元数据,开发在断言层简单易用记录的方法与最佳实践
8、建议PCC馆对内容、媒介和载体类型,频率,附注,使用RDA注册的取值词表

对BIBFRAME开发的建议
1、明确建模描述性元素的起始与终止日期
2、同前4
3、同前7
4、增加对应RDA关系 augmented by (work) 和 complemented by (work)的属性