BIBFRAME试验第1阶段报告

美国国会图书馆(LC)的BIBFRAME试验第1阶段从2015年9月8日到2016年3月31日,评估报告6月上线:
BIBFRAME Pilot (Phase 1): Report and Assessment(June 16, 2016)
报告分两个部分:一是LC合作与教学项目部(COIN)的“准备和培训”;一是LC网络开发与MARC标准办公室(NDMSO)的“第1阶段试验系统”。另有附录A“培训计划”。
报告大大丰富了今年3月底在BIBFRAME邮件组中发布的“BIBFRAME试验项目进展”:
[BIBFRAME] Library of Congress BIBFRAME Pilot update / Paul Frank. 2016-3-31 (参见:《LC有关BIBFRAME开发立场的声明》及试验进展,2016-4-1) 。摘译附后。

via 台国图编目园地:BIBFRAME先導實驗第一階段(2016-08-22)

——— 试验开始前提出“要探索的问题”(摘译)———
PILOT PHASE ONE SYSTEM (Network Development and MARC Standards Office—Sally McCallum, chief)

“第一阶段试验系统”摘译:试验开始前提出“要探索的问题”【及答案】
– 编目员能否录入BF描述到面向BF的系统
使用1.0版编辑器,试验参与者提交了2000余个描述到系统。建立了8个不同资源类型的纲要,帮助录入:专著、乐谱、有声CD、连续出版、地图、蓝光DVD、35mm影片、印刷图片/照片。
– 作品/实例二分法对编目员是否清晰有用?
作品和实例模型清晰,某些属性属于实例、其他特指作品。但试验参与者通常只查RDA规则,查看或录入取值,因此如何了解模型包装不那么重要。
– 录入提示和下拉框是否方便工作?
下拉选择和查找是通用功能。如所期望的改进了数据串的准确性,提供数据链接URI而不需要输入,让录入更有效。若干术语表用RDF描述创建,在下拉框和录入提示支持下赋予URI。
– 编辑器上的标签是否清晰有用?【RDA术语】
标签近乎与RDA同步,并尽可能链接到该元素的主要RDA条款。
试验参与者发现标签和RDA规则链接很有帮助。BF模型中内容表达的处理要求附加解释,因为RDA热衷于内容表达,而BF模型认为内容表达是一个作品,是RDA作品和RDA内容表达间的链接。
– 能否实施适当的检索?
实施搜索适当,但可改进。录入提示字段对已知项检索很有用,因为随录入得到近似所要的,也加速数据录入。也有些“猜你喜欢”搜索,但由于编目员手头有单件,正查找它或它的作品,已知项搜索通常足够了。
有时编目员要搜索未知项,如主题标目或名称、浏览等级而非搜索特定结果。这种情况建议他们首先使用外部工具,再把确认的已知项带回编辑器。第2阶段中,本办公室将与培训部合作,识别与增加附加搜索和浏览功能,以满足编目员的需求。
– MARC记录能否适当转换供编目员使用?【分拆为BF作品、BF实例】
决定试图模拟全BF环境,要求转换LC全部1800万MARC书目记录文档,提供BF模型的后备文件供编目。1350万MARC记录被分为作品和实例记录,产生1340万作品记录和1385万实例记录。转换是可靠的,但仍在进行中。很好地说明作品/实例分离,尽管没有在试验中彻底测试。转换的困难部分是转换题名和名称/题名MARC规范记录到BF框架作为BF作品描述,然后与相关MARC书目记录数据合并,要求转换主题和分类到新作品描述。
编目员需要的MARC规范记录已经转换至RDF,载入已有5年的LC关联数据服务(LDS)。为此试验,LC名称规范在LDS的更新由每周载入到每天载入,以提供及时规范查找。需要提供录入新规范描述到BF系统,但一段时间内不能满足。

结论:
试验达到了其目的,是成功的。参与系统测试的编目员的录入,让那些开发BF者在开发中做出相当大的进步。BF2.0模型和词表已发布,将构成2016年秋下一阶段试验的基础。2.0下创建的数据将不同于第1阶段创建的数据。

rdf:value和rdfs:label的差别

在BIBFRAME 2.0的样例中,通用属性rdf:value或rdfs:label出现频率很高。原因有二:
其一,BF2把大量属性变成了类,因此很多时候表示某种值时,没有属性可用,需要先断言所属类、再取值(如bf:Issn) ;
其二,很多属性定义为对象属性(对应于数据类型属性),即期望值为资源(对应于文字),不能直接用字符串(如bf:title)。
如管理元数据的一个例子(片断):
<http://bibframe.example.org/item/instanceX>
a bf:Instance ;
bf:title [rdfs:label “Medical history” ] ;
bf:identifiedBy [
a bf:Issn ;
rdf:value “2168-7633” ;
…… ] .

至于什么时候用rdf:value、什么时候用rdfs:labe,初看时面对众多不同样例,很感困惑。看BIBFRAME 2.0 RDF Conventions,第8点正是这两个属性的规定,但说了等于没说:
8) rdfs: and rdf: Properties
Use rdf:value and rdfs:label as appropriate when supplying the value of a resource.
后来根据样例揣摩,感觉可以借用编目术语来理解,rdfs:label类似转录,照录被描述资源本身的信息;而rdf:value则是规范形式,取自取值词表或规范档或某个已有的清单(比如ISBN号)。

最近有人在BIBFRAME邮件组中提出类似问题:什么时候用rdf:value?与rdfs:label的差别何在?并提及RDF Schema 1.1,于是再去看了W3C的定义:
RDF Schema 1.1 (W3C Recommendation 25 February 2014)
3.6 rdfs:label(用于提供资源名称的人读版本)
rdfs:label is an instance of rdf:Property that may be used to provide a human-readable version of a resource’s name.
5.4.3 rdf:value(用于描述结构化的值)
rdf:value is an instance of rdf:Property that may be used in describing structured values.

Ray Denenberg提供的官方解释是:从BIBFRAME视角,rdf:value提供机器可处理的内容,rdfs:label的内容用于显示。同时承认“可能有一二种情况不完全符合这个区分(如所举bf:AccessPolicy的rdf:value “unrestricted”多半应该代之以rdfs:label ),但通常规则如此。”可见rdf:value还是rdfs:label,还是有些不定性——不过我觉得此例并无问题,“获取政策”多半从若干种取值中选择(公开、限制等)而不是任意文字描述。
虽然仍有人对分别用rdf:value和rdfs:label持异义,但DPLA的Tom Johnson支持这种区分,指出:标签命名资源,而值则在某种程度上是表达“资源是什么”

对于rdf:value定义中的“结构化的”值,有人提出这是指其值有数据类型,而BIBFRAME例中并没有规定数据类型。Denenberg的回应是,BIBFRAME中rdf:value取值确实是有类型的,即默认为文字或字符串(误用rdfs:literal,Tom Johnson纠正当为xsd:string)。

《BIBFRAME核心类演变分析》撰写记

下午由夏MM得知《BIBFRAME核心类演变分析》发表。去CNKI查文章是否上线了,竟然已有7次下载。

2013年11月的时候,准备写一篇关于BIBFRAME文章。在印象笔记中起了一个宏大标题“BIBFRAME与元数据的未来”,加上标签“to-do”,设置提醒日期为2014年元旦。不过开年后并没有动笔,还错过了《国图学刊》的约稿——其实即使没错过,也不知道写什么好。就这么过了一年半,关注着BIBFRAME(此期间博文有BIBFRAME标签者约20篇),却又觉得无从入手开写。
2015年6月起LC开始陆续发布BIBFRAME修订稿征求意见,感觉BIBFRAME的不定性增加,困惑中婉拒了书蠹精老师的讲座邀请。
接着到了11月,LC发布BIBFRAME2.0草案。仔细研读文本,看BIBFRAME邮件组中热烈的讨论,感觉有东西可写了。于是就BIBFRAME2.0的变化,拟出了7点论文大纲。此时距发愿写BIBFRAME整整2年。
2016年寒假开始写文章,写到一半,感觉面面俱到的7点完全没有亮点,仔细思考后决定抽出其中3点,只谈核心类的变化及意义。边写边等着BIBFRAME2.0正式发布,只是原计划发布的1月过去了,一点动静都没有。虽然邮件组讨论显示,2.0草案肯定会有修改,但结合相关研究报告可以确定,核心类的调整是没有疑问的。
小年夜完成文章初稿,给某人看过,反应很正面,于是愉快地忙活过年去了。年后正月初七即捡起文章修改,正月初八润色停当,就投出去了。三周后退修,根据审稿意见做了不少修改补充,在此对keven表示衷心感谢(由审稿意见不难判断审稿者),当然文中仍然存在的问题完全在我。
4月21日,BIBFRAME2.0发布,细看2.0说明文件,除“单件”没有提及草案中复合单件和简单单件概念外,核心类部分与草案基本一致,文章观点没有与之冲突之处。5月3日收到文章清样,重读一遍,确认可以不必修改安心发表,幸甚!
是为记。