OCLC元数据管理研究:食谱探测器与同种作品推荐

看到@银河发呆指南 8月7日在新浪微博上介绍OCLC发布食谱书目数据库Cookbook Finder,很是吸引人:“该书目库收录世界各国图书馆藏食谱及食物、营养相关图书数千种,检索途径有人物、地点、主题(如课程、配料、方法等),浏览途径有主题、作者,如果Hathi Trust或Gutenberg项目中有全文,记录将提供全文链接”。于是前往一观:

OCLC Research: Explore cookbooks and more from libraries around the world with new Cookbook Finder app (05 August 2013)
介绍称为app,其实并非手机应用,是WorldCat的一个实验项目,界面也与worldcat.org相似。从介绍看,最大的特点是基于FRBR的作品,worldcat.org也号称基于作品,除了内容有所限定外,两者在功能上有何不同呢?

食谱探测器(项目页面):Cookbook Finder
访问界面:WorldCat Cookbook Finder

在检索结果上,比worldcat.org明显有改进的是细览页下部:
相关作品推荐,包括同一作者作品及类似作品,显示图书封面。
相似作品采用称为“Kindred Works(同种作品)的实验服务,通过分类号、主题标目、体裁等检索相关资源。
同种作品推荐服务提供API(Recommender API),可面向个别成员馆馆藏做定制。
Kindred Works也有自己的网页界面,首页与Cookbook Finder很像:WorldCat Kindred Works

各种版本,列出同一作品其他版本的封面及基本书目信息,链接到worldcat.org(worldcat.org只在检索结果一览中显示版本数)
比较奇怪的是,与worldcat.org对照,两者汇集的版本并不相同,似乎采用了不同的算法。足见在没有作品ID的情况下,集中同一作品真不是件容易的事。以De’ Medici Stucchi, Lorenza, 1926- 的“Pizza”为例:
— Cookbook Finder汇集了1993-1996年之间的5个版本,其中2个为1993年的;另外在相关作品里还有一个同作者、同书名的,点击该记录链接到WorldCat,是同一出版社1992年的,似应计入成为第6个版本。
— 而在WorldCat中,同一OCLC控制号26404157下汇集的只是3个1993年的版本
两相对比,Cookbook Finder中少了澳大利亚1993年出版的记录(McMahons Point, N.S.W. : Weldon Owen),似也应加入成为第7个版本。

Cookbook Finder目前收录数显然已不止数千,查”food”的结果就有26097条。其中包括电子书记录,比如2.0鼎盛时期谷歌大厨所写的“Food 2.0”,就有电子书。可惜检索结果没有如worldcat.org那样按年份限定,无法方便找到年代较早的图书,也就不知道Hathi Trust或Gutenberg的图书以何种形式提供访问链接(记录在链接到WorldCat的细览页后,有“在线查找”,列出相应的电子资源,包括封面图片等相关资源)。

附记:Cookbook Finder与Kindred Works均属于OCLC研究部的元数据管理活动:Activities——Metadata Management,其中有近20项研究,包括FAST(主题数据术语分面应用)、Classify、WorldCat的MARC使用、Worldcat Identities等,均值得关注。

WorldCat中查RDA记录

OCLC北京代表处8月22日在新浪微博介绍如何在Connexion中搜索RDA记录,即选择著录规则(Descriptive Conventions(dx))查rda,如下图:

在Connexion中搜索RDA记录

想来现在WorldCat中RDA记录数量不少,还需要配合其他条件,才能查到有参考价值的记录。正好看到某位印度馆员开设的RDA博客转贴OCLC Connexion的最新信息,提及OCLC正在依RDA对其书目格式标准(Bibliographic Formats and Standards, BFAS)进行全面更新,同时WorldCat搜索索引中也在依此陆续加入依RDA搜索的信息。

Searching WorldCat Indexes
这个索引只针对馆员界面(包括Connexion编目、FirstSearch参考咨询、WorldCat Resource Sharing馆际互借及WorldShare),国内用得上的人不多,在此只是做个备记。

1、著录规则(Description conventions)(查找所有RDA记录)
标签:dx:(对应字段040 e)
取值:rda

2、RDA内容、媒介和载体类型与OCLC资料类型索引对照表(限定特定RDA类型资源)
标签:mt:或mt=(对应字段336-338)
取值:根据RDA类型术语查找对应的一个或多个OCLC资料类型术语,如:
cartographic dataset(地图数据集),对应:map
cartographic tactile three-dimensional form(三维触摸地图),对应:map, brl(Braille盲文), mmp(地图模型)

via blog Resource Description & Access (RDA): RDA in OCLC WorldCat (August 24, 2013)(有墙)

[2013-12-16 update: 参考LC目录(http://catalog2.loc.gov)中查RDA记录:关键词检索——专家检索:040E rda]

OCLC的RDA政策声明

OCLC在2012年初提出“结合RDA实践到WorldCat”讨论稿(Incorporating RDA practices into WorldCat: A discussion paper),向成员馆公开征求意见。当时宣布会在RDA实施前至少3个月公布。1月2日,OCLC公布了它的RDA政策声明(OCLC RDA Policy Statement),将在3月31日RDA实施日,代替当年RDA测试时的政策(OCLC policy statement on RDA Cataloging in WorldCat)。
本政策声明可以总结为两大方面:
– 对编目员来说,OCLC的基本政策是:三年过渡期中,书目不强制推行RDA,但鼓励增加RDA元素,而英语规范则要求立刻按RDA(因为规范库是按RDA的)。
– OCLC将以RDA转换为契机,对现有WorldCat记录进行清理,为后MARC时代数据格式转换做准备。
以下为摘译。
———-OCLC RDA政策声明(2013.3.31生效)———-
OCLC成员馆可以使用任何编目规则提交新的唯一记录,OCLC不要求图书馆使用RDA。
仍以WorldCat作为主记录数据库,也就是说WorldCat中每个载体表现、每种编目语言有一条主记录,同一载体表现不允许以不同编目条例出现多条记录。[换言之,同一载体表现但编目语言不同,则是允许的]
本政策声明源自讨论稿”结合RDA实践到WorldCat”,收到成员馆很多建议。PCC多个工作组对RDA实践的讨论,也对此政策声明有影响。
– 原编
增加新记录,可以按RDA、AACR或任何其他认可的编目条例。当以英语为编目语言创建新记录时,无论是否采用RDA,均需查LC/NACO规范档,并使用其检索点形式。
– 040子字段顺序
a, b, e, c, d。编目语言(b)和编目条例(e)前置并固定位置,方便其他编目员识别。
– 套录
不要求升级主记录,从非RDA条例改为RDA。不要修改RDA主记录为早期编目条例。[可保持原样]
– 升级/强化现有记录
套录时可选择强化或升级记录…到RDA。只有当在编资源在手头时才做,以保证有所有必需的信息。在重新编目为RDA时,必须检查全记录,根据需要调整。
– 混合记录
编辑与替代WorldCat中主记录时,可以选择在现有非RDA记录中增加某些RDA元素,而不根据RDA重新编目全记录。这类编辑包括但不限于:
x 给检索点增加关系词
x 拼写非转录缩写
x 在245字段中增加完整责任说明(取代“[et al.]”
x 增加336/337/338字段
在没有重新编目记录为RDA时,不要将此记录标为RDA。OCLC一般坚持“PCC混合书目记录指南”(PCC Guidelines on Hybrid Bibliographic Records),希望成员馆在编辑现有记录、增加若干RDA元素时,也遵循此指南。
– 一般资料标识(GMD)
如前述指南的推荐,OCLC将在WorldCat记录中保留现有245h三年。编辑现有非RDA记录时,要求编目员保留原有效的GMD,直到2016年3月31日。但重新编目为RDA记录时,要删除GMD。
– 标点与大写
编目员在RDA记录中输入数据时,可以带或不带ISBD标点,前者头标18位(描述编目规则)用i,后者用c。但标目[检索点]都要带标点。推荐将主记录由c更新为i,但不能反之。[还是留恋ISBD标点]
– 平行记录
作为WorldCat政策,仍然允许有不同编目语言的平行记录。不允许不同编目条例的多条记录。
– 现有WorldCat记录的机器操作
OCLC将于2013.3.31后,开始结合RDA实践改变现有WorldCat遗存记录。遗存记录(非RDA记录)需处理为尽可能适合于未来的RDA环境,以便利编目员、系统及目录最终用户。随着未来若干年,后MARC未来会成为现实,现有WorldCat记录的更大一致,将方便升级到另一种元数据格式。
OCLC一开始将致力于更改英语编目记录,其他编目语言将在未来适当时候做类似改变。某些RDA实践尚未完成资源的记录(如根据DCRM等的古籍、根据DACS的档案)将不予处理。OCLC将在OCLC-CAT邮件组及网站上公布改变细节。
期望的改变包括但不限于:
x 增加336、337、338字段
x 拼写255、300、500和504等字段中的非转录缩写
x 转换245、260等字段中的拉丁文缩写为相应的英语
x 转换502学位论文附注字段为多个子字段
x 删除GMD(2016年3月31日后)
x 根据RDA改变标目
标目的期望改变有:拼写如Dept.这样的缩写,按RDA实践改变《圣经》和《古兰经》标目。更多信息见:PCC的AACR2和RDA可接受标目类别工作组最终报告(2011年8月)。OCLC也在继续控制标目计划(Controlling more headings in WorldCat)。
———-参见———-
OCLC的RDA主页:RDA and OCLC