WorldCat书目记录开始批量增加FAST主题

OCLC宣布从9月开始在WorldCat书目记录中逐步增加FAST主题,针对的是已经有LCSH且以英语为编目语言的记录,系统自动在后台处理、预计为期一年。OCLC称此为用FAST强化WorldCat记录,但其实针对已有LSCH的记录,只是分拆现有内容,从内容上应该称不上“强化”——不过多年来OCLC在FAST上已试验多种功能,“强化”后无疑有助于对记录作细粒度的处理

FAST(主题术语分面应用)是衍生自LCSH的完全列举分面标题表[仍为先组、并非元词法],按八个分面拆分LSCH。经处理后的MARC21记录特征是040字段有$dOCLCF。LCSH在MARC21中通常用650或651字段,FAST则拆分成8个字段,如下:
FAST分面——MARC 21字段
个人名称——600
团体名称——610
事件——611
题名——630
时序——648
论题——650
地理名称——651
形式/体裁——655
从说明文档所举样例看,,分拆后没有主题词分组的标识。对于多主题的资源,就可能出现误检,这个是情报检索语言研究中的老问题——假设有一本书讲“美国大选对日本经济的影响”,采用FAST,就可能会在查“日本大选”或“美国经济”时误命中。

via OCLC News — Announcements: Enriching WorldCat with FAST (25 September 2013)
说明文件:EnrichingWorldCatwithFAST
FAST项目主页:FAST (Faceted Application of Subject Terminology)

———-转换样例———-
由说明文件提到的几个样例,可以更清楚地了解FAST的构成。
(1)讲述美国2012大选的“Collision 2012 : Obama vs. Romney and the future of elections in America”一书(OCLC控制号818953763),原LCSH:
650 _0 $a Presidents $z United States $x Election $y 2012.
650 _0 $a Presidential candidates $z United States.
600 10 $a Obama, Barack.
600 10 $a Romney, Mitt.
FAST:
600 17 ǂa Obama, Barack. ǂ2 fast ǂ0 (OCoLC)fst00348231
600 17 ǂa Romney, Mitt. ǂ2 fast ǂ0 (OCoLC)fst00355923
650 _7 ǂa Presidential candidates. ǂ2 fast ǂ0 (OCoLC)fst01075708
650 _7 ǂa Presidents ǂx Election. ǂ2 fast ǂ0 (OCoLC)fst01075747
651 _7 ǂa United States. ǂ2 fast ǂ0 (OCoLC)fst01204155 [两个论题中的地点独立出来]
648 _7 ǂa 2012 ǂ2 fast [论题中的时间独立出来]
从上例可见,FAST并非元词法,仍然有组配(第2个650字段),只是把原650和651中$y时间和$z地点子字段变成了独立的648、651字段。6XX第2指示符7所用主题词表由ǂ2说明(即FAST);ǂ0为OCLC的FAST主题词控制号(648的2012非受控词),用于计算机连接到规范记录,系统可据此同步、纠错等。

(2)上面是一个简单例子,“作品”主题的转换略为复杂:
LCSH: 600 10 $a Shakespeare, William,$d 1564-1616 $t Macbeth.
FAST: 630 _7 ǂa Macbeth (Shakespeare, William) ǂ2 fast ǂ0 (OCoLC)fst01356136
作品主题不按“名称——题名”方式构成,而是取题名,以创作者做限定,用630字段,形式如:题名(创作者)
不知道在没有重名的情况下,是不是可以不用创作者做限定?

(3)更复杂的转换例子是论题中的“事件”:
LCSH:
600 10 $a Washington, George, $d 1732-1799
650 _0 $aTrenton, Battle of, Trenton, N.J., 1776 $v Juvenile literature.
651 _0 $aDelaware River (N.Y.-Del. and N.J.).
FAST:
600 17 ǂa Washington, George, ǂd 1732-1799 ǂ2 fast ǂ0 (OCoLC)fst00178100
611 7 ǂa Trenton, Battle of (New Jersey : 1776) ǂ2 fast ǂ0 (OCoLC)fst01404297 [论题被视为事件]
648 7 ǂa 1776 ǂ2 fast [事件中的时间独立出来]
651 7 ǂa New Jersey ǂz Trenton ǂ2 fast ǂ0 (OCoLC)fst01207908 [事件中的地点独立出来]
651 7 ǂa United States ǂz Delaware River ǂ2 fast ǂ0 (OCoLC)fst01310316 [LCSH的651地点,格式转换为:上级地名ǂz下级地名]
655 7 ǂa Juvenile works ǂ2 fast ǂ0 (OCoLC)fst01411637 [650$v体裁]
事件类似于会议(实际上应该反过来说,只是编目员更熟悉会议),用611字段,格式为:事件名称(地点:时间);地点与时间另外还要用的651与648字段重复揭示。作品类型或体裁,用655字段(本字段相对常见,以往也有用到)。

———-关于FAST——–
FAST始于1998年,当时OCLC正进行著名的对网络资源编目的CORC(Cooperative Online Resource Catalog)项目,需要简化标引规范,让非专业编目员或标引员能够做主题标引。开发FAST的意图:易学易用、分面导航友好、现代设计;主要目标:(1)与现有元数据兼容;(2)易于赋词;(3)检索有效性;(4)维护费用;(5)语义互操作。当时,ALCTS/SAC/SMSA(ALA的图书馆馆藏与技术服务协会之主题访问委员会之元数据与主题分析分委会)正提出元数据记录中主题数据的特定功能需求(ALCTS 1999),与FAST项目的预期结果吻合。目前FAST由OCLC和LC协作,ALCTS/SAC/FAST分委员成员提供建议。

FAST项目的用户界面应用包括:
searchFAST(FAST数据库的全功能检索界面)——重新设计的FASt用户检索界面于2011年11月发布
mapFAST(Google地图混搭原型,使用FAST地理与事件规范;有移动版)
FAST Converter(在Web办面转换LCSH标目到FAST标目。可以粘贴主题部分或上传MARC格式文件进行转换)
FAST Linked Data(FAST关联数据服务)——另有批量下载
assignFAST(手工选择FAST主题自动化:根据输入、选择的主题,转换为带不同子字段标识的MARC字段)
所有检索框均有输入自动提示,提示根据使用频率排列,且不限首词而是任意位置,如查Shanghai,最前面的是:China–Shanghai

FAST在OCLC其他项目中的应用(采用OCLC研究部维护的经FAST强化的内部备份数据访问WorldCat记录):
WorldCat Identities (FAST用于每个WorldCat身份档页面底部的主题标签云)
OCLC Classify(FAST词汇用作“主题”索引)
实验性的“xFinder”应用(如:Cookbook Finder)及某些基于作品的相关应用,如:Kindred Works [参见:OCLC元数据管理研究:食谱探测器与同种作品推荐(2013年9月15日)]
WorldCat.org关联数据
– 正通过FAST/VIAF中心工作,试验以FAST作为馆藏分析途径

OCLC元数据管理研究:食谱探测器与同种作品推荐

看到@银河发呆指南 8月7日在新浪微博上介绍OCLC发布食谱书目数据库Cookbook Finder,很是吸引人:“该书目库收录世界各国图书馆藏食谱及食物、营养相关图书数千种,检索途径有人物、地点、主题(如课程、配料、方法等),浏览途径有主题、作者,如果Hathi Trust或Gutenberg项目中有全文,记录将提供全文链接”。于是前往一观:

OCLC Research: Explore cookbooks and more from libraries around the world with new Cookbook Finder app (05 August 2013)
介绍称为app,其实并非手机应用,是WorldCat的一个实验项目,界面也与worldcat.org相似。从介绍看,最大的特点是基于FRBR的作品,worldcat.org也号称基于作品,除了内容有所限定外,两者在功能上有何不同呢?

食谱探测器(项目页面):Cookbook Finder
访问界面:WorldCat Cookbook Finder

在检索结果上,比worldcat.org明显有改进的是细览页下部:
相关作品推荐,包括同一作者作品及类似作品,显示图书封面。
相似作品采用称为“Kindred Works(同种作品)的实验服务,通过分类号、主题标目、体裁等检索相关资源。
同种作品推荐服务提供API(Recommender API),可面向个别成员馆馆藏做定制。
Kindred Works也有自己的网页界面,首页与Cookbook Finder很像:WorldCat Kindred Works

各种版本,列出同一作品其他版本的封面及基本书目信息,链接到worldcat.org(worldcat.org只在检索结果一览中显示版本数)
比较奇怪的是,与worldcat.org对照,两者汇集的版本并不相同,似乎采用了不同的算法。足见在没有作品ID的情况下,集中同一作品真不是件容易的事。以De’ Medici Stucchi, Lorenza, 1926- 的“Pizza”为例:
— Cookbook Finder汇集了1993-1996年之间的5个版本,其中2个为1993年的;另外在相关作品里还有一个同作者、同书名的,点击该记录链接到WorldCat,是同一出版社1992年的,似应计入成为第6个版本。
— 而在WorldCat中,同一OCLC控制号26404157下汇集的只是3个1993年的版本
两相对比,Cookbook Finder中少了澳大利亚1993年出版的记录(McMahons Point, N.S.W. : Weldon Owen),似也应加入成为第7个版本。

Cookbook Finder目前收录数显然已不止数千,查”food”的结果就有26097条。其中包括电子书记录,比如2.0鼎盛时期谷歌大厨所写的“Food 2.0”,就有电子书。可惜检索结果没有如worldcat.org那样按年份限定,无法方便找到年代较早的图书,也就不知道Hathi Trust或Gutenberg的图书以何种形式提供访问链接(记录在链接到WorldCat的细览页后,有“在线查找”,列出相应的电子资源,包括封面图片等相关资源)。

附记:Cookbook Finder与Kindred Works均属于OCLC研究部的元数据管理活动:Activities——Metadata Management,其中有近20项研究,包括FAST(主题数据术语分面应用)、Classify、WorldCat的MARC使用、Worldcat Identities等,均值得关注。

WorldCat中查RDA记录

OCLC北京代表处8月22日在新浪微博介绍如何在Connexion中搜索RDA记录,即选择著录规则(Descriptive Conventions(dx))查rda,如下图:

在Connexion中搜索RDA记录

想来现在WorldCat中RDA记录数量不少,还需要配合其他条件,才能查到有参考价值的记录。正好看到某位印度馆员开设的RDA博客转贴OCLC Connexion的最新信息,提及OCLC正在依RDA对其书目格式标准(Bibliographic Formats and Standards, BFAS)进行全面更新,同时WorldCat搜索索引中也在依此陆续加入依RDA搜索的信息。

Searching WorldCat Indexes
这个索引只针对馆员界面(包括Connexion编目、FirstSearch参考咨询、WorldCat Resource Sharing馆际互借及WorldShare),国内用得上的人不多,在此只是做个备记。

1、著录规则(Description conventions)(查找所有RDA记录)
标签:dx:(对应字段040 e)
取值:rda

2、RDA内容、媒介和载体类型与OCLC资料类型索引对照表(限定特定RDA类型资源)
标签:mt:或mt=(对应字段336-338)
取值:根据RDA类型术语查找对应的一个或多个OCLC资料类型术语,如:
cartographic dataset(地图数据集),对应:map
cartographic tactile three-dimensional form(三维触摸地图),对应:map, brl(Braille盲文), mmp(地图模型)

via blog Resource Description & Access (RDA): RDA in OCLC WorldCat (August 24, 2013)(有墙)

[2013-12-16 update: 参考LC目录(http://catalog2.loc.gov)中查RDA记录:关键词检索——专家检索:040E rda]