网络级编目/Web范围编目(Network Level/Web-Scale Cataloging)

OCLC的Matt Goldner和Karen Calhoun,1/14在ALA仲冬会议的ALCTS论坛上作题为“Web范围的编目与元数据管理”(Web-Scale Cataloging and Metadata management)的发言。起了个很好的题目,实质在于推销其WorldCat系列服务。因为备注随PPT一并发布,所以比单纯看PPT更清楚其内容。

前半部分Matt Goldner (Executive Director, End User Service)讲的内容是为后面的广告作铺垫,但似乎更有意思些:

开篇引用Taiga论坛2006/3/10以“未来五年内”为前提的危言耸听(Provocative Statement)之六:
(未来五年内)不会再有单一的图书馆网站,取而代之的,是图书馆的数据被推送到万维网的许多起始点,直接推送给用户。
[其实危言耸听之五与编目更相关:大量图书馆将不再有本地OPAC,取而代之的是迈入数据集成的新时代(包括共享目录或集成进发现工具的目录)。ERM系统与ILS合而为一,“发现过程”将被外包。]

继之指出已经对信息的创建、获取与用户期望产生革命性影响的信息市场三大趋势:

市场趋势一、信息传递模式改变
企业(.com)与非赢利组织(.org)之间,图书馆与开放网站之间的衔接随处可见:
@ 搜索服务如Google Scholar,Yahoo Subscriptions及微软学术搜索,寻求将传统的图书馆内容与服务集成进主流搜索引擎;
@ 与此同时,图书馆服务机构与非赢利组织,正寻求通过如Gale’s AccessMyLibrary,Elsevier’s Scirus及OCLC的Open WorldCat这类项目,将图书馆馆藏集成进开放网络;
@ 与公私合作伙伴的大规模数字化计划,包括Google图书搜索、开放内容联盟、微软图书计划,已经开始把印刷馆藏送上网络;
@ 还有许多图书馆用户的支持性服务:CiteULike,LibraryThing等。[貌似OCLC第一次提及LibraryThing]
@ 服务也不落后:通过QuestionPoint,Wondir,Yahoo Answers,Google Answers等,参考咨询台移上了联机平台。
图书馆门户方面,改变也相当迅速:ERM,数字机构库。
底线:图书馆内容与专业的传递系统不断地由公私合作伙伴网络构成,而不是单一的图书馆门户或物理建筑。

市场趋势二、信息内容性质改变
1、超过五千万美国人创建与贡献网络内容……人们评论并编目各种图书、音乐、视频、播客及个人文集。
2、爆炸的数字内容既有评论性质的(观点、想法、评级等),也有新创建的。
3、……

市场趋势三、信息用户体验改变
@ Web 2.0,社会网络及分众分类(标签)改变了人们联机发现与共享信息。“集体智慧”的力量及Web 2.0的社会方面使发现适用信息变得方便而有趣。
@ 在信息传递与信息环境上的这些变化当然会重塑消费行为。最近出版的Gartner小组报告讨论了2015年可能出现的信息消费行为……
信息定制
个人编程设备
远程合作
行为的转变需要我们改变传递服务的方式。

以前:用户围绕图书馆建立其工作流程
现在:图书馆必须围绕用户工作流程建立其服务

以前:资源稀缺而注意力丰富
现在:注意力稀缺而资源丰富

问题:我们如何 *在需求点上* *通过网络* *向用户* 提供我们的价值──馆藏、服务 *与* 社区

提出问题之后,后半部分由Karen Calhoun (VP, WorldCat and Metadata Services)讲主干内容,推销WorldCat系列服务:

一种新的图书馆:拓展与参与 [以一个新的概念起始]
A New Kind of Library: Outreach and Engagement
@ 更多参与研究、教学与学习资料与系统
@ 更多参与本地社区:人、社区与社会网络
@ 使图书馆馆藏与馆员令用户更可见
@ 转向新一代系统与服务

这一代的系统与服务
[将颇受关注的新一代OPAC归入“这一代”:AquaBrowser,PennTag?,Drexel Univ.,理由也很说得通]
总体来说,重复的努力、增值,降低了我们可以向最终用户社区提供的快速响应。

Web范围、基于社区的元数据管理如何?
目前可能做到什么?
@ 全球性发现,本地获取(Worldcat.org / Find in a Library)
@ 本地界面,通达全球(WorldCat Local;Facebook的WorldCat by OCLC)

全球思考、本地实现
虚拟国际规范档(VIAF)
WorldCat身份档(WorldCat Identities)

另外,首批参与WorldCat Local的华盛顿大学图书馆,作了有关“网络级编目”的发言,其实是对由本地集成系统转换到使用WorldCat Local过程中遇到问题的一些介绍及改善建议:
Network Level Cataloging: The View from a Member Library
Diana Brooking, University of Washington
http://www.oclc.org/news/events/presentations/2008/brooking_netcat.ppt

Via Cataloging Futures: ALA Midwinter: Moving Library Services to the Network Level

参见:
WorldCat Local:取代本地OPAC?(2007-04-16)
WorldCat的Facebook应用 (2008-01-04)
规范档2.0:WorldCat身份档 (2007-02-14)
编目未来 (2007-12-17):编目发展趋势之“联合目录本地化”

LC书目记录转换工具

远洋留言,介绍OCLC的xISBN和LC的书目记录转换工具。xISBN以前关注过,LC的这个工具却是闻所未闻:

Search LC Catalog by Standard ID
http://lcweb2.loc.gov/diglib/tools/html/searchStdNum.html
[update 2008-9-20网址改为:http://lcweb2.loc.gov:8081/cocoon/test/html/searchStdNum.html]

输入LC控制号(LCCN)、ISBN或ISSN,选择格式,即可返回相应格式的书目信息,繁简各不相同:

[owc] OpenWorldCat View (OCLC的Open WorldCat显示格式)
[marctags] MARC Tags View (MARC字段名格式)
[english] English Tags View (MARC文字说明格式)
[ser2dig] Ser2Dig MiniBib View (不明,似乎是LC所用Voyager系统的馆员用表格形式)
[srwdc] SRW Dublin Core XML Record (SRW DC XML记录)
[mods] MODS XML Record (MODS XML记录)
[none] SRU Result Set with MARC XML Record (MARC XML记录的SRU结果集,这种格式可以是多记录的)
[rss] RSS View (RSS格式,最简单的信息加链接,这种格式可以是多记录的)
[mods2rdf] RDF MODS XML Record (SIMILE version) (RDF格式的MODS记录,SIMILE版)

逐一试过,看来它是用不同的样式表来显示不同的格式(上段方括号中即样式表名称),基本句法是:
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=[LCCN/ISBN/ISSN]&stylesheet=[样式表名称]
(在没有样式表名称,或样式表名称有误时,显示[none]格式)

如“Information circular”一书的RSS格式(此书较旧,没有ISBN,用其LCCN号86655102):
http://lcweb2.loc.gov:8081/diglib/admin/test/sru.xml?stdID=86655102&stylesheet=rss

这应该是一种Web服务了,可以适应不同的格式要求。看URL,试验中,也没查到有关该工具的说明信息。未来会开放到什么程度?
远洋2007/11听LC书目控制未来工作组报告,第一感想是“Users不光是人,还有applications”。这就是LC面向机器用户的一个试验吧。
不过,编目员也是可用的,在没有Z39.50客户端的时候,此法查书目比用LC联机目录速度会快很多,只不知道数据是不是完整。

附:
远洋留言(发表于2008-01-23 01:08:47)
Thought you would be interested to know another tool:
It is a record conversion tool that have been developed at LC. : http://lcweb2.loc.gov/diglib/tools/html/searchStdNum.html
By typing an ISBN you would be able to see several formats for the item, including all popular ones related to MARC and MODS, as well as DC, RSS, RDF/MODS, etc.
Hope you can access it.

SIMILE: Semantic Interoperability of Metadata and Information in unLike Environments
http://simile.mit.edu/
SIMILE is focused on developing robust, open source tools that empower users to access, manage, visualize and reuse digital assets. Learn more about the SIMILE project.

豆瓣能不能更方便添加图书信息?

虽然经常跟人提豆瓣,也不时用豆瓣查书,但豆瓣红火起来的时候,自己已过了看到有意思的网站就注册的网络兴奋期,再则近年很少看书,所以一直没成为注册用户。上个月办公室搬家,清理搬了几次的东西,其中有一叠练习薄,三十来本,是毕业后近十年间的读书笔记,才知道原来自己毕业后也还是读了一些书的。笔记肯定是没什么用了,但不想把这些记忆扔掉,就想到用豆瓣来记录。

注册豆瓣后首先做的事是收藏自己读过的书。豆瓣中已有的书,做起来十分方便。不过我那些N年前的书,豆瓣没有收录的相当多,要添加书目信息就实在太麻烦了,根本超过我的想象:

第一,添加图书需要提供ISBN号。这或许是为了避免用户随意添加不存在的书目信息,但没有ISBN号的老书并不在少数。国内版的按说明可以用统一书号,港台版的就没有办法了。再则,早年看过的书,手头并没有,无论是ISBN还是统一书号,根本无从获取。凡此种种,大多数人只能放弃,豆瓣也就少了通过豆友的力量增加书目信息的机会。

第二,要自己逐条输入各项信息(作者、页数、出版社、出版年等)。虽然信息不全也可以完成添加,但这种完全靠手工添加所有信息的原始操作方式,与我想像中技术高超的豆瓣距离实在太远。

第三、以ISBN号添加图书的方式,不适合国内出版业普遍存在的一个ISBN、多种图书的现状。我喜欢的烹调书常常是一套丛书一个ISBN号,比如《亚洲经典炒面》,豆瓣的图书题名、封面图片与简介三者完全不搭调,应该就是不同的豆友各自输入自己所读图书信息所致。正规出版社的学术著作也不能避免这种情况,比如北京大学出版社的《现代汉字和计算机》(1989年出版)和《中国大学英语教学研究》(2001年出版),我想提供前者信息,豆瓣已经有后者了,我也就不想再掺和进去,结果只能放弃。

也算做了这么多年的编目,提供ISBN当然难不倒我──查国家图书馆目录,匿名登录。如果查到后没有ISBN号,则点“字段名格式”,复制“统一书刊号” (不是图书馆员,又有谁知可以由此获取统一书号?)。依编目员的习惯,查到的信息尽可能完整提供给豆瓣了。查的过程中发现,基本上国内正规出版物国家图书馆都有收藏。
很容易把豆瓣与LibraryThing做对比。LibraryThing发展势头猛,一年半前用户数才5万(当时豆瓣用户数20多万),目前已达343,131。LibraryThing搜罗了很多图书馆的OPAC,所以无需用户输入太多信息,系统就自动把书目信息取来了,用户只需确认或者修改就行了。难道只能感叹国内的网络生态与国外不同?国图并没有完全开放它的书目信息,刚才试查,似乎Z39.50服务器也拒绝匿名访问了──原来是可以访问基本信息的。
前段日子,有位网友来信说要通过程序,把图书馆的书目信息都搜罗到自己的数据库中。豆瓣当然是不屑做这种恶化网络生态之事的。不过,在用户提供少许信息时,系统发出搜索请求、获取书目信息,当用户确认后,再保存到自己的系统中,应该也属于正常使用吧?我不知道豆瓣目录收录的图书有多少种,LibraryThing截止目前的数量是2,891,176种

参见:
用“豆瓣”的一站式图书搜索帮助编目 (2005-09-06)
thingISBN――用户视角的FRBR化成果 (2006-07-02)