网络级编目/Web范围编目(Network Level/Web-Scale Cataloging)

OCLC的Matt Goldner和Karen Calhoun,1/14在ALA仲冬会议的ALCTS论坛上作题为“Web范围的编目与元数据管理”(Web-Scale Cataloging and Metadata management)的发言。起了个很好的题目,实质在于推销其WorldCat系列服务。因为备注随PPT一并发布,所以比单纯看PPT更清楚其内容。

前半部分Matt Goldner (Executive Director, End User Service)讲的内容是为后面的广告作铺垫,但似乎更有意思些:

开篇引用Taiga论坛2006/3/10以“未来五年内”为前提的危言耸听(Provocative Statement)之六:
(未来五年内)不会再有单一的图书馆网站,取而代之的,是图书馆的数据被推送到万维网的许多起始点,直接推送给用户。
[其实危言耸听之五与编目更相关:大量图书馆将不再有本地OPAC,取而代之的是迈入数据集成的新时代(包括共享目录或集成进发现工具的目录)。ERM系统与ILS合而为一,“发现过程”将被外包。]

继之指出已经对信息的创建、获取与用户期望产生革命性影响的信息市场三大趋势:

市场趋势一、信息传递模式改变
企业(.com)与非赢利组织(.org)之间,图书馆与开放网站之间的衔接随处可见:
@ 搜索服务如Google Scholar,Yahoo Subscriptions及微软学术搜索,寻求将传统的图书馆内容与服务集成进主流搜索引擎;
@ 与此同时,图书馆服务机构与非赢利组织,正寻求通过如Gale’s AccessMyLibrary,Elsevier’s Scirus及OCLC的Open WorldCat这类项目,将图书馆馆藏集成进开放网络;
@ 与公私合作伙伴的大规模数字化计划,包括Google图书搜索、开放内容联盟、微软图书计划,已经开始把印刷馆藏送上网络;
@ 还有许多图书馆用户的支持性服务:CiteULike,LibraryThing等。[貌似OCLC第一次提及LibraryThing]
@ 服务也不落后:通过QuestionPoint,Wondir,Yahoo Answers,Google Answers等,参考咨询台移上了联机平台。
图书馆门户方面,改变也相当迅速:ERM,数字机构库。
底线:图书馆内容与专业的传递系统不断地由公私合作伙伴网络构成,而不是单一的图书馆门户或物理建筑。

市场趋势二、信息内容性质改变
1、超过五千万美国人创建与贡献网络内容……人们评论并编目各种图书、音乐、视频、播客及个人文集。
2、爆炸的数字内容既有评论性质的(观点、想法、评级等),也有新创建的。
3、……

市场趋势三、信息用户体验改变
@ Web 2.0,社会网络及分众分类(标签)改变了人们联机发现与共享信息。“集体智慧”的力量及Web 2.0的社会方面使发现适用信息变得方便而有趣。
@ 在信息传递与信息环境上的这些变化当然会重塑消费行为。最近出版的Gartner小组报告讨论了2015年可能出现的信息消费行为……
信息定制
个人编程设备
远程合作
行为的转变需要我们改变传递服务的方式。

以前:用户围绕图书馆建立其工作流程
现在:图书馆必须围绕用户工作流程建立其服务

以前:资源稀缺而注意力丰富
现在:注意力稀缺而资源丰富

问题:我们如何 *在需求点上* *通过网络* *向用户* 提供我们的价值──馆藏、服务 *与* 社区

提出问题之后,后半部分由Karen Calhoun (VP, WorldCat and Metadata Services)讲主干内容,推销WorldCat系列服务:

一种新的图书馆:拓展与参与 [以一个新的概念起始]
A New Kind of Library: Outreach and Engagement
@ 更多参与研究、教学与学习资料与系统
@ 更多参与本地社区:人、社区与社会网络
@ 使图书馆馆藏与馆员令用户更可见
@ 转向新一代系统与服务

这一代的系统与服务
[将颇受关注的新一代OPAC归入“这一代”:AquaBrowser,PennTag?,Drexel Univ.,理由也很说得通]
总体来说,重复的努力、增值,降低了我们可以向最终用户社区提供的快速响应。

Web范围、基于社区的元数据管理如何?
目前可能做到什么?
@ 全球性发现,本地获取(Worldcat.org / Find in a Library)
@ 本地界面,通达全球(WorldCat Local;Facebook的WorldCat by OCLC)

全球思考、本地实现
虚拟国际规范档(VIAF)
WorldCat身份档(WorldCat Identities)

另外,首批参与WorldCat Local的华盛顿大学图书馆,作了有关“网络级编目”的发言,其实是对由本地集成系统转换到使用WorldCat Local过程中遇到问题的一些介绍及改善建议:
Network Level Cataloging: The View from a Member Library
Diana Brooking, University of Washington
http://www.oclc.org/news/events/presentations/2008/brooking_netcat.ppt

Via Cataloging Futures: ALA Midwinter: Moving Library Services to the Network Level

参见:
WorldCat Local:取代本地OPAC?(2007-04-16)
WorldCat的Facebook应用 (2008-01-04)
规范档2.0:WorldCat身份档 (2007-02-14)
编目未来 (2007-12-17):编目发展趋势之“联合目录本地化”

WorldCat的Facebook应用

在我的Facebook首页上,放了不少机构的OPAC应用。昨天在IFLA的DIGLIB邮件组中看到OCLC为WorldCat做了个Facebook应用,便去久违了的Facebook一看。在应用目录中查WorldCat和OCLC都没有。想直接访问信息来源一看究竟,却又被功夫网罩住了。
本来是订了OnlineSocialNetwork这个BLOG的,但最近这半个月,Google Reader访问一直不顺,常常一个晚上一直显示“正在加载”,像是让我安心干活,别管世事。2007年初的这几天,因为Bloglines用得不爽,改换到Google Reader。今天实在很想看看Facebook中的WorldCat,便在一年后重回Bloglines,得以一睹WorldCat by OCLC,并且毫不犹豫地加进了我的应用。看链接,原来网址就是:http://apps.facebook.com/worldcat/。

毕竟是大家,做得很精制。
首页(Home)中上部是一个快速检索框,并声称快速检索是基于你在Facebook档案中所填兴趣的(Quick searches are based on the interests you’ve added in your Facebook profile.)。随便查一下information,第一本“世界是平的”(The world is flat : a brief history of the twenty-first century),第二本中文书《转型中国的行政信息公开》(Freedom of administrative information in reforming China),好象真与我有点什么关系。从URL上看,也的确加进了Facebook的用户编号。不过另开一个浏览器查,结果也是一样。摆谑头?或者说,WorldCat的检索结果,本来就考虑过用户IP或操作系统与浏览器语言什么的。顺便说一句,查询后是跳到WorldCat页面显示结果,而不是在Facebook中,看来这种方式已被Facebook接受了。
首页下部是从WorldCat书单中的“待读”中随机选出的三个封面,每次进入都不一样。点击最上部的"Something to Read"选项卡,相当于刷新了这部分页面,并在屏幕下方增加了”More books to read”按钮。每按一次此按钮,如同刷新本页。
"Favorite WorldCat Lists",上部是本人的书单,下部是朋友的书单,充分体现了社会网络功能。大概我的朋友都没有提供书单信息,所以下面是空的。但上部就有一个bug了,虽然我没有提供书单信息,也不应该把错误代码显示出来吧——故截图留念(今天访问这个错误已经更正了,很珍贵的截图啊^-^)。
"Invite friends"做得很漂亮,可以同时向多个已有的朋友发送邀请,也可在这个界面查找新的朋友。
高级检索(Advanced)提供了关键词、题名、作者、主题与ISSN/ISBN/OCLC号五个检索途径,以及内容、读者对象、语种、文献类别及出版年五个限定条件。

(2008-01-05 update) 另见:WorldCat in Facebook屏幕截图系列

Via: Friends:Social Networking Sites for Engaged Library Services
WorldCat Facebook App Now Available

参见:图书馆的Facebook应用 (2007-08-04)

FAST: 主题词分面应用

    远洋过客在“Web化DDC·浏览LCSH”下留言,提示比“浏览LCSH”更早网络化LCSH的FAST项目。看后本想恶补一番,最终只略微进了点补,先踩个脚印。

    OCLC在多年前开始对LCSH进行分面处理,把先组定组式的标题表,拆分成各个“面”的主题词,直接使用而无需在标引时构造,所用词仍与LCSH兼容。项目名为“主题词分面应用”,简称FAST(FAST: Faceted Application of Subject Terminology)。研究组成员以Edward T. O’Neill为首,除了另外一些OCLC人员外,还有肯塔基大学的Lois Mai Chan和LC的Lynn El-Hoshy。O’Neill 还负责/参与OCLC与VIAF(虚拟国际规范档)和FRBR相关的研究。

介绍:
    在项目主页(http://www.oclc.org/research/projects/fast/)上可见FAST的最早报告是在2001年的IFLA年会预备会上(2001/8/14-16),最新报告是在2006年ALA会年上(2006/4/24)。
    这份报告作者Ed O’Neill和Lois Mai Chan,题名"A Faceted LCSH Based Subject Vocabulary",标明是OCLC与LC的合作研发项目。

背景(需要新方法):电子资源茁壮成长、元数据方案大量涌现、需要主题访问新方法、缺乏技术熟练的主题编目员
要求(Web环境下的主题词表):优化检索点,简单的结构与句法,可由非编目员在非图书馆环境下使用,语义互操作,兼容MARC、DC及其他通用元数据方案,易于维护,适合计算机辅助规范控制。

什么是FAST:一个基于LCSH术语的丰富控制词汇表,简化的应用句法。
FAST的原则:根据功能对标题进行分类的分面方法;以简单的应用句法保持LCSH词汇的丰富性;提供多层次方法,允许不同层次的主题表达。
FAST特征:
词汇:同一分面中的术语──枚举;不同分面中的术语──分列
检索:同一分面中的术语──先组;不同分面中的术语──后组
八个分面:论题、地理、形式(体裁)、时序、个人名称、团体名称、会议、统一题名(后二者尚未完成)
FAST优点:标题构造在词汇表中而非在应用层;适应先组与后组标引与检索;适用于计算机辅助标引与规范控制;比高度枚举式词表维护更方便经济;便利主题数据与跨领域检索的匹配;适应不同检索模型。

试用:
    FAST规范文档的使用界面名为测试数据库(OCLC FAST Test Databases),入口位于:http://fast.oclc.org/。该处还链接有名为《FAST应用指南与文献》的手册草稿(PDF, 484K, 80p. 发布日期2007-1-12)。
    进入测试库后可以看到数据库的进展,论题、个人名称主题、团体名称主题、地理、时期、题名、事件、体裁已完成,仅参照记录进行中,看来这一年进展顺利(“会议”属“事件”)。
    以前曾试用过,当时还没有写博,故而也没有留下记录。这次再用,想起上次使用的感觉──无法作为编目辅助工具使用。系统应该不是为人查用的,既没有前方一致查询,也没有精确查询,要确切地查到一个词并不容易。如在论题中查“information”,用高级检索,命中达2533条,且按首字字顺显示结果,以information起首的主题词出现九百条之后;由于information本身并非主题词(不够精确以至不足以作为主题词?),无论在主标题(Main Heading)还是副标题(Subdivision)中查,检索结果都为0。
    原以为FAST后将标题表改成了后组的叙词表,其实FAST本身有相当数量的先组词,如记录号为fst00801549的“Agriculture–Information services–Public opinion”,就由三部分组成(如前述PPT所述,属同一个“面”?)。从前述PPT看,标引时没有LCSH的浮动表之类需要在使用时构造主题词,而是列举出所有主题词,因之也不是叙词表。如果从句法上看,属元词表。

    项目主页上还列有ALA 2006年会上另外两个报告,其中一个是杨百翰大学Shannon Hoffman的"Looking Deeper into Using FAST: Report on three projects using the FAST Authority File"(ppt:97K/13 slides),介绍FAST在三个项目中的应用,他的结论是两个:1、FAST需要改进检索;2、要非编目员作主题分析并达到一定的专指度,需要加以培训。
    想来他的想法与我一致,FAST设想的“非编目员在非图书馆环境下使用”的目标并不容易达成。

附:FAST常用字段
FAST采用MARC21规范格式,一些字段说明:
001 FAST记录号(fst……..)
043 地理区域代码
100/400 FAST个人名称
110/410 FAST团体名称
111/411 FAST事件(含会议)
130/430 FAST题名
148/448 FAST时序名称
150/450 FAST论题
151/451 FAST地理名称
155/455 FAST载体
688 一般有两条,分别是LC和WC中的使用频次,很有意思的数据
7XX 对应LCSH ($0 LCCN,如(DLC)sh YY……)