书目控制未来工作组报告草案网络直播

LC去年11月成立的书目控制未来工作组,最终报告草案在推迟二个多月后,终于要露出庐山真面目,引起大批业内人士关注。11月13日,工作组在LC介绍草案内容,同时进行网络直播,一时访问者众,网路堵塞,以至没有几个人真正看清直播内容。由于大家的强烈关注,最终88分钟的直播内容未加编辑,在16日全部放到了LC的网络广播网站供在线观看(Draft Report: Future of Bibliographic Control),同时工作组网站也提供了下载网址(Webcast: November 13, 2007,Interim Draft Report and Recommendations),还可直接选择看各个部分,不必从头到尾收看。网站上还有会场所放PPT下载(16页),可以了解报告基本框架。

前些日子为11/16上海联合编目中心年会准备一个“编目未来”的报告,所以一直关注工作组的进展。10/30见消息说报告11/13发布,还以为可以赶着报道最新进展。从13日晚就开始访问工作组网站,一直没有结果;看博客报道,都是报怨没看清直播,最终有关内容的报道都在15日以后了(我们这里是16日)。昨天先看到远洋过客的报道,而后又看了其他国外的博客报道。由于草案文本要到11/30发布,所以见到评论不多。

报道比较完整详实的,应该是与会的Karen Coyle。她的报道首先是三个主要变化(sea changes),对会场PPT中的"Working Group’s Guiding Principles",加了一些解释,更容易理解:
1、重新定义书目控制:包括所有资料、类型广泛的用户社区以及信息搜寻的不同地点
2、重新定义书目世界(bibliographic universe):包括所有利益相关者(stakeholders),包括参与信息传递与数字化的营利组织
3、重新定义LC的作用:作为其他图书馆与非图书馆机构的合伙人,一起达成图书馆界的目标
接下来是五个方面的建议(PPT中称为“结论”,Working Group’s General Conclusions),以及前四个建议的较详细内容,建议全部共有100多条,需等全文公布。五个建议/结论:
1、通过书目记录的合作与共享,通过使用整个供应链生产的数据,提高所有图书馆书目生产的效率
2、致力于高增值的活动。尤其是通过对图书馆拥有但当前仍隐藏而未用的独特资料提供访问,为知识创建提供更大价值。
3、技术定位:认识到WWW不仅是我们的技术平台,也是标准的适当平台。认识到用户不仅是人,而且是图书馆数据交互的应用。
4、通过增加资源的评价性、质量与数量分析,定位我们的未来。开展工作以认识FRBR框架所提供的潜力。
5、通过教育、通过开发能提供现在与未来决策的度量标准,强化图情专业。

报道较专深的是William Denton对于FRBR部分的讨论,综述了AUTOCAT邮件讨论组及一些博客的观点。前述PPT中对FRBR提到:
4.2 Realization of FRBR 重新认识FRBR
1. Develop test plan for FRBR 开发FRBR的试验计划
2. Temporarily suspend work on RDA 暂时停止RDA中[与FRBR]相关的工作
Karen文中对4.2的详细信息是:
认识FRBR:被称为FRBR的框架有很大的潜力,但至今未被测试。尽管FRBR本身未被清晰地理解,却被当作RDA的基础。工作组建议RDA不要做进一步工作,直到对FRBR及它对书目元数据所提供的基础做更多的调查。[好象听直播中讲到要与OCLC、IFLA等一起做试验工作]

期待最终报告……

附:书目控制未来工作组大事记
2006-6 LC副馆长Deanna B. Marcum在ALA年会上允诺建立外部咨询组
2006-11-2/3 工作组成立会议,决定召开三次专题会议
2007-3-8 第一次会议:“书目数据的用户与使用”
2007-5-9 第二次会议:“书目数据的结构与标准”
2007-7-9 第三次会议:“书目数据的经济学与组织”
2007-8-? 公开征求意见截止
2007-9-1 “最终报告”草案公示(推迟→2007-11-30)
2007-11-1 “最终报告”正式发布(推迟→2008-1-9)
200711-13 “最终报告”草案介绍网络直播
2007-11-30/12-1 “最终报告”草案文本公布(预定)
2007-12-15 “最终报告”草案公示结束
2008-1-8/9 “最终报告”发布(预定)

参见:
远洋过客:LC书目控制的未来工作组昨天的报告
Coyle’s InFormation: Future of Bibliographic Control,LC, 11/13
The FRBR Blog: WoGroFuBiCo uproar!

书目控制未来工作组:关注2007年11月 (2006-12-12)
书目控制未来工作组会议:用户与使用 (2007-03-10)

在书目中实践FRBR(外一篇:民国书目检索)

(一)

    参与编制一个外文专题书目,从研究者利用考虑,计划按分类编排。分类之下,我考虑到图书有再版问题,倾向于按书名编排,可以把同一种书集中在一起。但大家都以为分类之后按出版年代排序,可以显示研究的发展脉络。
    年代排序的确是更可取的方法。那么,再版问题如何解决呢?一种办法是只取最早的版本。编制本书目的目的是全面揭示国外这一专题领域的文献,方便研究人员获知、获取文献,所以计划提供一些馆藏地。如果最早版本国内没有收藏,难道就此舍去?还要研究者花钱去国外馆际互借?
    我想到了FRBR,可以把各种版本都排在能够查到的最早版本下,即使名称有所更动也没关系。这样一举多得,既保留研究的发展脉络,又能反映研究的重要程度及影响,还能提供尽可能多的馆藏信息。
    在试查过程中,又发现还可能有不同语种的译本。征求负责人意见,决定先在书目信息中保留原题名。我内心的想法是,在最后处理数据时,彻底贯彻FRBR,将不同语种译本按原著的出版日期集中在一起。反正处理数据是我的事,到时就由我了。

(二)

    在做民国图书的扫描,我以为最重要的是尽可能避免与其他馆做重复的事。一则处理能力有限,二则民国图书大多很脆弱,经不起折腾。
    找到开放检索又能全文浏览的CADAL(http://www.cadal.net)已是幸事,因为它收录了国内重要大学的民国馆藏。由于民国图书编目多为简编,且不大会有中图分类号,这两点就把民国书目排除在现今CALIS联合目录之外了。所以查CADAL有点一站式检索的意思。只不过从各馆提交数据的统计上看,尤其在民国书刊方面,各馆的参与程度相差很大。所以这个“一站式”还是打折扣的。
    我开始只考虑其他馆已经数字化的部分,没有想到正在做的。馆里一位专家告诉我上海图书馆正在做,可以查《民国时期总书目》了解国内民国馆藏大户的收藏情况。于是找来《民国时期总书目》(收录国家图书馆、上海图书馆和重庆图书馆民国图书),查一下经CADAL筛选留下打算扫描的图书。查的结果,自然又筛出去一部分暂时不做扫描。
    有意思的发现是,《民国时期总书目》其实也在某种程度上应用了FRBR:对同一种书只设一个条目,其下列出各种版本,合并说明馆藏;同书的不同的译本,虽然分设条目(往往译名不同),但前后排列,在提要中只说明是“前书的另一译本”云云。
    当然《民国时期总书目》早于FRBR,说“应用”并不恰当。这只能说明FRBR在书目工作中是有深厚基础的。早先想研究简化编目,借过一本苏联人写于五十年代的书,其中就有类似的做法。

(三)

    在查《民国时期总书目》前,在网上查国图与上图,只发现古籍部分——上图有“古籍书目数据库”(http://search.library.sh.cn/guji/),而国图的“古籍善本”(http://www.nlc.gov.cn/service/guancang/gujishanben.htm)只列出了其它馆的古籍检索链接。
    因为没发现民国图书,以为都没有提供书目检索,所以只能很辛苦的查《民国时期总书目》。刚才写着,又上国图(http://210.82.118.4:8080/F/)与上图(http://ipac.library.sh.cn)的书目检索去查了一道,发现其中都包括民国图书。看来可以把《民国时期总书目》还掉了?

thingISBN――用户视角的FRBR化成果

    LibraryThing是一个个人在线书目网站,除上传书目信息、加封面外,还有很多2.0的功能,如对图书评级、发表评论、加标签(分类)、各类RSS,以及一些社会网络功能。甚至还有各种来源的MARC记录!

    以下是一些统计数据(分别取自2006-7-2 / 2006-6-15,可以看出其近期发展势头):

  • 开张于2005年8月29日,成员51,856 / 45,103 (不多,比较同样提供书目上传的豆瓣,2005年3月开张,现已超过20万成员)
  • 成员共提供图书馆藏3,548,967 / 3,185,318(每天1万余),去重后932,335 / 878,861种(每种书近4个“复本”)
  • 每个成员的馆藏构成自己的图书馆,最多一位拥有9301 / 9162个馆藏
  • 成员对图书发表评论43,571 / 39,889条,最高产的评论家写了960 / 894条评论
  • 成员给图书加标签(分类)5,082,253 / 4,672,586个,最疯狂的某个成员贴了26,447 / 25,984个标签
  • 成员为图书评级514,423 / 442,072次
  • 成员贡献图书封面96,347 / 86,334个(另可直接利用网上书店等处的图书封面)

    2月份的时候,LibraryThing开发者Tim Spalding想按“作品”来集中这些图书。因为书评、评级、标签(大众分类)等等,对同一作品的所有版本差不多都是可以共享的;而基于算法的类似“拥有X书者也拥有Y书”这样的推荐图书方式,按作品集中也可以更好的发挥作用。从社会性方面,按“作品”集中书目的结果是,人们结交与自己拥有同一种书的人的希望可以更好地实现。
    虽然Tim当初并不了解FRBR模型,但他的做法确实与FRBR的“作品――内容表达――载体表现――个别文献”模型很相似。要实现作品集中,Tim曾想过借用OCLC的xISBN,但Tim更想“尝试一些新的”。他想到的是2.0的方式,以LibraryThing热心的成员为基础,靠众人的力量,合并相关书目信息。他的口号是:每个人都是图书馆员,他认为“公共编目是不差的编目”。
    结果合并书目功能推出的头三天,用户就作了1.7万次合并,集中起4.2万部作品。如果哪个用户合并错了,自有其他用户再把它分离,这就是Web 2.0的模式――如Tim说的是“维基百科”。

    在完成对LibraryThing中大量作品的集中工作后,为让大家利用LibraryThing的FRBR化成果,Tim于6月14日推出了其成果thingISBN API――给出一个ISBN,以XML形式返回该作品所有版本的ISBN。为保证数据能够复用,Tim遵循的是OCLC的xISBN的形式,并且它还mash up了xISBN,提供各ISBN在OCLC的WorldCat和LibraryThing中结果的比较(两者共有的、仅xISBN有的、仅thingISBN有的)。ISBN 0441172717的实例:

thingISBN:http://www.librarything.com/api/thingISBN/0441172717
xISBN与thingISBN比较:http://www.librarything.com/api/thingISBN/0441172717&compare=1
OCLC的xISBN:http://labs.oclc.org/xisbn/0441172717

    OCLC有10亿馆藏,而LibraryThing才350万,仅千分之三,本不是一个数量级。但Tim提供的一些对比表明,相对于xISBN,thingISBN并非可以忽略不计,两者可以互补,而平装本与非美国版是thingISBN的特长。

    Tim是TALIS正在主办的全球性图书馆Mashup竞赛“Mashing Up The Library”的评委之一,它把thingISBN当作他提供的mashup原料。

参见:
LibraryThing集中相同作品的说明:
The LibraryThing Blog: LibraryThing leaps forward: Everyone a librarian (2006-2-23)

LibraryThing对于thingISBN的报道:
The LibraryThing Blog: thingISBN, LibraryThing&aposs first API (2006-6-14)
Thing-ology Blog: Introducing thingISBN (2006-6-14)

OCLC首席科学家Thom Hickey对thingISBN的评论:
Outgoing: thingISBN (2006-6-14)

另见:
Tim Spalding谈LibraryThing和图书馆(员)
TALIS与图书馆2.0