在书目中实践FRBR(外一篇:民国书目检索)

(一)

    参与编制一个外文专题书目,从研究者利用考虑,计划按分类编排。分类之下,我考虑到图书有再版问题,倾向于按书名编排,可以把同一种书集中在一起。但大家都以为分类之后按出版年代排序,可以显示研究的发展脉络。
    年代排序的确是更可取的方法。那么,再版问题如何解决呢?一种办法是只取最早的版本。编制本书目的目的是全面揭示国外这一专题领域的文献,方便研究人员获知、获取文献,所以计划提供一些馆藏地。如果最早版本国内没有收藏,难道就此舍去?还要研究者花钱去国外馆际互借?
    我想到了FRBR,可以把各种版本都排在能够查到的最早版本下,即使名称有所更动也没关系。这样一举多得,既保留研究的发展脉络,又能反映研究的重要程度及影响,还能提供尽可能多的馆藏信息。
    在试查过程中,又发现还可能有不同语种的译本。征求负责人意见,决定先在书目信息中保留原题名。我内心的想法是,在最后处理数据时,彻底贯彻FRBR,将不同语种译本按原著的出版日期集中在一起。反正处理数据是我的事,到时就由我了。

(二)

    在做民国图书的扫描,我以为最重要的是尽可能避免与其他馆做重复的事。一则处理能力有限,二则民国图书大多很脆弱,经不起折腾。
    找到开放检索又能全文浏览的CADAL(http://www.cadal.net)已是幸事,因为它收录了国内重要大学的民国馆藏。由于民国图书编目多为简编,且不大会有中图分类号,这两点就把民国书目排除在现今CALIS联合目录之外了。所以查CADAL有点一站式检索的意思。只不过从各馆提交数据的统计上看,尤其在民国书刊方面,各馆的参与程度相差很大。所以这个“一站式”还是打折扣的。
    我开始只考虑其他馆已经数字化的部分,没有想到正在做的。馆里一位专家告诉我上海图书馆正在做,可以查《民国时期总书目》了解国内民国馆藏大户的收藏情况。于是找来《民国时期总书目》(收录国家图书馆、上海图书馆和重庆图书馆民国图书),查一下经CADAL筛选留下打算扫描的图书。查的结果,自然又筛出去一部分暂时不做扫描。
    有意思的发现是,《民国时期总书目》其实也在某种程度上应用了FRBR:对同一种书只设一个条目,其下列出各种版本,合并说明馆藏;同书的不同的译本,虽然分设条目(往往译名不同),但前后排列,在提要中只说明是“前书的另一译本”云云。
    当然《民国时期总书目》早于FRBR,说“应用”并不恰当。这只能说明FRBR在书目工作中是有深厚基础的。早先想研究简化编目,借过一本苏联人写于五十年代的书,其中就有类似的做法。

(三)

    在查《民国时期总书目》前,在网上查国图与上图,只发现古籍部分——上图有“古籍书目数据库”(http://search.library.sh.cn/guji/),而国图的“古籍善本”(http://www.nlc.gov.cn/service/guancang/gujishanben.htm)只列出了其它馆的古籍检索链接。
    因为没发现民国图书,以为都没有提供书目检索,所以只能很辛苦的查《民国时期总书目》。刚才写着,又上国图(http://210.82.118.4:8080/F/)与上图(http://ipac.library.sh.cn)的书目检索去查了一道,发现其中都包括民国图书。看来可以把《民国时期总书目》还掉了?

thingISBN――用户视角的FRBR化成果

    LibraryThing是一个个人在线书目网站,除上传书目信息、加封面外,还有很多2.0的功能,如对图书评级、发表评论、加标签(分类)、各类RSS,以及一些社会网络功能。甚至还有各种来源的MARC记录!

    以下是一些统计数据(分别取自2006-7-2 / 2006-6-15,可以看出其近期发展势头):

  • 开张于2005年8月29日,成员51,856 / 45,103 (不多,比较同样提供书目上传的豆瓣,2005年3月开张,现已超过20万成员)
  • 成员共提供图书馆藏3,548,967 / 3,185,318(每天1万余),去重后932,335 / 878,861种(每种书近4个“复本”)
  • 每个成员的馆藏构成自己的图书馆,最多一位拥有9301 / 9162个馆藏
  • 成员对图书发表评论43,571 / 39,889条,最高产的评论家写了960 / 894条评论
  • 成员给图书加标签(分类)5,082,253 / 4,672,586个,最疯狂的某个成员贴了26,447 / 25,984个标签
  • 成员为图书评级514,423 / 442,072次
  • 成员贡献图书封面96,347 / 86,334个(另可直接利用网上书店等处的图书封面)

    2月份的时候,LibraryThing开发者Tim Spalding想按“作品”来集中这些图书。因为书评、评级、标签(大众分类)等等,对同一作品的所有版本差不多都是可以共享的;而基于算法的类似“拥有X书者也拥有Y书”这样的推荐图书方式,按作品集中也可以更好的发挥作用。从社会性方面,按“作品”集中书目的结果是,人们结交与自己拥有同一种书的人的希望可以更好地实现。
    虽然Tim当初并不了解FRBR模型,但他的做法确实与FRBR的“作品――内容表达――载体表现――个别文献”模型很相似。要实现作品集中,Tim曾想过借用OCLC的xISBN,但Tim更想“尝试一些新的”。他想到的是2.0的方式,以LibraryThing热心的成员为基础,靠众人的力量,合并相关书目信息。他的口号是:每个人都是图书馆员,他认为“公共编目是不差的编目”。
    结果合并书目功能推出的头三天,用户就作了1.7万次合并,集中起4.2万部作品。如果哪个用户合并错了,自有其他用户再把它分离,这就是Web 2.0的模式――如Tim说的是“维基百科”。

    在完成对LibraryThing中大量作品的集中工作后,为让大家利用LibraryThing的FRBR化成果,Tim于6月14日推出了其成果thingISBN API――给出一个ISBN,以XML形式返回该作品所有版本的ISBN。为保证数据能够复用,Tim遵循的是OCLC的xISBN的形式,并且它还mash up了xISBN,提供各ISBN在OCLC的WorldCat和LibraryThing中结果的比较(两者共有的、仅xISBN有的、仅thingISBN有的)。ISBN 0441172717的实例:

thingISBN:http://www.librarything.com/api/thingISBN/0441172717
xISBN与thingISBN比较:http://www.librarything.com/api/thingISBN/0441172717&compare=1
OCLC的xISBN:http://labs.oclc.org/xisbn/0441172717

    OCLC有10亿馆藏,而LibraryThing才350万,仅千分之三,本不是一个数量级。但Tim提供的一些对比表明,相对于xISBN,thingISBN并非可以忽略不计,两者可以互补,而平装本与非美国版是thingISBN的特长。

    Tim是TALIS正在主办的全球性图书馆Mashup竞赛“Mashing Up The Library”的评委之一,它把thingISBN当作他提供的mashup原料。

参见:
LibraryThing集中相同作品的说明:
The LibraryThing Blog: LibraryThing leaps forward: Everyone a librarian (2006-2-23)

LibraryThing对于thingISBN的报道:
The LibraryThing Blog: thingISBN, LibraryThing&aposs first API (2006-6-14)
Thing-ology Blog: Introducing thingISBN (2006-6-14)

OCLC首席科学家Thom Hickey对thingISBN的评论:
Outgoing: thingISBN (2006-6-14)

另见:
Tim Spalding谈LibraryThing和图书馆(员)
TALIS与图书馆2.0

 

Google的《莎士比亚戏剧全集》

    Google图书搜索推出了《莎士比亚戏剧全集》(The complete plays of Shakespeare),分为悲剧、喜剧、罗曼史和历史剧四大类。在剧名下有“All Editions”(FRBR化),链接到图书搜索结果。如要看全文,依图书版权情况不同,有几种可能:

Full view 可以看全文
Limited preview 可以看部分全文(整页)
Snippet view 只能看文本片断
No preview available 不能看文本

    从结果看,大部分都属于只可看部分全文的情况。莎士比亚的著作应当早过了版权保护期,但Google图书搜索收录的是图书扫描本,所以版权情况就随出版年限而有所不同了。


    在这个专集中, 集成了很多的Google服务,感觉上我们可以用Google完成从娱乐到研究的任何事情

主页

Google Web Search:搜索莎士比亚相关网页
Google Scholar:搜索Google学者中关于莎士比亚的评论与研究
Google Groups:搜索讨论莎士比亚的Google论坛
Google Video:搜索莎士比亚相关的视频
Google Image Search:搜索莎士比亚的图片
Google News:搜索与莎士比亚有关的新闻报道
另外,还推荐下载Google Earth,理由是可以访问全球剧院,以及与莎士比亚相关的地标――无法实地察看者,至少也可以看个高清晰度卫星图过把瘾。

书目页:单击剧名,链接到书目信息页,除书目信息外,还有:

本书书评搜索链接(Google Web Search)
本书相关网页搜索链接(Google Web Search)
Buy this Book:链接到多家网上书店,以及Froogle (Google购物服务),就买这本书
Find this book in a library:链接到OCLC的Open WorldCat,不想买书,可以看看能否在图书馆借到

图书页:由“All editions”链接到图书搜索结果,再看某一版本图书,除直接显示扫描的页面外,还有:

封面、封底、题名页、版权页、目次页
Search within this book:非常有用的“书内全文搜索”
Buy this Book(同上)
还有一个链接,让全体网民帮Google纠错:See a problem with this page? Please tell us.

    如果从获取全文角度,Google的这个莎翁戏剧全集显然言过其实,至少肯定不是一个很好的来源。一些图书网站则基本网罗了莎翁作品,但在相关信息的搜索、组织与呈现方面,这些网站与与图书馆OPAC更相似,与Google的差距不是一点点。比较:  

    谷腾堡的莎士比亚作品一览“The Comedy of Errors”书目信息页
    Bookyards的莎士比亚作品一览(直接点击题名下载全文)
    
    不过,Google将图书全文网站的搜索结果整合进图书搜索,应该是迟早的事吧?

    To Google or not to Google, that’s not a question.