社会编目 Social Cataloging

    给图书编目早已不是图书馆的独门绝技,外包公司们早就在做了。近年又出现了个人书目网站,于是每个藏书者或爱书者都成了编目员——和现在的编目员一样,他们做的大部分是套录工作,由网站提供相应工具,只需提供少量信息,就可以从外部获取完整的书目信息,做成自己的收藏目录。
    这些个人书目网站被称为社会编目网站(social cataloging sites),据Tim Spalding称社会编目处于爆发状态,目前已有40个这样的网站。维基百科的 Social cataloging applications 中列出了20多个(其中大部分只是存目,尚未撰写内容)。
    Tim 是 LibraryThing 的所有者,作为社会编目网站的开发者,Tim 在 Ning 上建了社会编目网站开发者的网络——“社会编目员”(SocialCatalogers) ,用于相互间的交流。按一般的理解,这些同一类型网站无疑是竞争对手,但 Tim 似乎更多地把它们看作一个产业,尽管还很弱小(a dwarf industry),但却有合作的可能性。

    对于社会编目网站,我一直比较关注LibraryThing,很欣赏 Tim 不断挖掘书目信息,绞尽脑汁收集相关信息集成到网站中的做法;偶而也用豆瓣/douban。但对这些网站多是片断的直感,没有整体性的思考。看到librarytwopointzero 对三个社会编目网站 Librarything, Shelfari 及 Gurulib,就特色、外观/易用、数据控制与所有权(导入导出)及社区与社会网络四个方面进行比较,很有启发。以下是结果:

        Librarything    Shelfari    Gurulib
特色         7            5           8
外观/易用    7            8           4
数据控制     9            5           7
社区         9            6           4
合计        32           24          23 
    
 

参见:
Thing-ology (LibraryThing’s ideas blog) (February 27, 2007)
SocialCatalogers: For people who make social cataloging applications

librarytwopointzero (October 21, 2006)
Librarything, Shelfari, and Gurulib: Social Cataloging Sites Compared

关于 Ning (http://www.ning.com/),参见:
译言-技术与创业:Ning的进化 (2007/2/27)

关于LibraryThing,参见相关博文

OCLC与图书馆酒店的故事:版权与商标

    Tim打算给其蒸蒸日上的个人在线书目网站LibraryThing增加分类功能。在美国通用的有杜威十进分类法(DDC)和国会图书馆分类法(LCC),两者的电子版都要不菲的订购年费,并且如果要用在LibraryThing上的话,还有版权问题。
    美国版权法规定1923年前出版的属于公共域,Tim在谷腾堡计划(Project Gutenberg)中找到了1876年版的DDC(原来当时的题名那么长:A Classification and Subject Index for Cataloguing and Arranging the Books and Pamphlets of a Library)。尽管早年的DDC类别陈旧,类目不要说计算机,连留声机也没有,不过,如果粗分类,凑合一用似乎也不是不可以?
    且慢!要使用DDC,除了版权,还有另一个障碍——商标。因为DDC的版权所有者OCLC,已经将杜威的姓Dewey、缩写DDC及全称都注册了商标,Tim戏称如要用1876年版DDC,就只好改用杜威的名Melvils(当为Melvil)了。

    从Tim的上述介绍,知道了DDC商标案。于是由维基百科的Library Hotel词条开始,试图在网上复原OCLC与图书馆酒店的故事。

    纽约的图书馆酒店(Library Hotle)是个仅有60套房间的小旅馆,毗邻纽约公共图书馆。其特色是以DDC给每个楼层、每个房间命名,并在各楼层与每个房间中配备相应类目的图书。楼层对应大类:3-9层对应300-900,10-12层对应000-200;各房间则对应小类,如色情文学800.001,音乐700.005,计算机600.004。旅客可以根据各自喜好选择房间。
    图书馆酒店2000年8月开张,由于创意绝妙而生意火爆,被美国权威旅游杂志康德纳斯(Conde Nast)评为纽约十佳饭店之一。2003年9月,OCLC将酒店告上了俄亥俄州首府哥伦布的联邦法庭——声称酒店侵害了OCLC的商标权,要求对方支付每年500美金的使用费。引起问题的,正是DDC。因为杜威(Dewey)、DDC和杜威十进分类法(Dewey Decimal Classification)都是OCLC注册的商标。
    两个月后,双方达成和解,图书馆酒店得到OCLC许可,可在酒店及营销资料中使用DDC商标并向OCLC致谢,同时,图书馆酒店须向促进儿童阅读的非营利性组织提供一定的捐赠。大家都很满意,酒店老板说,“我们不认为在我们靠近纽约公共图书馆的美丽小酒店中使用杜威商标侵犯了OCLC的商标,但向OCLC的杜威商标致谢,并且做一些慈善捐赠以促进儿童阅读,而不是花钱诉讼,应当是解决问题的合理之道。”
    现在,图书馆酒店主页下方清晰地标明:Dewey、DDC和Dewey Decimal Classification是OCLC拥有并许可使用的商标。

参考:
Thing-ology Blog: Angry about classification
http://www.librarything.com/thingology/2006/08/angry-about-classification.php
Wikipedia:Library Hotel
http://en.wikipedia.org/wiki/Library_Hotel
纽约 – 图书馆酒店 Library Hotel
http://www.12386.com/theme_hotel/Library.htm
郑迪蔚:旅馆就是图书馆. 出版广角, 2004年第2期
http://www.gxppa.com/Article/gj/hwlf/200604/20060411102250.html
easy librarian: 分类法趣闻
http://www.csdl.ac.cn/ezlibrarian/archives/000707.html
OCLC: OCLC and The Library Hotel settle trademark complaint
http://www.oclc.org/news/releases/20031124.htm

关于LibraryThing请参见:thingISBN——用户视角的FRBR化成果

附言:
有位署名001919的网友在“也谈我们的分类主题词表”下留言,想要电子版的分类词表二次加工。如果是认真地当件事做,最简单的办法自然是花钱买一套,否则可以试试几个版本的网上《中国图书馆分类法》。虽然网上的这些《中图法》看来不像经过什么授权,也一直没什么麻烦,但那是非赢利性的。如果该网友对《中图法》加工后将成果商品化,或者成为某产品的一个部分,那么如果不解决版权问题,怕是会有麻烦的。

thingISBN――用户视角的FRBR化成果

    LibraryThing是一个个人在线书目网站,除上传书目信息、加封面外,还有很多2.0的功能,如对图书评级、发表评论、加标签(分类)、各类RSS,以及一些社会网络功能。甚至还有各种来源的MARC记录!

    以下是一些统计数据(分别取自2006-7-2 / 2006-6-15,可以看出其近期发展势头):

  • 开张于2005年8月29日,成员51,856 / 45,103 (不多,比较同样提供书目上传的豆瓣,2005年3月开张,现已超过20万成员)
  • 成员共提供图书馆藏3,548,967 / 3,185,318(每天1万余),去重后932,335 / 878,861种(每种书近4个“复本”)
  • 每个成员的馆藏构成自己的图书馆,最多一位拥有9301 / 9162个馆藏
  • 成员对图书发表评论43,571 / 39,889条,最高产的评论家写了960 / 894条评论
  • 成员给图书加标签(分类)5,082,253 / 4,672,586个,最疯狂的某个成员贴了26,447 / 25,984个标签
  • 成员为图书评级514,423 / 442,072次
  • 成员贡献图书封面96,347 / 86,334个(另可直接利用网上书店等处的图书封面)

    2月份的时候,LibraryThing开发者Tim Spalding想按“作品”来集中这些图书。因为书评、评级、标签(大众分类)等等,对同一作品的所有版本差不多都是可以共享的;而基于算法的类似“拥有X书者也拥有Y书”这样的推荐图书方式,按作品集中也可以更好的发挥作用。从社会性方面,按“作品”集中书目的结果是,人们结交与自己拥有同一种书的人的希望可以更好地实现。
    虽然Tim当初并不了解FRBR模型,但他的做法确实与FRBR的“作品――内容表达――载体表现――个别文献”模型很相似。要实现作品集中,Tim曾想过借用OCLC的xISBN,但Tim更想“尝试一些新的”。他想到的是2.0的方式,以LibraryThing热心的成员为基础,靠众人的力量,合并相关书目信息。他的口号是:每个人都是图书馆员,他认为“公共编目是不差的编目”。
    结果合并书目功能推出的头三天,用户就作了1.7万次合并,集中起4.2万部作品。如果哪个用户合并错了,自有其他用户再把它分离,这就是Web 2.0的模式――如Tim说的是“维基百科”。

    在完成对LibraryThing中大量作品的集中工作后,为让大家利用LibraryThing的FRBR化成果,Tim于6月14日推出了其成果thingISBN API――给出一个ISBN,以XML形式返回该作品所有版本的ISBN。为保证数据能够复用,Tim遵循的是OCLC的xISBN的形式,并且它还mash up了xISBN,提供各ISBN在OCLC的WorldCat和LibraryThing中结果的比较(两者共有的、仅xISBN有的、仅thingISBN有的)。ISBN 0441172717的实例:

thingISBN:http://www.librarything.com/api/thingISBN/0441172717
xISBN与thingISBN比较:http://www.librarything.com/api/thingISBN/0441172717&compare=1
OCLC的xISBN:http://labs.oclc.org/xisbn/0441172717

    OCLC有10亿馆藏,而LibraryThing才350万,仅千分之三,本不是一个数量级。但Tim提供的一些对比表明,相对于xISBN,thingISBN并非可以忽略不计,两者可以互补,而平装本与非美国版是thingISBN的特长。

    Tim是TALIS正在主办的全球性图书馆Mashup竞赛“Mashing Up The Library”的评委之一,它把thingISBN当作他提供的mashup原料。

参见:
LibraryThing集中相同作品的说明:
The LibraryThing Blog: LibraryThing leaps forward: Everyone a librarian (2006-2-23)

LibraryThing对于thingISBN的报道:
The LibraryThing Blog: thingISBN, LibraryThing&aposs first API (2006-6-14)
Thing-ology Blog: Introducing thingISBN (2006-6-14)

OCLC首席科学家Thom Hickey对thingISBN的评论:
Outgoing: thingISBN (2006-6-14)

另见:
Tim Spalding谈LibraryThing和图书馆(员)
TALIS与图书馆2.0