Open Library概观

    Open Library玩好,就该认真学习了。从自我介绍看(About Us) ,这个项目是Internet Archive旧金山办公室的一个小组从年初开始做的,参与者(About the people)中见到了Karen Coyle(她的Blog:  Coyle's InFormation),那个把RDA称为“20世纪编目规则”的人,在这里被称为元数据沙皇(Metadata Czar)。

    这是个开源的项目,希望感兴趣的人参与。看看他们需要哪些帮助,可以看到他们未来的发展(How you can help):

·电话联系部分
Libraries:首先需要的是图书馆的MARC数据。目前已装入LC的800万图书,还想要其他国家图书馆的。
Publishers:出版商的ONIX数据。已有几家已经装入,或下载待装。
Swap sites (?)
Popularity data:图书推荐信息,目前只得到了LibraryThing的,还想要图书馆流通数据、网页出现数据,未来还会处理自己网站的页面浏览数据
Respect data:有质量的图书(不一定是畅销书),比如书评文摘光盘(Book Review Digest CD-ROM)、书评索引(Book Review Index)、主要期刊(LJ, PW, Booklist)中的书评,图书参考文献,获奖
Inter-book relations:主要是FRBR化的数据,包括想获取ThingISBN和xISBN,自己编制FRBR化算法
Copyright information:……还打算建立自己的注册服务?
Other:其他图书馆数据[雄心勃勃啊]

·设计部分
    另有对用户界面的详细讨论 (The State of the UI),值得细看,特别是有众多的参考文献。还有网站发布日程(Rollout Plan):
 7/16     Soft Launch
10/17     第一阶段发布
10月以后  第二阶段开发

·编程部分
Price check:作为综合性的图书信息网站,比价系统不可或缺
Export:导出格式RDF/XML, database dumps, OAI, microformats, Z39.50, a cover repository API [数据来自各方,也惠及各方,善哉]

Open Library特别向图书馆界提出希望合作的内容如下(About the librarianship)
·futurelib:一种元数据格式[很奇怪的名字],包含如MARC与ONIX那样图书馆员、出版商以及用户需要的信息。现在已有一个草案(draft schema)
·OLN (Open Library Number):书目控制号,适合于有或没有ISBN或ISTN号的所有图书
·Merging:有效的合并算法,合并不同来源的书目数据,以及同书的不同版本[FRBR化]
·Data colletion:作为一个开放的图书馆,数据越多越好[不知道有多少图书馆会响应号召]
·Ol-lib:感兴趣的,可以加入图书馆界讨论组(Ol-lib — Open Library — librarianship discussion)

Open Library用到的技术(About the technology)
·ThingDB:数据库,能够包括数亿记录,能保留随机用户的修改历史,以及新增的半结构化数据
·infogami:简化的、半结构化的维基,每个页面有type、每个type有一个schema
·OL Technology:丰富的插件,希望处理评论、比价等
    技客们,可以去看看其架构(Open Library Architecture),读读源码(Read the source code),加入技术讨论组(Ol-tech — Open Library — technical discussion)  

说明:
    2007-7-16,Open Library项目领导Aaron Swartz在自己的Raw Thought博客上发布演示版消息(Announcing the Open Library);项目经理Alexis Rossi也先后在Code4Lib与NGC4Lib上发布消息,随后引起各方报道。开始报道居多,渐渐多了评论。但其中似乎还缺少一些重要博客的声音:Lorcan Dempsey,Stephen Abram……,包括Karen Coyle本人。她写了一篇Copies, duplicates, identification,间接地谈到了OLN问题。
    评论中比较特别的是Panlibus博客上的几篇,重点涉及Open Library中数据的使用许可问题。虽然意在推销其公司的Talis Community License,但如果对开放数据的版权问题有兴趣者,适合一读。
·之一:The Open Library – Open for Business
·之二:License for Open Library ? ()
·之三:The Open Library, and keeping it open
    Richard Wallis在第一篇中除提及元数据schema及OLN外,特别提到没有看到数据使用许可——是否可以免费共享贡献的数据(openly sharing freely contributed data),并认为他们公司的Talis Community License很合适。对于希望提供类似服务的机构,这点很重要。
Aaron Swartz在文后留言,称所有贡献内容都是公共领域的,详细的许可用语尚在斟酌中。Richard Wallis又撰写第两篇,对public domain的说法持异议。
Rob Styles写的第三篇则对几个版权许可协议作了较多说明。

    另外,OhioLINK的Peter Murray比我更会玩,还把他玩的过程做了一个屏播(Disruptive Library Technology Jester: Open Library Demonstration Screencast ,可以直观地了解Open Library。全长12'31'',附文字说明。
    他检索后发现自己的作品未被收录,便给自己新建了一个作者页面(Type/author,不存在页面新建的缺省类型为Type/page),然后为自己的书新建了一条记录(Type/edition)(特别注意作者字段要用作者页面的形式,并以下划线相连,形如a/Murray_Peter_E)。建好后的书目记录与库中原有记录有完全一致的显示页面,真是特别棒。
    他特别提示的页面URL[可用于在其他网站引用、设置到链接服务器等]:
·全文:http://demo.openlibrary.org/search?q=tom+sawyer+adventure(空格以+代替)
·作者:http://demo.openlibrary.org/a/Murray_Peter_E(空格以_代替)
·书目:http://demo.openlibrary.org/b/Library_Patrons_Privacy(空格以_代替)

参见:
图书馆观点:Open Library 开张 (2007-7-19)
玩转Open Library (2007-7-21)