Open Library概观

    Open Library玩好,就该认真学习了。从自我介绍看(About Us) ,这个项目是Internet Archive旧金山办公室的一个小组从年初开始做的,参与者(About the people)中见到了Karen Coyle(她的Blog:  Coyle's InFormation),那个把RDA称为“20世纪编目规则”的人,在这里被称为元数据沙皇(Metadata Czar)。

    这是个开源的项目,希望感兴趣的人参与。看看他们需要哪些帮助,可以看到他们未来的发展(How you can help):

·电话联系部分
Libraries:首先需要的是图书馆的MARC数据。目前已装入LC的800万图书,还想要其他国家图书馆的。
Publishers:出版商的ONIX数据。已有几家已经装入,或下载待装。
Swap sites (?)
Popularity data:图书推荐信息,目前只得到了LibraryThing的,还想要图书馆流通数据、网页出现数据,未来还会处理自己网站的页面浏览数据
Respect data:有质量的图书(不一定是畅销书),比如书评文摘光盘(Book Review Digest CD-ROM)、书评索引(Book Review Index)、主要期刊(LJ, PW, Booklist)中的书评,图书参考文献,获奖
Inter-book relations:主要是FRBR化的数据,包括想获取ThingISBN和xISBN,自己编制FRBR化算法
Copyright information:……还打算建立自己的注册服务?
Other:其他图书馆数据[雄心勃勃啊]

·设计部分
    另有对用户界面的详细讨论 (The State of the UI),值得细看,特别是有众多的参考文献。还有网站发布日程(Rollout Plan):
 7/16     Soft Launch
10/17     第一阶段发布
10月以后  第二阶段开发

·编程部分
Price check:作为综合性的图书信息网站,比价系统不可或缺
Export:导出格式RDF/XML, database dumps, OAI, microformats, Z39.50, a cover repository API [数据来自各方,也惠及各方,善哉]

Open Library特别向图书馆界提出希望合作的内容如下(About the librarianship)
·futurelib:一种元数据格式[很奇怪的名字],包含如MARC与ONIX那样图书馆员、出版商以及用户需要的信息。现在已有一个草案(draft schema)
·OLN (Open Library Number):书目控制号,适合于有或没有ISBN或ISTN号的所有图书
·Merging:有效的合并算法,合并不同来源的书目数据,以及同书的不同版本[FRBR化]
·Data colletion:作为一个开放的图书馆,数据越多越好[不知道有多少图书馆会响应号召]
·Ol-lib:感兴趣的,可以加入图书馆界讨论组(Ol-lib — Open Library — librarianship discussion)

Open Library用到的技术(About the technology)
·ThingDB:数据库,能够包括数亿记录,能保留随机用户的修改历史,以及新增的半结构化数据
·infogami:简化的、半结构化的维基,每个页面有type、每个type有一个schema
·OL Technology:丰富的插件,希望处理评论、比价等
    技客们,可以去看看其架构(Open Library Architecture),读读源码(Read the source code),加入技术讨论组(Ol-tech — Open Library — technical discussion)  

说明:
    2007-7-16,Open Library项目领导Aaron Swartz在自己的Raw Thought博客上发布演示版消息(Announcing the Open Library);项目经理Alexis Rossi也先后在Code4Lib与NGC4Lib上发布消息,随后引起各方报道。开始报道居多,渐渐多了评论。但其中似乎还缺少一些重要博客的声音:Lorcan Dempsey,Stephen Abram……,包括Karen Coyle本人。她写了一篇Copies, duplicates, identification,间接地谈到了OLN问题。
    评论中比较特别的是Panlibus博客上的几篇,重点涉及Open Library中数据的使用许可问题。虽然意在推销其公司的Talis Community License,但如果对开放数据的版权问题有兴趣者,适合一读。
·之一:The Open Library – Open for Business
·之二:License for Open Library ? ()
·之三:The Open Library, and keeping it open
    Richard Wallis在第一篇中除提及元数据schema及OLN外,特别提到没有看到数据使用许可——是否可以免费共享贡献的数据(openly sharing freely contributed data),并认为他们公司的Talis Community License很合适。对于希望提供类似服务的机构,这点很重要。
Aaron Swartz在文后留言,称所有贡献内容都是公共领域的,详细的许可用语尚在斟酌中。Richard Wallis又撰写第两篇,对public domain的说法持异议。
Rob Styles写的第三篇则对几个版权许可协议作了较多说明。

    另外,OhioLINK的Peter Murray比我更会玩,还把他玩的过程做了一个屏播(Disruptive Library Technology Jester: Open Library Demonstration Screencast ,可以直观地了解Open Library。全长12'31'',附文字说明。
    他检索后发现自己的作品未被收录,便给自己新建了一个作者页面(Type/author,不存在页面新建的缺省类型为Type/page),然后为自己的书新建了一条记录(Type/edition)(特别注意作者字段要用作者页面的形式,并以下划线相连,形如a/Murray_Peter_E)。建好后的书目记录与库中原有记录有完全一致的显示页面,真是特别棒。
    他特别提示的页面URL[可用于在其他网站引用、设置到链接服务器等]:
·全文:http://demo.openlibrary.org/search?q=tom+sawyer+adventure(空格以+代替)
·作者:http://demo.openlibrary.org/a/Murray_Peter_E(空格以_代替)
·书目:http://demo.openlibrary.org/b/Library_Patrons_Privacy(空格以_代替)

参见:
图书馆观点:Open Library 开张 (2007-7-19)
玩转Open Library (2007-7-21)

桂林数图研讨班·会前

    这些天在准备“数字图书馆前沿问题高级研讨班”的PPT,会议将于8月13-17日在桂林举行。原本是不打算去的,后来经不过厦大萧馆长的忽悠,才决定去注册。
    去会议主页,网上报名注册很让人喜欢,因为可以“查看报名情况”,与会者信息按报名先后列在那儿,可以看看都有哪些人参会,或许还可以打印出来带着。参加过一些会议,一般都到差不多结束的时候才能拿到通讯录,与会者多的时候,有熟人参会都不知道。早拿到通讯录,还可以有的放矢地找人请教问题。虽然现在开会都挂胸牌,但见着人不看脸,直盯着看人的胸牌,总觉得不礼貌。
    从参会名单看,有不少上届与会者。总共二百多人,有八家单位参会五人以上。比较印象深刻的是:上海交通大学图书馆馆长大概是倾巢而出(一正三副)。

    参会不多,仅就自己亲身体会,“数字图书馆前沿问题高级研讨班”的信息共享在国内各类会议上是最充分的。今年是第四期,提供参会者情况的方法,已是把信息共享做在了前面。在以往各年的会议网站上,可以下载几乎所有报告的PPT。去年去清华参加第三期研讨班前,就在厦大的第二期会议网站上下载了所有的PPT,一阵恶补。
    数字图书馆前沿问题高级研讨班还有一个网站DL-China.org,厦大做的,维基版。网站除链接历次会议网站外,也对会议内容作了镜像,还包括会议的相关信息,如问卷调查汇总、互动博客等。如果没有机会亲自参会,也可下载些PPT了解会议内容。

    在更新过的“会议日程”上,看到雨僧将参会。
    还有一个有意思的活动:8月14日晚19:15-21:00,游船观两江四湖夜景:老师/学员,博客/读者互动。今年ALA年会,OCLC也组织了一次博客沙龙,在酒店里租了一夜套房,提供了大量的啤酒和葡萄酒,副总裁George Needham 还在吧台后做服务生呢(Press Release: OCLC and Talis Co-Operating)。

参见:2006清华大学数图研讨班系列

国家图书馆民国电子书

    有网友留言,问及国家图书馆民国期刊。到国图网站去,发现与去年相比,国图的“特色资源”又大大地丰富了,增加了不少可供在线浏览的电子全文。真是越来越有国家图书馆的气派了。
    目前特色资源有:碑帖菁华、敦煌遗珍、西夏碎金、数字方志、博士论文、民国期刊、年画撷英、中国学、在线讲座(视频库)、甲骨世界、民国图书、民国法律。关注的两种民国文献:

民国法律(http://res3.nlc.gov.cn/roclaw/
    “民国时期……曾先后出现过多个性质迥异、对峙并存的政权……上述政府在其存在期间制定颁布了大量法律、法规和其他规范性文件……为方便读者查找和阅读民国法律资料,该资源库提供简单检索、高级检索和PDF在线浏览功能。截至2007年1月该资源库已发布民国法律文献3503篇,总计12769页!
[公网检索速度很慢,没有查出结果,不知浏览效果如何]

民国图书(http://res3.nlc.gov.cn/rocbook/
    “国家图书馆民国图书资源库首批推出民国图书6229种,6453册全文影像资源,提供读者通过互联网进行浏览和研究。资源库遵循边建设边服务的原则,会不断追加更新文献内容。
    资源库以民国图书出版时间排序,提供单一字段的简单检索和多条件限定组合的高级检索。全文影像阅读器建议使用Acrobat Reader6.0以上版本(中文版本)。”
    另有按《中图法》分类浏览功能。
    与期刊相同的是,图书的目次做得相当细致,浏览各部分很方便。缺省页面显示为整页,版权说明需下拉滚动条才可见,很贴心的设计。
    与期刊不同的是,使用通用的Adobe Reader,而不是专用浏览器。也值得称道。

    另:博士论文限看前24页。目前收录本校博士论文980篇。检索中的年代限定功能似乎不起作用。

update:
民国图书的“免责声明”日期为“二ΟΟ七年五月”,看来是刚推出不久。
民国法律的“免责声明”日期为“二ΟΟ六年十二月”,难道法律法规也有版权?或许是未雨绸缪比亡羊补牢好。

参见:电子版民国图书和期刊 (2006-09-27)