第二届OCLC软件竞赛

    OCLC正举办第二届软件竞赛,截止期为9月15日。要求、评判标准、奖金等等,基本同2005年上半年首次竞赛,可参看

“要求参赛者编写一个程序,提供一个工作原型,通过使用至少一项OCLC提供的服务,实现对WorldCat数据的”有趣”或”创新”的应用。为此OCLC提供取自WorldCat的一组书目记录以及OCLC的ResearchWorks(各种新技术的实验室)和Terminology Services(多种在线词表服务)的部分服务,参赛者也可以使用Open WorldCat。”

    注意到今年提供的WorldCat记录子集有三个文档:书目记录、书目记录相应的馆藏计数、记录的读者对象值。印象当中去年只有一个?OCLC在2004年就利用起馆藏计数编制OCLC Top 1000,但“读者对象”(audience-level)是今年才开发出来的成果,看是不是能够在竞赛中出现一些有意思的应用。

Update 2006/7/8:

对比前届竞赛网页,不但WorldCat文档增加了,左栏列出的ResearchWorks服务也有所增加,除“读者对象”,还有OCLC WorldMapDDC


参见:
OCLC软件竞赛
OCLC软件竞赛结果

由OCLC TOP 1000想到的
OCLC发布新的数据挖掘项目――读者对象

 

OPML生成器

    Catalogablog介绍了一个OPML生成器(OPML Generator)只要输入RSS Feeds的网址,每个一行,就可以生成OPML文件。

    从文件头看:

<?xml version=”1.0″ encoding=”ISO-8859-1″?>
<opml version=”1.0″>

 

    年心曾留言说我提供的OPML在2中导入不正常(最近博客网留言自动隐去英文字母,不知原意究竟如何),我不知道OPML 1.1和2有什么不同,有心者可参见http://www.opml.org/了解OPML 2.0详情。

    Google一下”OPML Generator”,还有“Stephen&aposs OPML creator”,只是需要先注册帐户。如果上面生成的1.0版不能用,或者可以试一试这个?

    关于OPML更多信息,参见维基百科:http://en.wikipedia.org/wiki/OPML

语言码是ISO-8859-1(拉丁1),直接改成UTF-8应该也没什么问题;1.0版的。

Google的《莎士比亚戏剧全集》

    Google图书搜索推出了《莎士比亚戏剧全集》(The complete plays of Shakespeare),分为悲剧、喜剧、罗曼史和历史剧四大类。在剧名下有“All Editions”(FRBR化),链接到图书搜索结果。如要看全文,依图书版权情况不同,有几种可能:

Full view 可以看全文
Limited preview 可以看部分全文(整页)
Snippet view 只能看文本片断
No preview available 不能看文本

    从结果看,大部分都属于只可看部分全文的情况。莎士比亚的著作应当早过了版权保护期,但Google图书搜索收录的是图书扫描本,所以版权情况就随出版年限而有所不同了。


    在这个专集中, 集成了很多的Google服务,感觉上我们可以用Google完成从娱乐到研究的任何事情

主页

Google Web Search:搜索莎士比亚相关网页
Google Scholar:搜索Google学者中关于莎士比亚的评论与研究
Google Groups:搜索讨论莎士比亚的Google论坛
Google Video:搜索莎士比亚相关的视频
Google Image Search:搜索莎士比亚的图片
Google News:搜索与莎士比亚有关的新闻报道
另外,还推荐下载Google Earth,理由是可以访问全球剧院,以及与莎士比亚相关的地标――无法实地察看者,至少也可以看个高清晰度卫星图过把瘾。

书目页:单击剧名,链接到书目信息页,除书目信息外,还有:

本书书评搜索链接(Google Web Search)
本书相关网页搜索链接(Google Web Search)
Buy this Book:链接到多家网上书店,以及Froogle (Google购物服务),就买这本书
Find this book in a library:链接到OCLC的Open WorldCat,不想买书,可以看看能否在图书馆借到

图书页:由“All editions”链接到图书搜索结果,再看某一版本图书,除直接显示扫描的页面外,还有:

封面、封底、题名页、版权页、目次页
Search within this book:非常有用的“书内全文搜索”
Buy this Book(同上)
还有一个链接,让全体网民帮Google纠错:See a problem with this page? Please tell us.

    如果从获取全文角度,Google的这个莎翁戏剧全集显然言过其实,至少肯定不是一个很好的来源。一些图书网站则基本网罗了莎翁作品,但在相关信息的搜索、组织与呈现方面,这些网站与与图书馆OPAC更相似,与Google的差距不是一点点。比较:  

    谷腾堡的莎士比亚作品一览“The Comedy of Errors”书目信息页
    Bookyards的莎士比亚作品一览(直接点击题名下载全文)
    
    不过,Google将图书全文网站的搜索结果整合进图书搜索,应该是迟早的事吧?

    To Google or not to Google, that’s not a question.