四种来源的元数据

    Lorcan总结了图书馆中使用的四种描述性元数据(Four sources of metadata about things),并且分析了各自状况。他给暂时起的名:professional, contributed, programmatically promoted, and intentional。这样的分类非常清晰,可以弄清很多问题。简单摘译:

专业的 professional
应用编目规则、控制词表、规范档、地名词典等形成的。
[也就是一般编目员、标引员完成的,现存问题已经谈得很多了,此处略去]

贡献的 contributed
近年出现的邀请、集成、挖掘用户贡献的评价、推荐等数据形成的。
他们反映了人们之间的关系。图书馆开始实验这些方法,但单个图书馆恐怕难用得好。

程序获取的 programmatically promoted
由程序通过挖掘从数字资源本身获取的。
方法包括聚类 clustering、实体标识 entity identification、自动分类automatic classification等。

intentional
收集用户使用数据而来的。
Google的集成链接的Pagerank,亚马逊集成购买选择的推荐,OCLC的根据收藏馆数量的排序。

这四种元数据方法不仅不互相排斥,而且相互可以配合得很好。如:
规范档可支持在大量文本资源中识别由程序获取的人员、地名;
社交网络应用中反映出来的共享兴趣经抽象后,可形成intentional数据,产生推荐或“相关作品”服务;
标签与主题词表之间将发展形成关联与交互模式。

把图书馆2.0带入你的目录:LibraryThing for Libraries有了第一个用户

What is LibraryThing for Libraries?
Bring the power of Library 2.0 to your catalog.

只需数行HTML,即可在OPAC中集成LibraryThing及其高质量的图书数据,增加图书推荐、标签云及书评。

目前已有功能:
* 免费:链接同一作品的相关版本与译本(如FRBR)
* 推荐:高质量“推荐”或“类似”图书
* 标签浏览:通过标签检索或浏览图书

即将增加功能:
* 用户评论:访问数十万LibraryThing已有评论,并让用户增加自己的评论
* 用户标签:让用户加标签,并且可以在所有参与馆中共享
* 用户评级:加上LibraryThing的评级,用户也可自己给书评级

4月宣布的 LibraryThing for Libraries已经有了第一个用户——美国康涅狄格州的Danbury Library。
作为第一个实例,有一个免费功能、一个收费功能。试用"Romeo and Juliet"查该馆OPAC,可以看到第3条侧栏有"other editions and translations"和"tags",两者的信息均取自LibraryThing,但均链接到该馆自身的书目记录,可以说LibraryThing增强了OPAC的功能,是个对图书馆读者隐形的中间件,用户体验不错。
可惜页面设置不太美观,与最初的样例相比,还有很大的调整余地。据说该馆所用为Horizon系统。

联想到Lib2.07会上,厦大江湍讲到他新设计的tag功能,用户参与太少(其实才刚开始,还不能下这样的结论)。
一直以为,如何吸引用户参与,是图书馆2.0实践中最需要研究的问题。但不管如何,一个馆的用户终究是有限的,能够参与的用户就更有限(最近的数据,2%?update:0.2%)。
期望国内的豆瓣能够像LibraryThing那样,用已有资源,并且联合更多的参加馆,形成一个庞大的书目社区。

又:从Danbury Library目录主页看,该馆也使用了图书馆精灵ELFLeon钱涂很早就分别为他们的图书馆申请了该项服务,不知道现今使用情况如何?

参见:
Self-plagiarism is style: Go Danbury, Go!
在OPAC中嵌入LibraryThing提供的相关链接 (2007-04-10)

通过WorldCat.org查期刊论文

    记得OCLC的联合目录WorldCat中的记录前两年达到1千万,当时作为OCLC编目成员馆,还曾收到几个庆祝的小徽章。到今年3月29日,WorldCat记录数竟暴曾到了1个亿。根据OCLC首席科学家Thom Hickey的说明(Outgoing: 100 Million OCLC Numbers),原因有三:
首先是RLG的并入,为WorldCat提供了大量书目记录;
其次、也是影响最大的是,3月26日开始,OCLC把期刊论文信息加到了WorldCat.org中(OCLC. News and Events: Significant increase in OCLC number count);
第三,WorldCat记录去重规则改变,由于收录各国国家图书馆的记录,因而不再合并同一实体的不同语种书目记录(也就是说,同一种书,可能有用英语、法语、德语……著录的多条记录)。

    4月19日,完成了FirstSearch四个数据库(GPO, ArticleFirst, Medline and ERIC)期刊论文信息加载后,OCLC宣布升级的WorldCat.org开始提供期刊论文(OCLC. News and Events: Article-level citation records in WorldCat.org results)。根据IP地址,向使用者提供不同形式的链接:
· 链接到订购的联机数据库全文
· 链接到图书馆的链接解析器以访问相关文章
· 链接到文章传递服务

    对于非OCLC用户,自然享受不到上述链接服务。升级后的WorldCat.org主要可以用来查期刊文章的出处,并链接到期刊自己的网站。

    OCLC副总裁Lorcan Dempsey举了几个查人名的例子(Lorcan Dempsey's weblog: Worldcat.org and articles),看看查“manuel castells”吧(“结果大约有 35条”)……
   
    与Google Scholar相比?同样查“manuel castells”(约有10,200项符合"manuel castells"的查询结果):

检索功能:WorldCat.org较强,在检索结果较多时,它的与图书相同的限定检索功能(“精练您的检索”)很有帮助。Google Scholar侧栏只有相关作者提示,WorldCat.org则有作者、内容、语种、年份等可用于对检索结果作进一步限定。

检索结果:显然WorldCat.org数量较少。猜想原因:一是Google Scholar收录大量书刊引用信息;二是FirstSearch的这四个库收录期刊数量不够大。
不过,数量少并不能说明WorldCat.org只是Google Scholar的一个子集。如WorldCat查到的第一篇“Revolt against violence”在Google Scholar中就未收录。

就目前而言,WorldCat.org提供期刊论文检索还是为FirstSearch服务的,目标是其数据库订户。对非订户来说,没有网上免费的全文链接,就是其最大的硬伤了。如在WorldCat上查到的第二篇“Global Governance and Global Politics”,在Google Scholar上就可以找到原文。

总结如下:Google Scholar虽有找到全文的机会,但检索结果太多,又缺少有效的限定检索手段。使用时可以考虑与WorldCat.org结合,先在WorldCat中锁定目标,再到Scholar中获取全文。只是此法由于FirstSearch数据库的收录局限,漏检难以避免。