WorldCat身份档网络:WorldCat及其身份档的混搭

OCLC近日推出WorldCat身份档网络:WorldCat Identities Network,由J.D. Shipengrover负责开发。

WorldCat身份档(WorldCat Identities)中包括个人、对象(如泰坦尼克号船)、虚拟人物(如哈利·波特)、机构。身份档网络采用WorldCat身份档API,为被检索的身份提供多至10个相关身份,并以可视网络的方式显示。每个显示的身份都可以点击,再关联与其相关的10个身份。

在身份关联图下部,列有10个关联身份的:

1、身份档网络的页面链接
2、相关作品5部(由WorldCat检索API提供)及更多链接
3、WorldCat身份档的页面链接
4、出现频率(Occurance)

与被检索身份相关的链接在网页最下面,包括:
1、该身份所著作品的WorldCat链接(作者)
2、研究该身份作品的WorldCat链接(主题)
3、该身份WorldCat身份档的页面链接

据Lorcan Dempsey说,最初打算把身份档网络的图形显示放在身份档页面,因未能实现而决定作为一个独立的应用。Dempsey指出结果页完全未经编辑,数据采用API分别从WorldCat身份档和WorldCat中抽出,就是一个混搭(mashup),只是这个词现在不常听到了。
Dempsey指出,如果能显示上述身份间关系的类型[如作者、编者、研究者等]则更佳,只是书目数据不一致且不全。[RDA已经重拾并强化曾被忽略的“关系”]

开发页面给出了一个挑战:发现从Jane Austen到Aldous Huxley的六度分离关系,答案是Jane Austen──George Eliot──Henry James──Joseph Conrad──D.H. Lawrence──Aldous Huxley。依这个路径使用身份档网络发现,一般只同时显示二个身份关联图(即同时显示21个)。除非多个身份间有直接关系,如Austen, Jane与Chapman, R.W.与Southam, B.C.……由于Chapman是一个编辑,与较多作者关联,因而会产生较复杂的关系图。

另外,可视化或分面等数据挖掘后的显示,最容易显露数据中的错误。再以Jane Austen为例,关联的Champman, R.W. 1881-1960与Champman, R.W.显然是同一人。WorldCat身份档是从WorldCat中经程序挖掘而成的,显然规范做得还不到位。(直接查Jane Austen也可以看出这一点)
———-相关链接的分割线———
Lorcan Dempsey’s Weblog: Worldcat Identities Network: a ‘mashup’ (July 30, 2011)

新闻页面:OCLC News: New Prototype: WorldCat Identities Network (28 July 2011)

研究部页面:OCLC Research: WorldCat Identities Network (22 July 2011)

开发页面:OCLC Developer Network: WorldCat Identities Network

相关API
WorldCat Identities API landing page (technical information)

WorldCat Search API landing page (technical information)