III发布“Innovative关联数据”服务

III(Innovative,知名图书馆自动化系统公司)上周宣布发布一项新的服务:Innovative关联数据。

Innovative Advocates for Library Visibility on Semantic Web with Launch of Innovative Linked Data (March 16, 2016)
消息中有很多高大上的说辞,但其功能基本上只要看标题和副标题就可以知道了:
消息标题:Innovative发布Innovative关联数据:倡导图书馆在语义网上的可见度
副标题:图书馆馆藏和位置显示在搜索引擎结果中
这是与Zepheira合作的成果,Eric Miller自然在推上转推了这个消息。在列出的十多家合作馆中,除了卡塔尔国家图书馆,其他都是美国的公共图书馆。

从新闻稿所附常见问题(链接)看,采用BIBFRAME(不知道是LC版还是bibfra.me版)。
初以为数据是直接以关联数据形式发布的(如WorldCat.org),实际上却是“定期发布图书馆数据更新到Web”,也就是说,不是实时更新的。流程是:
图书馆本地数据库–>抽取MARC记录并转换为MARCXML–>RDF转换为BIBFRAME–>发布在Library.Link网络–>通过Web和关联数据应用收割和链接

作为一项服务,自然是要另行收费的。会有多少图书馆购买?

RDA厂商访谈之III

Vendor Interview — Innovative Interfaces, Inc. (III) / by jhennelly (10 Jun 2011)

RDA开发方针对RDA工具套件调查中用户最关心的一些问题,选择若干厂商做访谈,让大家了解在由AACR2转向RDA过程中,相关产品会有哪些变化。第一家是Innovative公司,作答者为产品经理Ken Wells。本馆是III用户,其解答得认真看──最后一段比较出彩。

估计向各家提的问题是一样的。以下编号为本人所加:

1、你们的编目系统是否与MARC 21为适应RDA而做改变的9,10,11更新同步?如果没有,是否计划更新、有无时间表?是否改变书目记录与规范记录两者?

Yes。对于目前MARC的所有更新,Millennium系统都支持。已安装的需要免费更新以增加功能(通过CSDirect提交)。

2、你们系统的显示(面向公众的与内部的)能否显示新增加到MARC的RDA字段?有无未来改变计划、时间表?

Yes。Millennium馆员模块、WebPAC及Encore均可显示。正在评估如何用新数据元素来强化显示与访问记录数据。

3、请描述你们系统的检索界面(包括索引、限定、分面功能),它们如何处理新的RDA字段。有无未来改变计划、时间表?

如果图书馆需要的话,可以索引新的RDA字段[这里没说免费,不会要收钱吧]。正考虑以RDA字段增加限定与分面选项。

4、你们的系统是否支持用MARC以外的编码进行编目上?如果是的话,是否为支持RDA做过任何改变?有无未来改变计划、时间表?

Millennium原来就支持非MARC编目,目前没有对非MARC功能作进一步改变的计划,将待6月RDA测试结果公布再定。[III的非MARC编目主要通过其固定的字段与索引标签实现检索与显示功能,很粗放]

5、图书馆将在未来一段时间内处于混合记录环境中。在可见的未来,你们是否有停止支持AACR2的计划?

No。AACR2与RDA数据可以在数据库中并存,不但在Millennium,在新的Sierra服务平台也将同时支持两者。

6、对于AACR2和RDA记录在目录中并存的混合记录环境中,是否对使用你们系统的显示、检索或其他有所担心?

No。不管什么记录格式,用户可以选择向公众显示的字段。

7、RDA特别关注基于FRBR的记录间关系,采用作品-内容表达-载体表现-单件结构。你们的系统目前是否以什么方式利用了这一新数据与结构以改善用户体验?是否有计划未来基于这一数据改善用户体验?如果有,时间表?

Millennium目前没有FRBR化界面,但我们正致力于采用此一新数据与结构强化系统,现在还没有开发的具体时间表。[失望]

8、有人说,只要MARC仍然是主导的编码标准,RDA的好处不能充分体现。如果RDA被采用,你觉得MARC将如何?离开MARC对于你们的产品会产生何种问题?

不管对RDA的官方立场是什么,我们相信在可见的未来,图书馆仍将处于RDA与AACR2记录混合的状态,如同现在AACR、AACR2及其他记录格式的混合。

就Millennium和Sierra所关注的,AACR2和RDA在数据格式化风格上基本相同,差别只在数据如何解释。因此对于数据库,改变到RDA风格编码没有问题。在图书馆越来越转向目录结构FRBR化、记录本身原子化时,会引起一些问题。也就是说,当单个记录分解成到描述性元素(如主题标目、作者标目等)的链接,而非在每条记录中重复输入的数据,我们可以最终看到更加由关系驱动的数据结构,而非如现在目录中所见的逐个记录那样的孤立数据。这种改变将完全重构图书馆目录,向这一方向转变,需要厂商与图书馆双方的全力努力。我们知道,假以时日,这将是图书馆目录的本质,加入其他现代、多行业数据结构的结构与格式。[最后落实到了关联数据,如何在系统中实现,确实是一大挑战。在RDA官方测试结果出来前的回应虽然回避了MARC问题,却也描述了替代品的模样……]

[update 2011-11-11] qingyi在书社会翻译的访谈全集:
RDA自动化系统开发商系列访谈1-4:III、VTLS、BiblioMondo、Polaris (2011-07-03)
RDA自动化系统开发商系列访谈5-8:Ex Libris、Follett、OCLC、SkyRiver (2011-07-27)

在OPAC中加入Google图书信息

    Google图书搜索(GBS)中有不少图书可以看全文或可做全文搜索,在图书馆OPAC中加上其链接,实际上等于为图书馆增加了一大批电子书。当然,如果能有GBS可看全文图书的全部书目记录加入到OPAC,对图书馆更是免费的午餐──MBooks已经提供了这样的午餐。

    说回GBS,3月份时Google发布了GBS的API,不到三个月,已有很多图书馆在OPAC中加上了GBS链接。上月DePaul大学的Hilary Kraus在NGC4LIB邮件组征求实例“Integrating Google Book Search content into OPACs”,得到不少回应。这是她前几天的总结“Integrating Google Book Search content into OPACs — summary of examples”,发出后又收到一些回应。

    从使用情况看,有直接将链接结果嵌入网页的(显示封面或/和显示图书状态──noview, partial, full),也有提供链接即时查询的(意味着有可能实际上没有该书)。似乎大部分是采用在OPAC模板中嵌入JavaScript的方法实现,不同的是有的嵌在结果一览页,有的嵌在详细显示页(后者“打扰”GBS的机率小些)。肯特州立大学采用Innovative公司的自动化系统,其目录KentLINK用前者,在页面嵌入了“Google Book Search viewability API script”。
    德国科隆大学的Oliver Flimm则告知他们采用在后台使用GBS的JavaScript-API的方法实现(实例),目前只对full和partial两种提供链接。由于这种方法意味着不是由浏览器访问GBS,而是由服务器对GBS做批量操作,故而约翰·霍普金斯大学的Jonathan Rochkind询问是否会受到Google方面的流量限制。Oliver的回复是他也很担心,但岂今为止还没有。
    这种由服务器端操作的好处是每本书只查一次,而不会每次显示该书目时做一次查询。Oliver说他在Google的BookAPI新闻组提出将这种方法作为GBS-API的官方扩展,但未得回应。他并提出可以做一个本地快照,保存ISBN及对应GBS的full/partial状态。
    前些天开会时,遇到复旦数字化部张主任,讲到他们在OPAC中加上超星等电子书的链接,采用的大概就是这种方法吧。其实前年访问复旦时,张主任就曾介绍过他们链接教学参考书的情况,自己居然一点都不记得了,惭愧!

参见:
用Google图书搜索API增强OPAC (2008-03-16)
密歇根大学MBooks提供OAI接口 (2008-06-02)

[update 2008-6-7]
刚看到 GBS API 于5月31日推出了服务条款,如果要使用这项服务,请仔细阅读,实在很复杂。
2.11 举了一些不可做的事,其中一条:"crawl," "spider," index or in any non-transitory manner store or cache information obtained from the Service。因此Oliver所说的方法应该是被禁止的。之前大约服务条款未定,所以Google方面没有回应。

Via Covers from Google: Too good to be true? from Thing-ology (LibraryThing’s ideas blog) by (2008-6-6)