SkyRiver的电子书元数据服务

这一年多开始把电子书、学位论文的MARC数据导入到图书馆集成系统中,让读者可以在使用OPAC时同时查到电子资源。于是就感受到电子资源元数据质量之差,基本上除了题名和作者,其他就不用指望了。
今天看到III旗下的书目外包商SkyRiver推出电子书元数据服务,感觉真是抓住了商机。
该服务名为“电子MARC快车”,提供OverDrive和3M云图书馆的电子书MARC数据,3天交付。如果只要来自书商元数据的MARC记录,免费;由SkyRiver提供的全MARC记录,则为每条$0.85(如果是其订户$0.75)。
不过,我们的电子书模式与美国不同完全,此法不适用。

见:Maximize Your E-Holdings: eMARC Express

外包、联合目录及数字出版

    老马在“编目未来”下留言,要我谈谈对外包与联合目录关系的看法。
    去年初看到《加州大学书目服务再思考》,提到“外包大部分MARC编制工作”时,就有一个很大的疑惑:如果高水平的编目机构都把MARC编制工作外包出去了,那么联合目录的书目数据从何而来呢?
    那天参加编目中心年会,得知上图就在给加州大学做外包。后蒙纪陆恩赠送与庄蕾波合著《境外合作编目理论与实践》,也了解到国外的外包不只是给外包商,还包括海外专业机构。联想到一位大学同学,前几年就在为美国图书馆代购国内图书,并在国内做好符合OCLC要求的书目数据,也是一种编目外包吧。这些书目数据,最终都会收录到联合目录中,所以联合目录应该不愁数据来源。

    老马担心外包对国内联合目录的负面影响,我也有同样的担心。美国在四十年代有编目危机之说,原因之一是由于合作编目的发展,为合作编目所制定的标准化编目规则造成的编目条款激增,导致编目效率相对下降,待编文献积压。我们目前似乎也处于这样的状态,为了要达到标准化,编目员的很多时间花在了一些机械化的操作上,很多情况下并无助于目录职能的改善。由于效率问题,编目部门很容易受到馆领导的质疑,而图书馆参与联合目录的积极性也因之受挫。这也是我之所以对简化编目格式持积极态度的主要原因,核心级记录、访问级记录、……,都应该是我们的目标。我们应该有提高编目效率的简化标准。
    这只是问题的一方面,问题的另一方面是联合目录不够强大,既不能完全反映图书馆的馆藏,也没让图书馆觉得不反映有什么不方便。联合目录功能单一,馆际互借还处于襁褓期,文献传递又自成一体,联合目录未能融入图书馆的日常服务之中。OCLC的联合目录是馆际互借的依托,worldcat.org可以变成图书馆的本地目录,因而图书馆会把自己的所有馆藏信息都交给它。我们的联合目录做不到,甚至还刻意地回避这样做。结果是,外包的书目数据是否进入联合目录成为一个问题,联合目录的发展堪忧。
    当然,上面的联合目录其实特指CALIS了。以国图、上图等大机构为依托建立的联合目录,不用担心数据来源,因为主体馆藏数量本身就足够庞大,即使没有其他来源,也可供其他馆作一个优秀的下载来源。只是这些联合目录的功能就更单一了,基本上无法反映成员馆的馆藏,如果发展馆际互借,单向性更明显。

    自己对外包的运作所知甚少,无论是商业机构还是联合目录。就书目来源方面,商业机构无论是否选择套录联合目录数据,都需要有一批人做原编;而像OCLC这样的联合目录做外包,又将如何处理没有收录的图书?或者还要有一个附属的部门做原编?

    另:关于多来源数据对图书馆的适用性。国会图书馆书目未来工作组报告草案把图书馆置于从作者到读者的书目信息供应链中的一个普通环节(The library is … only one link in the supply chain of bibliographic information between author and reader),应该也是中肯的。另一方面,图书馆界也有必要参与到这个供应链的上游,让原始的数据适应图书馆的需求。RDA在与ONIX合作研究,耄耋少年也一直在呼吁图书馆界参与国内出版业标准的制定,不知中图学会、国家图书馆(如书蠹精)是否已经介入相关工作?

附:老马的留言:
很想听听精灵老师对外包与联合目录关系的看法。外包盛行的日美两国,联合目录同样很发达。我不知道日本情况如何,至少在美国像OCLC那样的联合目录巨擘也是最大的编目外包商。反观国内的情况很令人沮丧。联合目录刚刚起步,却在外包“风”前摇摇欲坠了(但愿是杞人忧天)。国内外包商目前基本上游离于联合目录(不是说它们不去用联合目录的数据,大的外包商往往拥有几个联合目录的数据,小的就难说了。),它们从联合目录中抽走的不仅是客户,而是数据与资源,即联合目录赖以生存的馆藏数据与书目数据。当然也有单位私下把账号授予外包商代为上传数据的,但这毕竟不合法。外包商现在打的是经济牌,数据白送,哪有馆长不动心的,你编目员同它们是“不平等竞争”。但哪天没了“免费午餐”(可能就在外包普遍化之时),馆长们对“外包”的热情可能又会减退。
有人总担心外包数据影响质量。我倒并不以为然。既然数据来源多样化,还有什么数据不敢要。但我不知道“目录职能”之类的经典论述还灵不灵?毕竟根据“目录职能”,仅仅能“检索”是不够的。确实,从图书生产到图书进馆,其中有许多书目数据,但不同数据的“职能”肯定不同。书商的书目首先是推销图书,他的书目怎么跟图书馆的需求协调呢?当然“数据强化”不失为有效的方法,但这么一“强化”,它的成本是否就会比以前少了呢?而且什么数据该强化,什么不该强化,其标准又在哪呢?怎么操作呢?另外编目部(或者将来其他什么部)养着“强化”馆员,恐怕馆长看着就不顺眼。

参见:
编目未来 (2007-12-20) /posts/20071217183148.html
OPAC 2.0计划书:《加州大学书目服务再思考》 (2006-02-02) /posts/20060202195927.html
《书目控制未来报告》(草案)解读 (2007-12-05) /posts/20071205221125.html
《资源描述与检索》(RDA)一统江湖?(2006-04-16) /posts/20060416102200.html
《中文图书标识数据》(征求意见稿)观感 (2007-01-21) /posts/20070121221436.html
(链接有耄耋少年多篇相关博文)

耄耋少年:
图书馆人的责任 (2007-12-22) http://blog.sina.com.cn/s/blog_4bd4c87b010081q3.html
图书馆界对数字复合出版系统有那些要求?(2007-12-19) http://blog.sina.com.cn/s/blog_4bd4c87b010080s9.html
数字出版当前最需要的是实现ECIP (2007-12-06) http://blog.sina.com.cn/s/blog_4bd4c87b01000blz.html