书目数据开放

    上周写了“读秀──MARC免费收集系统”。也许是物以类聚,也许是看客对本人比较客气,留言中没有持异议的。但从其他方面了解到,博文的观点恐怕还是很受某些BS的──Web/Lib2.0不是要开放吗?
    偶以为,图书馆的确应当开放书目数据,不论是通过Z39.50方式,还是通过API等其他方式,让高质量的数据在有需要的时候为各方所用,也让图书馆服务更接近用户。只不过开放数据不应该以数据打包送厂商的方式进行,尤其是联合目录──O’Reilly的Web2.0七项原则之三是说“数据是下一个Intel Inside”,那是进一步挖掘数据内涵、提供增值服务、奠定自己位置的基础。

    其实开放书目数据是一种很通行的方式,在还没有Web的时候,图书馆界就通过Z39.50方式开放MARC数据。自己当初改行做编目,不久就赶上互联网大发展,得以在世界各国搜寻可以免费下载MARC记录的Z39.50服务器。因为做西文编目,很幸运地找到如美国国会图书馆、OhioLINK这样数据很丰富的MARC记录来源,90%以上图书记录可以由此获得。后来开始写博,就想到介绍“Z39.50服务器信息”(2004-11-04) ,也经常在其他场合向人推荐以Z39.50方式下载MARC记录。
    曾经,国内几个联合目录还是开放匿名下载简编记录的,开放详编记录的图书馆也有一些。后来渐渐地,国内可以公开访问的Z39.50服务器几乎销声匿迹。在这种情况下,图书馆如果没有参加某个联合目录,就难以下载到中文MARC记录。基本上的解决办法是自己低效率地做原编,或者由书商/书目数据商提供──由此促进了书目数据商的发展也未可知。书目数据商除了自己做编目外,还通过其他方式获取MARC数据──比如“借用”图书馆帐号下载联合目录数据,比如通过技术手段分析网页抓取书目数据。
    总之,关闭Z39.50服务器公开访问,对书目数据商影响有限,因为他们可以低成本地得到数据,而力量薄弱的小图书馆却无法在书目数据方面得到帮助。所以,曾希望国家图书馆开放Z39.50服务(开放中的中国国家图书馆),因为偶认为国家图书馆有为业界服务的责任。不过,今天先听到的消息是,某联合目录要免费下载了。还不知道以什么方式,先赞一声!