书目数据开放

    上周写了“读秀──MARC免费收集系统”。也许是物以类聚,也许是看客对本人比较客气,留言中没有持异议的。但从其他方面了解到,博文的观点恐怕还是很受某些BS的──Web/Lib2.0不是要开放吗?
    偶以为,图书馆的确应当开放书目数据,不论是通过Z39.50方式,还是通过API等其他方式,让高质量的数据在有需要的时候为各方所用,也让图书馆服务更接近用户。只不过开放数据不应该以数据打包送厂商的方式进行,尤其是联合目录──O’Reilly的Web2.0七项原则之三是说“数据是下一个Intel Inside”,那是进一步挖掘数据内涵、提供增值服务、奠定自己位置的基础。

    其实开放书目数据是一种很通行的方式,在还没有Web的时候,图书馆界就通过Z39.50方式开放MARC数据。自己当初改行做编目,不久就赶上互联网大发展,得以在世界各国搜寻可以免费下载MARC记录的Z39.50服务器。因为做西文编目,很幸运地找到如美国国会图书馆、OhioLINK这样数据很丰富的MARC记录来源,90%以上图书记录可以由此获得。后来开始写博,就想到介绍“Z39.50服务器信息”(2004-11-04) ,也经常在其他场合向人推荐以Z39.50方式下载MARC记录。
    曾经,国内几个联合目录还是开放匿名下载简编记录的,开放详编记录的图书馆也有一些。后来渐渐地,国内可以公开访问的Z39.50服务器几乎销声匿迹。在这种情况下,图书馆如果没有参加某个联合目录,就难以下载到中文MARC记录。基本上的解决办法是自己低效率地做原编,或者由书商/书目数据商提供──由此促进了书目数据商的发展也未可知。书目数据商除了自己做编目外,还通过其他方式获取MARC数据──比如“借用”图书馆帐号下载联合目录数据,比如通过技术手段分析网页抓取书目数据。
    总之,关闭Z39.50服务器公开访问,对书目数据商影响有限,因为他们可以低成本地得到数据,而力量薄弱的小图书馆却无法在书目数据方面得到帮助。所以,曾希望国家图书馆开放Z39.50服务(开放中的中国国家图书馆),因为偶认为国家图书馆有为业界服务的责任。不过,今天先听到的消息是,某联合目录要免费下载了。还不知道以什么方式,先赞一声!

《书目数据开放》上有3条评论

  1. 请胡老师关注一下cbip.cn中国可供书目网站,还在运行初期,将元数据和对象数据相互结合,共同揭示图书内容。中国出版集团公司主办。诚意请求赐教。
    博主 对 yang wen sheng 的回复: 2009-03-21 20:00:57
    初步试用:
    网上样本厅,目前有80654条;
    "元数据和对象数据相互结合",有点Google图书的样子;
    书内搜索,限样本部分.
    书目打包下载,需登录论坛(不知道设此限目的何在).

  2. 请客户登录后下载,目的是建立联系机制。当然很多是乱填的。但是仍然会有诚意的客户填写上地址。我们是希望能有人经常提出问题,帮助我们改进。做了一段时间后体会,建立一套好的书目体系,真的是很难。我们现在正在与总署的书号实名制尝试建立合作关系,以期待将其引入出版商的确认,从而成为全面的预告书目,再通过可供书目进行更新,通过电子样本在网上展示,帮助书店和图书馆选择到并且能够采到适合的图书。与图书馆的合作,我们希望通过系统之间的互联互通,实现图书馆上班开机便可看到前一天的经过与本馆馆藏查重的新书目,提高图书馆的采访效率。

评论已关闭。