乱谈图书馆自动化系统

    前些日子看到有个老外讲起图书馆自动化系统(ILS),把Innovative (III)
的Millennium归入“外包”的系统,初看有点出乎意料,转而想想也有点道理。当年选系统的时候,自动化部特别希望买这个系统,理由是系统由公司远程管理,有问题只要找公司解决就行,自己不用管,省心。“省心”也是有代价的,那就是连系统日志都看不到。某次发现系统中有一批记录更新出问题,想找出谁做的,向公司提出请求,正遇上圣诞假期,过后没及时催,紧接着学校放假,等开学了再找公司,时间已过,信息已经查不到了。
   
不管什么系统,无论系统理员是不是省心,使用的部门一样会头大。有人说Google聪明,上线几年的应用,仍然挂着beta,摆明出错是正常的,试用版嘛。当然Google是免费的,出错可以原谅。但事实上花费不菲买来的商业ILS,每次升级也会出现各种各样的问题,大概也是正常的(要不为什么某使用
Horizon的图书馆轻易不愿升级),并且也不得不“原谅”。不过,像III这样,每年收大把的维护费,要做些维护的事,比如使用培训,比如重新做一次索引,还要另外收费,就很不可思议了。
   
最不可原谅的,是Millennium系统的汉字是永远的alpha版,这么多年没什么长进(或者因转到Unicode而更糟?),永远不清楚即将进入系统的字会变成什么模样——虽然问题字符应该不到1%,也足够让人头痛。2000年在HKIEd,她们就在很认真地抓同一个汉字进入系统呈现不一样代码而查不到的问题。后来香港用户协会一同做这件事,向公司提供了字符对应表──本来应该是公司做的事,竟然由用户承担,只能说是“骑虎难下”。不知道香港有了字符对应表,问题是否彻底解决。大陆地区从GB/GBK对应到
CCCII/EACC(现在是Unicode),用不上香港的表,用户又各自为阵,据说某馆竟然有十个人处理乱码问题。按一般逻辑,买来的系统应该是可用的,保证进入系统的字符正确理所应当,并且每年还在付维护费,如果已经进入系统的字符出问题,公司负责改正也是理所应当──不幸事实却是,由于码表不全、字符对应错误,进入系统字符出错是每天都在发生的事,需要用户发现后逐个向公司提出,并且同一个字符更改正确后,保不准过些日子又出问题;而所有已经进入系统的乱码都要用户自己来改。竟然有如此痛苦的“外包”!

   
曾经看到国外对多家图书馆自动化系统的用户调查,对Millennium的满意程度相当高,公司显然也很是引以为傲的。近些年有Geek对ILS公司不满,
在于公司不开放接口让用户开发自己的应用,从把Millennium看作外包来看,Millennium本来就是适用傻瓜型系统管理的(似乎是目前唯一一家不开放的大ILS公司),用户方面大概也很少自主开发的要求,因此就很满意?如果在中国做ILS调查,不知道结果会怎样。
   
认真想一想,虽然是用户调查,还真不知道调查表是什么人填的,馆长?系统部?业务部门?最终用户?恐怕结果会大相径庭的。同样地,图书馆打算更新系统前,
向谁了解系统情况?也是需要认真考虑的。一个完整的ILS,有很多的模块与功能,对各系统的功能与操作流程的综合平衡,才是最终决定因素(撇开价格因
素)。在各系统大多数功能相似的情况下,有时候,某个功能特别强大,会成为最终决定时很重要的砝码,但也不要忘了,如果某个功能特别弱,也是会被断然抛弃的。
   
前面说撇开价格因素,其实价格是开始圈定候选系统时首先考虑的因素。在设定价格范围内开始考察系统时,入选公司会向你展示最完美的系统,当觉得满意而有意向后,或许会“不经意中发现”,某些演示的功能没有包含在基本价格中──大价钱都已经接受了,再附加一点也可以承受吧,最终价格可能会因此悄悄地上调不少。十多年前我们选系统时,OPAC还不是一个受人关注的部分,好象没有什么人考虑读者如何使用,只考虑本部门要用的功能能否方便地实现。现在大家观念不同了,所以学网上有人说,可以上网去测试。只是一般人可能不知道实现同样的功能,在某些系统是含在基本价格中的,而有些系统则另有代价,比如显示封面图片,比如提供外部相关链接,比如2.0的OPAC界面。

[update] 2009-6-3 经多次努力,本馆Millennium字符问题终获解决。

远程存储(remote storage)

    远程存储(remote storage)指图书馆将较少使用的馆藏存放到图书馆之外的其他地点;也指图书馆之外的馆藏存储设施(remote storage facility)。亦称异地存储(off-site storage)、异地排架(off-site shelving)、远程排架(remote shelving)。实施远程存储的多为研究图书馆,高校图书馆的远程存储有时亦称校外存储(off-campus storage)。
    远程存储出现的主要原因是图书馆空间不足。其历史可以追溯到公元前XX年埃及的亚历山大图书馆,当时曾把4.8万件复本存储到一个寺庙中。现代见诸文献的对远程存储的讨论始于哈佛大学校长Charles W. Eliot,他在1900前后提出将快速累积的图书按使用情况加以区分,以密集方式保存未被使用的图书,并建议在美国建立三至四个存储图书馆。远程存储在20世纪中期以后得到发展,1990年代后随着互联网的发展,电子资源增加导致印刷及其他类型馆藏的使用量下降,更多图书馆为保持或增加读者使用空间,将大量实体馆藏放入远程存储设施,如美国科罗拉多州立大学图书馆,将1/3馆藏放在远程存储。
    远程存储设施有合作建设与独立建设两类。1934年法国国家图书馆在Versailes完成的存储图书馆是现代较早独立建设的远程存储设施。1941年建立的美国新英格兰存储图书馆(New England Deposit Library)则是合作建设的早期实例。合作存储还具有剔除重复文献、提供馆际互借等功能。
    远程存储设施的建立主要出于经济考虑,因而一般设立在地价低廉处,部分直接使用已有建筑改装。目前模块化设计成为趋势,可以随馆藏发展在现有存储设施侧增加新的模块。设施大多按资料尺寸密集存储以节省空间,有温湿度控制以利长期保存。
    为保障用户的文献需求,远程存储设施选择提供以下几种服务:1、通过图书馆传送文献,一般提出需求后的1-3个工作日内送到读者指定的借阅处;2、版权允许范围内的影印、传真等服务;3、现场阅览。

注:以上短文是一年前为拟议中的《图书馆学新辞典》撰写的词条,目前看来该辞典已被遗忘了。为不浪费自己的一番心血,自存档于此。同时也向部分参与者诚意致歉!

虚拟国际规范档XML格式

    虚拟国际规范档(VIAF)已由美国国会图书馆、法国国家图书馆、德国国家图书馆和OCLC共同建设多年,网站近日更新,才发现参加国多了瑞典,据称还有多个国家要参与。目前有780万条记录,合并自920万记录,这些合并处理,主要由OCLC承担。
    目前页面有作品封面显示,看上去比较有亲和力。据OCLC首席科学家Thomas Hickey介绍,此次更新,是对SRU查询返回的XML数据,以XLS转换,可以显示为MARC 21格式和UNIMARC格式。据称在不久的将来,还会有linked data显示。

参见:
Outgoing:Changes to VIAF (April 03, 2009)
Lorcan Dempsey’s weblog:Virtual International Authority File (April 3, 2009)

附:虚拟国际规范档XML格式(以http://viaf.org/viaf/22146540为例)

<?xml version=”1.0″ ?>
<?xml-stylesheet type=”text/xsl” href=”/viaf/xsl/searchRetrieveResponse.xsl”?>
<ns2:VIAFCluster xmlns=”http://viaf.org/Domain/Cluster/terms#” xmlns:owl=”http://www.w3.org/2002/07/owl#” 
xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:ns2=”http://viaf.org/Domain/Cluster/terms#”>

<! 规范数据来源,格式:来源馆代码|规范记录号 >
<ns2:sources>
  <ns2:source>DNB|119012871</ns2:source>
  <ns2:source>SELIBR|196381</ns2:source>
  <ns2:source>LC|n  50001905</ns2:source>
  <ns2:source>BNF|11917976</ns2:source>
</ns2:sources>

<! 记录长度,行数?>
<ns2:length>894</ns2:length>

<! 主标目,由各来源馆确定的共同主标目。此条正巧一致,否则如何确定?>
<ns2:mainHeadings>
  <ns2:data>
    <ns2:text>O’Brien, Flann, 1911-1966</ns2:text>
    <ns2:sources>
      <ns2:s>SELIBR</ns2:s>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

<! 来源馆的主标目,采用MARCXML格式;有到其他来源馆记录的链接>
  <ns2:mainHeadingEl>
    <ns2:datafield ind1=”1″ ind2=” ” tag=”100″>
      <ns2:subfield code=”a”>O’Brien, Flann</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
    <ns2:id>http://orlabs.oclc.org/viaf/DNB|119012871</ns2:id>
    <ns2:links>
      <ns2:link>
        <ns2:match type=”date”>
          <ns2:birth>1911</ns2:birth>
          <ns2:death>1966</ns2:death>
        </ns2:match>http://orlabs.oclc.org/viaf/BNF|11917976
      </ns2:link>

    <ns2:links>
  </ns2:mainHeadingEl>

<! 来源馆主标目:UMIMARC格式,只有法国国家图书馆采用,数据字段部分不同>
  <ns2:mainHeadingEl>
    <ns2:datafield ind1=” ” ind2=”|” tag=”200″>
      <ns2:subfield code=”7″>ba0yba0y</ns2:subfield>
      <ns2:subfield code=”8″>fre</ns2:subfield>
      <ns2:subfield code=”9″>0</ns2:subfield>
      <ns2:subfield code=”a”>O’Brien</ns2:subfield>
      <ns2:subfield code=”b”>Flann</ns2:subfield>
      <ns2:subfield code=”f”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
       <ns2:s>BNF</ns2:s>
    </ns2:sources>
    <ns2:id>http://orlabs.oclc.org/viaf/BNF|11917976</ns2:id>
    <ns2:links>

    </ns2:links>
  </ns2:mainHeadingEl>

</ns2:mainHeadings>

<! 固定长字段,二种MARC格式应该是不同的吧,如何体现?>
<ns2:fixed>
  <ns2:govtAgn>|</ns2:govtAgn>
  <ns2:authRef>a</ns2:authRef>
  <ns2:serUse>|</ns2:serUse>
  <ns2:rules>|</ns2:rules>
  <ns2:gender>u</ns2:gender>
  <ns2:encLevel>n</ns2:encLevel>
  <ns2:subjUse>a</ns2:subjUse>
  <ns2:catLang>|</ns2:catLang>
  <ns2:nameUse>a</ns2:nameUse>
  <ns2:roman>|</ns2:roman>
  <ns2:subType>|</ns2:subType>
  <ns2:source>|</ns2:source>
  <ns2:recStatus>n</ns2:recStatus>
  <ns2:nameDiff>a</ns2:nameDiff>
  <ns2:refStatus>|</ns2:refStatus>
  <ns2:dateEntered>19920923</ns2:dateEntered>
  <ns2:type>z</ns2:type>
  <ns2:authStatus>a</ns2:authStatus>
  <ns2:geoSubd>n</ns2:geoSubd>
</ns2:fixed>

<! 见参照,前一条是法国UNIMARC的,后一条是MARC21的,其实只有字段指示符不同>
<! 来源不同,即使同为MARC21,也做二条,即不重复sources>
<ns2:x400s>
  <ns2:x400>
    <ns2:datafield ind1=” ” ind2=”|” tag=”400″>
      <ns2:subfield code=”a”>Copaleen, Myles</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>BNF</ns2:s>
    </ns2:sources>
  </ns2:x400>

  <ns2:x400>
    <ns2:datafield ind1=”1″ ind2=” ” tag=”400″>
      <ns2:subfield code=”a”>Copaleen, Myles,</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
    </ns2:sources>
  </ns2:x400>

</ns2:x400s>

<! 参见参照>
<ns2:x500s>
  <ns2:x500>
    <ns2:datafield ind1=”0″ ind2=” ” tag=”500″>
      <ns2:subfield code=”a”>Myles na Gopaleen,</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>SELIBR</ns2:s>
    </ns2:sources>
  </ns2:x500>

</ns2:x500s>

<! 作者的作品一览及收藏馆,count指版本数?>
<ns2:titles>
  <ns2:data count=”25″>
    <ns2:text>at swim two birds</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:titles>

<! 作者作品出版社一览及收藏馆,count指版本数?>
<ns2:publishers>
  <ns2:data count=”35″>
    <ns2:text>suhrkamp</ns2:text>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  &

lt;/ns2:data>

</ns2:publishers>

<! 作者生卒年>
<ns2:birthDate>1911</ns2:birthDate>
<ns2:deathDate>1966</ns2:deathDate>

<! 以下不明>
<ns2:dates max=”200″ min=”193″>
  <ns2:date count=”3″ scaled=”1.58496250072″>193</ns2:date>
  <ns2:date count=”0″ scaled=”0.0″>194</ns2:date>
  <ns2:date count=”3″ scaled=”1.58496250072″>195</ns2:date>
  <ns2:date count=”21″ scaled=”4.39231742278″>196</ns2:date>
  <ns2:date count=”45″ scaled=”5.49185309633″>197</ns2:date>
  <ns2:date count=”44″ scaled=”5.45943161864″>198</ns2:date>
  <ns2:date count=”54″ scaled=”5.75488750216″>199</ns2:date>
  <ns2:date count=”35″ scaled=”5.12928301694″>200</ns2:date>
</ns2:dates>

<! 作品ISBN一览及条数,count指版本数?德国不同版本ISBN重复较常见>
<ns2:ISBNs unique=”118″>
  <ns2:data count=”9″>
    <ns2:text>3518374869</ns2:text>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:ISBNs>

<! 作品封面吧>
<ns2:covers>
  <ns2:data count=”1″>
    <ns2:text>1564783286</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
    </ns2:sources>
  </ns2:data>
</ns2:covers>

<! 应该是作品出版地,scaled不明>
<ns2:countries>
  <ns2:data count=”25″ scaled=”5″>
    <ns2:text>GB</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:countries>

<! 作者所用语言及国籍>
<ns2:languageOfEntity>eng</ns2:languageOfEntity>
<ns2:nationalityOfEntity>IE</ns2:nationalityOfEntity>

<! VIAF处理情况及时间>
<ns2:history>
  <ns2:ht recid=”BNF|11917976″ time=”2009-03-03 17:03:22″ type=”add”/>
  <ns2:ht recid=”DNB|119012871″ time=”2009-03-03 17:03:29″ type=”add”/>
  <ns2:ht recid=”LC|n  50001905″ time=”2009-03-03 17:03:29″ type=”add”/>
  <ns2:ht recid=”SELIBR|196381″ time=”2009-03-03 17:03:42″ type=”add”/>
</ns2:history>

<! VIAF号>
<ns2:viafID>22146540</ns2:viafID>
</ns2:VIAFCluster>