虚拟国际规范档XML格式

    虚拟国际规范档(VIAF)已由美国国会图书馆、法国国家图书馆、德国国家图书馆和OCLC共同建设多年,网站近日更新,才发现参加国多了瑞典,据称还有多个国家要参与。目前有780万条记录,合并自920万记录,这些合并处理,主要由OCLC承担。
    目前页面有作品封面显示,看上去比较有亲和力。据OCLC首席科学家Thomas Hickey介绍,此次更新,是对SRU查询返回的XML数据,以XLS转换,可以显示为MARC 21格式和UNIMARC格式。据称在不久的将来,还会有linked data显示。

参见:
Outgoing:Changes to VIAF (April 03, 2009)
Lorcan Dempsey’s weblog:Virtual International Authority File (April 3, 2009)

附:虚拟国际规范档XML格式(以http://viaf.org/viaf/22146540为例)

<?xml version=”1.0″ ?>
<?xml-stylesheet type=”text/xsl” href=”/viaf/xsl/searchRetrieveResponse.xsl”?>
<ns2:VIAFCluster xmlns=”http://viaf.org/Domain/Cluster/terms#” xmlns:owl=”http://www.w3.org/2002/07/owl#” 
xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:ns2=”http://viaf.org/Domain/Cluster/terms#”>

<! 规范数据来源,格式:来源馆代码|规范记录号 >
<ns2:sources>
  <ns2:source>DNB|119012871</ns2:source>
  <ns2:source>SELIBR|196381</ns2:source>
  <ns2:source>LC|n  50001905</ns2:source>
  <ns2:source>BNF|11917976</ns2:source>
</ns2:sources>

<! 记录长度,行数?>
<ns2:length>894</ns2:length>

<! 主标目,由各来源馆确定的共同主标目。此条正巧一致,否则如何确定?>
<ns2:mainHeadings>
  <ns2:data>
    <ns2:text>O’Brien, Flann, 1911-1966</ns2:text>
    <ns2:sources>
      <ns2:s>SELIBR</ns2:s>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

<! 来源馆的主标目,采用MARCXML格式;有到其他来源馆记录的链接>
  <ns2:mainHeadingEl>
    <ns2:datafield ind1=”1″ ind2=” ” tag=”100″>
      <ns2:subfield code=”a”>O’Brien, Flann</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
    <ns2:id>http://orlabs.oclc.org/viaf/DNB|119012871</ns2:id>
    <ns2:links>
      <ns2:link>
        <ns2:match type=”date”>
          <ns2:birth>1911</ns2:birth>
          <ns2:death>1966</ns2:death>
        </ns2:match>http://orlabs.oclc.org/viaf/BNF|11917976
      </ns2:link>

    <ns2:links>
  </ns2:mainHeadingEl>

<! 来源馆主标目:UMIMARC格式,只有法国国家图书馆采用,数据字段部分不同>
  <ns2:mainHeadingEl>
    <ns2:datafield ind1=” ” ind2=”|” tag=”200″>
      <ns2:subfield code=”7″>ba0yba0y</ns2:subfield>
      <ns2:subfield code=”8″>fre</ns2:subfield>
      <ns2:subfield code=”9″>0</ns2:subfield>
      <ns2:subfield code=”a”>O’Brien</ns2:subfield>
      <ns2:subfield code=”b”>Flann</ns2:subfield>
      <ns2:subfield code=”f”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
       <ns2:s>BNF</ns2:s>
    </ns2:sources>
    <ns2:id>http://orlabs.oclc.org/viaf/BNF|11917976</ns2:id>
    <ns2:links>

    </ns2:links>
  </ns2:mainHeadingEl>

</ns2:mainHeadings>

<! 固定长字段,二种MARC格式应该是不同的吧,如何体现?>
<ns2:fixed>
  <ns2:govtAgn>|</ns2:govtAgn>
  <ns2:authRef>a</ns2:authRef>
  <ns2:serUse>|</ns2:serUse>
  <ns2:rules>|</ns2:rules>
  <ns2:gender>u</ns2:gender>
  <ns2:encLevel>n</ns2:encLevel>
  <ns2:subjUse>a</ns2:subjUse>
  <ns2:catLang>|</ns2:catLang>
  <ns2:nameUse>a</ns2:nameUse>
  <ns2:roman>|</ns2:roman>
  <ns2:subType>|</ns2:subType>
  <ns2:source>|</ns2:source>
  <ns2:recStatus>n</ns2:recStatus>
  <ns2:nameDiff>a</ns2:nameDiff>
  <ns2:refStatus>|</ns2:refStatus>
  <ns2:dateEntered>19920923</ns2:dateEntered>
  <ns2:type>z</ns2:type>
  <ns2:authStatus>a</ns2:authStatus>
  <ns2:geoSubd>n</ns2:geoSubd>
</ns2:fixed>

<! 见参照,前一条是法国UNIMARC的,后一条是MARC21的,其实只有字段指示符不同>
<! 来源不同,即使同为MARC21,也做二条,即不重复sources>
<ns2:x400s>
  <ns2:x400>
    <ns2:datafield ind1=” ” ind2=”|” tag=”400″>
      <ns2:subfield code=”a”>Copaleen, Myles</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>BNF</ns2:s>
    </ns2:sources>
  </ns2:x400>

  <ns2:x400>
    <ns2:datafield ind1=”1″ ind2=” ” tag=”400″>
      <ns2:subfield code=”a”>Copaleen, Myles,</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
    </ns2:sources>
  </ns2:x400>

</ns2:x400s>

<! 参见参照>
<ns2:x500s>
  <ns2:x500>
    <ns2:datafield ind1=”0″ ind2=” ” tag=”500″>
      <ns2:subfield code=”a”>Myles na Gopaleen,</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>SELIBR</ns2:s>
    </ns2:sources>
  </ns2:x500>

</ns2:x500s>

<! 作者的作品一览及收藏馆,count指版本数?>
<ns2:titles>
  <ns2:data count=”25″>
    <ns2:text>at swim two birds</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:titles>

<! 作者作品出版社一览及收藏馆,count指版本数?>
<ns2:publishers>
  <ns2:data count=”35″>
    <ns2:text>suhrkamp</ns2:text>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  &

lt;/ns2:data>

</ns2:publishers>

<! 作者生卒年>
<ns2:birthDate>1911</ns2:birthDate>
<ns2:deathDate>1966</ns2:deathDate>

<! 以下不明>
<ns2:dates max=”200″ min=”193″>
  <ns2:date count=”3″ scaled=”1.58496250072″>193</ns2:date>
  <ns2:date count=”0″ scaled=”0.0″>194</ns2:date>
  <ns2:date count=”3″ scaled=”1.58496250072″>195</ns2:date>
  <ns2:date count=”21″ scaled=”4.39231742278″>196</ns2:date>
  <ns2:date count=”45″ scaled=”5.49185309633″>197</ns2:date>
  <ns2:date count=”44″ scaled=”5.45943161864″>198</ns2:date>
  <ns2:date count=”54″ scaled=”5.75488750216″>199</ns2:date>
  <ns2:date count=”35″ scaled=”5.12928301694″>200</ns2:date>
</ns2:dates>

<! 作品ISBN一览及条数,count指版本数?德国不同版本ISBN重复较常见>
<ns2:ISBNs unique=”118″>
  <ns2:data count=”9″>
    <ns2:text>3518374869</ns2:text>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:ISBNs>

<! 作品封面吧>
<ns2:covers>
  <ns2:data count=”1″>
    <ns2:text>1564783286</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
    </ns2:sources>
  </ns2:data>
</ns2:covers>

<! 应该是作品出版地,scaled不明>
<ns2:countries>
  <ns2:data count=”25″ scaled=”5″>
    <ns2:text>GB</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:countries>

<! 作者所用语言及国籍>
<ns2:languageOfEntity>eng</ns2:languageOfEntity>
<ns2:nationalityOfEntity>IE</ns2:nationalityOfEntity>

<! VIAF处理情况及时间>
<ns2:history>
  <ns2:ht recid=”BNF|11917976″ time=”2009-03-03 17:03:22″ type=”add”/>
  <ns2:ht recid=”DNB|119012871″ time=”2009-03-03 17:03:29″ type=”add”/>
  <ns2:ht recid=”LC|n  50001905″ time=”2009-03-03 17:03:29″ type=”add”/>
  <ns2:ht recid=”SELIBR|196381″ time=”2009-03-03 17:03:42″ type=”add”/>
</ns2:history>

<! VIAF号>
<ns2:viafID>22146540</ns2:viafID>
</ns2:VIAFCluster>

杜威分类号中的斜线“/”

    杜威十进分类法(DDC)中是没有斜线“/”的,但书目记录中的DDC类号有不少带斜线的。前一阵有位网友曾在本博留言,问“/”的含意;这几天CALIS联合目录咨询中,又有同仁问同样的问题。可见对此迷惑的不在少数。

    以前我也同样迷惑不解。2005年3月,不知为何下了决心,要弄明白此问题。在美国国会图书馆网站上找到了十进分类法部主管Dennis McGovern的邮箱,举338.6/42/091724为例发邮件询问。不久收到回复,称“/”(正式名称segmentation marks),有两种含意:
    一表示简版号的结束(Abridged ed.)
    一表示标准复分号的开始
我的例子中的两个/正好分别是这两个意思。

    今天王绍平老师介绍了OCLC网站上的“Segmentation Marks in Dewey Numbers”(DDC现归OCLC旗下),表明LC已经不再用“/”(也称prime marks或slash marks)表示标准复分号的开始了。
    经由网站链接的博客025.431: The Dewey blog的博文Sweet segment solution (August 04, 2005),得知此决定由2005年9月1日起实施。

    换言之,目前的杜威分类号中的斜线“/”只有一个含意:
    分隔简版号码与完整版号码
如338.6/42/091724,按现在的规则,就是338.6/42091724。

Library Hi Tech专辑:新一代OPAC

Library Hi Tech, Volume 27, Issue 1
Special Issue: Next generation OPACs

    《图书馆高技术》本专辑包括“新一代OPAC”文章12篇,实际因篇幅关系,其中4篇将在下期刊发。同时该刊正为同一主题的下一个专辑征稿,内容是新一代OPAC的实施与实验。看来“新一代OPAC”还真是热闹非凡。

    专辑编辑Bradford Lee Eden在引论(Introduction) 中对专辑文章做了介绍:
    很多图书馆已经用Web2.0技术对笨重的厂商OPAC进行改头换面或重组,或者通过面貌一新的前端应用,或者集成FRBR功能的后端软件,或者通过整合用户熟知的社会网络工具。新一代OPAC解决方案结合有私有或开源软件,基于OPAC中原有结构化元数据,形成多重浏览、更多社会网络选择及更多Web2.0工具如二维及三维信息可视化。某些馆结合新的开源或免费OPAC如LibraryThing,或者实施编程脚本、重新设计提问,达到更方便简易的访问与检索。

The VuFind implementation at Villanova University / John Houser (pp. 93-105)
Implementing VuFind as an alternative to Voyager’s WebVoyage interface: One library’s experience / Birong Ho, Keith Kelley, Scott Garrison (pp. 82-92)
    VuFind被称为目前最令人感兴趣的开源发现工具之一。前文介绍VuFind在维拉诺瓦大学的实施,特别强调图书馆上层管理者支持的重要性。后文则调查了西密歇根大学实施VuFind的情况,介绍用开源软件代替原目录界面的经验。

Project Blacklight: a next generation library catalog at a first generation university / Elizabeth (Bess) Sadler (pp. 57-67)
    介绍佛吉尼亚大学的黑光计划,是使用Web2.0的又一个开源OPAC技术实例,黑光计划在某种方面对开发VuFind软件有所帮助。

The new cooperative cataloging / Tom Steele (pp. 68-77)
    讨论标签或大众分类法,考察了LibraryThingPennTags

Subjecting the catalog to tagging / Luiz H. Mendes, Jennie Qui?onez-Skinner, Danielle Skaggs (pp. 30-41)
LibraryThing for libraries at Claremont / Jezmynne Westcott, Alexandra Chappell, Candace Lebel (pp. 78-81)
    前文结合学术图书馆中实施LibraryThing for Libraries (LTFL),考察社会标签,分析了加州大学北岭分校的Oviatt图书馆OPAC中的使用数据。
    后文则描述了克莱蒙大学图书馆实施LTFL的情况。

Making the new OPAC seamless: dealing with the transition from “finding” to “getting” /
Carmel Denholm, Leto Kauler, Jan Lavelle, Lloyd Sokvitne (pp. 13-29)
    澳大利亚的塔斯马尼亚州立图书馆实施TALISPlus新一代OPAC的情况。

Accessing information in a parliamentary environment: is the OPAC dead? / Roxanne Missingham, Rina Brettell, Shirley White, Sarah Miskin (pp. 42-56)
    讨论新检索系统ParlInfo的数据及用户分析,这是为澳大利亚议会开发的,2008年9月发布。

未发的4篇是:
墨西哥的蒙特雷伊科技大学图书馆在其OPAC中实施Drupal及其他用户工具。
休斯顿医学科学院德州医学中心(HAM-TMC)图书馆讨论创建与实施新一代工具与服务。
改进LC的Z39.50服务器功能,安装YAZ代理以过滤并解决有问题的Z39.50请求,支持检索XML记录。
解释基于语义的提问重写,以及FRBR作品实体组成,如何改善中介元搜索环境的行为。并讨论了一些开源工具,如meta-Composer,Semantic Access Point Network (SAPN)技术,及pazpar.

参见:
开源OPAC发布:VuFind (2007-07-23)
SEOmoz的Web2.0奖 & 我用的获奖网站 (2008-08-18)
再看国外流行的开源软件──第三届梅隆技术协作奖 (2008-12-11)
耶鲁大学的VuFind使用调查 (2008-12-15)

Blacklight:佛吉尼亚大学的开源OPAC (2008-03-03)

在OPAC中嵌入LibraryThing提供的相关链接 (2007-04-10)
把图书馆2.0带入你的目录:LibraryThing for Libraries有了第一个用户 (2007-5-15)