虚拟国际规范档(VIAF)已由美国国会图书馆、法国国家图书馆、德国国家图书馆和OCLC共同建设多年,网站近日更新,才发现参加国多了瑞典,据称还有多个国家要参与。目前有780万条记录,合并自920万记录,这些合并处理,主要由OCLC承担。
目前页面有作品封面显示,看上去比较有亲和力。据OCLC首席科学家Thomas Hickey介绍,此次更新,是对SRU查询返回的XML数据,以XLS转换,可以显示为MARC 21格式和UNIMARC格式。据称在不久的将来,还会有linked data显示。
参见:
Outgoing:Changes to VIAF (April 03, 2009)
Lorcan Dempsey’s weblog:Virtual International Authority File (April 3, 2009)
附:虚拟国际规范档XML格式(以http://viaf.org/viaf/22146540为例)
<?xml version=”1.0″ ?>
<?xml-stylesheet type=”text/xsl” href=”/viaf/xsl/searchRetrieveResponse.xsl”?>
<ns2:VIAFCluster xmlns=”http://viaf.org/Domain/Cluster/terms#” xmlns:owl=”http://www.w3.org/2002/07/owl#”
xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:ns2=”http://viaf.org/Domain/Cluster/terms#”>
<! 规范数据来源,格式:来源馆代码|规范记录号 >
<ns2:sources>
<ns2:source>DNB|119012871</ns2:source>
<ns2:source>SELIBR|196381</ns2:source>
<ns2:source>LC|n 50001905</ns2:source>
<ns2:source>BNF|11917976</ns2:source>
</ns2:sources>
<! 记录长度,行数?>
<ns2:length>894</ns2:length>
<! 主标目,由各来源馆确定的共同主标目。此条正巧一致,否则如何确定?>
<ns2:mainHeadings>
<ns2:data>
<ns2:text>O’Brien, Flann, 1911-1966</ns2:text>
<ns2:sources>
<ns2:s>SELIBR</ns2:s>
<ns2:s>LC</ns2:s>
<ns2:s>BNF</ns2:s>
<ns2:s>DNB</ns2:s>
</ns2:sources>
</ns2:data>
<! 来源馆的主标目,采用MARCXML格式;有到其他来源馆记录的链接>
<ns2:mainHeadingEl>
<ns2:datafield ind1=”1″ ind2=” ” tag=”100″>
<ns2:subfield code=”a”>O’Brien, Flann</ns2:subfield>
<ns2:subfield code=”d”>1911-1966</ns2:subfield>
</ns2:datafield>
<ns2:sources>
<ns2:s>DNB</ns2:s>
</ns2:sources>
<ns2:id>http://orlabs.oclc.org/viaf/DNB|119012871</ns2:id>
<ns2:links>
<ns2:link>
<ns2:match type=”date”>
<ns2:birth>1911</ns2:birth>
<ns2:death>1966</ns2:death>
</ns2:match>http://orlabs.oclc.org/viaf/BNF|11917976
</ns2:link>
…
<ns2:links>
</ns2:mainHeadingEl>
…
<! 来源馆主标目:UMIMARC格式,只有法国国家图书馆采用,数据字段部分不同>
<ns2:mainHeadingEl>
<ns2:datafield ind1=” ” ind2=”|” tag=”200″>
<ns2:subfield code=”7″>ba0yba0y</ns2:subfield>
<ns2:subfield code=”8″>fre</ns2:subfield>
<ns2:subfield code=”9″>0</ns2:subfield>
<ns2:subfield code=”a”>O’Brien</ns2:subfield>
<ns2:subfield code=”b”>Flann</ns2:subfield>
<ns2:subfield code=”f”>1911-1966</ns2:subfield>
</ns2:datafield>
<ns2:sources>
<ns2:s>BNF</ns2:s>
</ns2:sources>
<ns2:id>http://orlabs.oclc.org/viaf/BNF|11917976</ns2:id>
<ns2:links>
…
</ns2:links>
</ns2:mainHeadingEl>
</ns2:mainHeadings>
<! 固定长字段,二种MARC格式应该是不同的吧,如何体现?>
<ns2:fixed>
<ns2:govtAgn>|</ns2:govtAgn>
<ns2:authRef>a</ns2:authRef>
<ns2:serUse>|</ns2:serUse>
<ns2:rules>|</ns2:rules>
<ns2:gender>u</ns2:gender>
<ns2:encLevel>n</ns2:encLevel>
<ns2:subjUse>a</ns2:subjUse>
<ns2:catLang>|</ns2:catLang>
<ns2:nameUse>a</ns2:nameUse>
<ns2:roman>|</ns2:roman>
<ns2:subType>|</ns2:subType>
<ns2:source>|</ns2:source>
<ns2:recStatus>n</ns2:recStatus>
<ns2:nameDiff>a</ns2:nameDiff>
<ns2:refStatus>|</ns2:refStatus>
<ns2:dateEntered>19920923</ns2:dateEntered>
<ns2:type>z</ns2:type>
<ns2:authStatus>a</ns2:authStatus>
<ns2:geoSubd>n</ns2:geoSubd>
</ns2:fixed>
<! 见参照,前一条是法国UNIMARC的,后一条是MARC21的,其实只有字段指示符不同>
<! 来源不同,即使同为MARC21,也做二条,即不重复sources>
<ns2:x400s>
<ns2:x400>
<ns2:datafield ind1=” ” ind2=”|” tag=”400″>
<ns2:subfield code=”a”>Copaleen, Myles</ns2:subfield>
<ns2:subfield code=”d”>1911-1966</ns2:subfield>
</ns2:datafield>
<ns2:sources>
<ns2:s>BNF</ns2:s>
</ns2:sources>
</ns2:x400>
…
<ns2:x400>
<ns2:datafield ind1=”1″ ind2=” ” tag=”400″>
<ns2:subfield code=”a”>Copaleen, Myles,</ns2:subfield>
<ns2:subfield code=”d”>1911-1966</ns2:subfield>
</ns2:datafield>
<ns2:sources>
<ns2:s>LC</ns2:s>
</ns2:sources>
</ns2:x400>
…
</ns2:x400s>
<! 参见参照>
<ns2:x500s>
<ns2:x500>
<ns2:datafield ind1=”0″ ind2=” ” tag=”500″>
<ns2:subfield code=”a”>Myles na Gopaleen,</ns2:subfield>
<ns2:subfield code=”d”>1911-1966</ns2:subfield>
</ns2:datafield>
<ns2:sources>
<ns2:s>SELIBR</ns2:s>
</ns2:sources>
</ns2:x500>
…
</ns2:x500s>
<! 作者的作品一览及收藏馆,count指版本数?>
<ns2:titles>
<ns2:data count=”25″>
<ns2:text>at swim two birds</ns2:text>
<ns2:sources>
<ns2:s>LC</ns2:s>
<ns2:s>BNF</ns2:s>
<ns2:s>DNB</ns2:s>
</ns2:sources>
</ns2:data>
…
</ns2:titles>
<! 作者作品出版社一览及收藏馆,count指版本数?>
<ns2:publishers>
<ns2:data count=”35″>
<ns2:text>suhrkamp</ns2:text>
<ns2:sources>
<ns2:s>DNB</ns2:s>
</ns2:sources>
&
lt;/ns2:data>
…
</ns2:publishers>
<! 作者生卒年>
<ns2:birthDate>1911</ns2:birthDate>
<ns2:deathDate>1966</ns2:deathDate>
<! 以下不明>
<ns2:dates max=”200″ min=”193″>
<ns2:date count=”3″ scaled=”1.58496250072″>193</ns2:date>
<ns2:date count=”0″ scaled=”0.0″>194</ns2:date>
<ns2:date count=”3″ scaled=”1.58496250072″>195</ns2:date>
<ns2:date count=”21″ scaled=”4.39231742278″>196</ns2:date>
<ns2:date count=”45″ scaled=”5.49185309633″>197</ns2:date>
<ns2:date count=”44″ scaled=”5.45943161864″>198</ns2:date>
<ns2:date count=”54″ scaled=”5.75488750216″>199</ns2:date>
<ns2:date count=”35″ scaled=”5.12928301694″>200</ns2:date>
</ns2:dates>
<! 作品ISBN一览及条数,count指版本数?德国不同版本ISBN重复较常见>
<ns2:ISBNs unique=”118″>
<ns2:data count=”9″>
<ns2:text>3518374869</ns2:text>
<ns2:sources>
<ns2:s>DNB</ns2:s>
</ns2:sources>
</ns2:data>
…
</ns2:ISBNs>
<! 作品封面吧>
<ns2:covers>
<ns2:data count=”1″>
<ns2:text>1564783286</ns2:text>
<ns2:sources>
<ns2:s>LC</ns2:s>
</ns2:sources>
</ns2:data>
</ns2:covers>
<! 应该是作品出版地,scaled不明>
<ns2:countries>
<ns2:data count=”25″ scaled=”5″>
<ns2:text>GB</ns2:text>
<ns2:sources>
<ns2:s>LC</ns2:s>
<ns2:s>BNF</ns2:s>
</ns2:sources>
</ns2:data>
…
</ns2:countries>
<! 作者所用语言及国籍>
<ns2:languageOfEntity>eng</ns2:languageOfEntity>
<ns2:nationalityOfEntity>IE</ns2:nationalityOfEntity>
<! VIAF处理情况及时间>
<ns2:history>
<ns2:ht recid=”BNF|11917976″ time=”2009-03-03 17:03:22″ type=”add”/>
<ns2:ht recid=”DNB|119012871″ time=”2009-03-03 17:03:29″ type=”add”/>
<ns2:ht recid=”LC|n 50001905″ time=”2009-03-03 17:03:29″ type=”add”/>
<ns2:ht recid=”SELIBR|196381″ time=”2009-03-03 17:03:42″ type=”add”/>
</ns2:history>
<! VIAF号>
<ns2:viafID>22146540</ns2:viafID>
</ns2:VIAFCluster>
谢谢编目老师,编目师是真正的学者啊
虽然现在最新的元数据标准及格式都与XML有密不可分的联系,但实际上国内各图书馆的编目人员有几个了解熟悉XML?不得不说是个很讽刺的事情
博主 对 hzh 的回复: 2009-05-11 09:07:17
编目员不是研究人员,一般只是生成元数据,而不是制作元数据标准,是否了解元数据的发布格式也不重要。就好象不懂2709格式,并不影响做编目一样。
另一方面,如果编目系统都转到XML格式了,那培训、教材都会加上相关内容的,到时也就都能知道个大概了。