OCLC报告——联机目录:用户和馆员需要什么

    Online Catalogs: What Users and Librarians Want : An OCLC Report /
Principal contributors, Karen Calhoun … [et al.]. Dublin, Ohio : OCLC
Online Computer Library Center, Inc., c2009. 58p. ISBN: 1-55653-411-6
(PDF下载)

    OCLC又发布了新的报告《联机目录:用户和馆员需要什么》。报告由主管WorldCat及元数据服务的副总裁Karen Calhoun领衔,基于对WorldCat用户的三个调查,以不同用户(最终用户与图书馆员)对目录数据质量的认识作为调查重点,并以此得出改善目录数据的建议。

三个调查
1、焦点小组(focus group) (p5):针对WorldCat.org,调查时间2008/5
 · 分3个小组、每组8人,分别是:18-24岁大学生组、25-59岁偶而检索者组、学者组(教员及研究生)
 · 执行三个任务(p.7):1)自己设计问题进行检索;2)指定图书检索;3)针对其兴趣或专业检索
 · 通过软件,抓取用户使用数据及标记信息(正面、负面及评论),并在检索结束后进行讨论。
    从用户样本看,比较偏向文科,在说明的职业(偶而检索组)或学科(学者组)中,只有一个来自计算机科学属于理科。
2、WorldCat.org弹出窗口调查(p7):调查时间2008/5/12-7/9
 · 封闭式问题25题、开放式问题1题。共收到回复11,152,回收率4%
 · 纳入统计分析的非馆员用户占68%,共7583人
    推算下来,在此期间用户点击详细记录的次数近28万;而我好象参加过一次调查,应该也在排除之列了。
3、图书馆调查(p9):调查时间2008/9/10-11/30
 · 面向以不同界面使用WorldCat的馆员,包括WorldCat.org、FirstSearch、Connexion和Z39.50(主要编目员用)及WorldCat Resource Sharing(馆际互借员工用)
 · 收到1,397个回复,分别任职馆长、公共服务/参考咨询、编目、采访及馆际互借。

    报告照例以数据说话,有很多图表。调查结果将用户对目录的要求分成两大方面,即传递(delivery)与发现(discovery),这也是OCLC副总裁Lorcan Dempsey一直以来对目录功能的区分。

调查结果
用户对数据质量的要求(p11)
 · 直接链接到联机内容
 · 评价性内容,如文摘、目次和片断
 · 相关检索结果
 · 馆藏可得性信息(是否可得、如何获得)
 · 简单关键词检索,附高级检索选项
馆员对数据质量的要求(p23)
 · 合并重复记录
 · 更正拼写错误
 · 升级简单记录
 · 评价性内容,如目次、文摘及封面
馆员与最终用户认识异同(p39)
    馆员总以为自己是代表最终用户利益的,但由于两者使用联机目录的目的并不一致,因而认识有差异也是可以想见的。下面右侧是其中的一个对比表(p44):

    结论有“元数据与内容”部分,提到用户强化需求中选择了“主题信息”,并不意味着他们需要更多的受控主题标目,而是指标准目录描述中没有的主题丰富的数据元素。受控主题词有多方面的用处:作为索引词,支持多语种主题检索,限定或扩检的分面浏览链接到分类法或其他术语表,决定相关排序的因素。为支持这些特性,现在的目录依赖劳动密集性工作产生受控主题标目。此种传统方法不具有可持续性,需要寻找更经济的手段,一如受控主题词表那样便利最终用户。(p52)
    后半段的陈述不能视为调查结果,而是作者的观点,即承认受控主题的优点,但尚未找到可替代的方法。

    由于本报告针对的是联合目录,其结论并不一定完全适合一般图书馆的联机目录(OPAC),但肯定有很多共通的部分。

Via Lorcan Dempsey’s weblog: QOTD: library catalogs and users (April 21, 2009)

关于信息查找行为的参考文献(p2):
Bates, Marcia J., “Improving user access to library catalog and portal information: final report,” prepared for the Library of Congress, 2003.
含信息寻找文献评价

Case, Donald O., Looking for information: a survey of research on information seeking, needs, and behavior (San Diego CA: Academic Press, 2002)
作者在书中指书(p6),许多研究关注信息源(如图书或报纸)与系统(如目录),而不关注信息用户的需要、动机与行为。

Foster, Nancy Fried, and Susan Gibbons, “Understanding faculty to improve content recruitment for institutional repositories”, D-Lib Magazine 11 (1) (2005)
本文首先将可用性专家的“工作实践”(work practice)方法应用于图书馆问题,研究教员的研究工作实践以识别学者可能如何使用机构库。

虚拟国际规范档XML格式

    虚拟国际规范档(VIAF)已由美国国会图书馆、法国国家图书馆、德国国家图书馆和OCLC共同建设多年,网站近日更新,才发现参加国多了瑞典,据称还有多个国家要参与。目前有780万条记录,合并自920万记录,这些合并处理,主要由OCLC承担。
    目前页面有作品封面显示,看上去比较有亲和力。据OCLC首席科学家Thomas Hickey介绍,此次更新,是对SRU查询返回的XML数据,以XLS转换,可以显示为MARC 21格式和UNIMARC格式。据称在不久的将来,还会有linked data显示。

参见:
Outgoing:Changes to VIAF (April 03, 2009)
Lorcan Dempsey’s weblog:Virtual International Authority File (April 3, 2009)

附:虚拟国际规范档XML格式(以http://viaf.org/viaf/22146540为例)

<?xml version=”1.0″ ?>
<?xml-stylesheet type=”text/xsl” href=”/viaf/xsl/searchRetrieveResponse.xsl”?>
<ns2:VIAFCluster xmlns=”http://viaf.org/Domain/Cluster/terms#” xmlns:owl=”http://www.w3.org/2002/07/owl#” 
xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:ns2=”http://viaf.org/Domain/Cluster/terms#”>

<! 规范数据来源,格式:来源馆代码|规范记录号 >
<ns2:sources>
  <ns2:source>DNB|119012871</ns2:source>
  <ns2:source>SELIBR|196381</ns2:source>
  <ns2:source>LC|n  50001905</ns2:source>
  <ns2:source>BNF|11917976</ns2:source>
</ns2:sources>

<! 记录长度,行数?>
<ns2:length>894</ns2:length>

<! 主标目,由各来源馆确定的共同主标目。此条正巧一致,否则如何确定?>
<ns2:mainHeadings>
  <ns2:data>
    <ns2:text>O’Brien, Flann, 1911-1966</ns2:text>
    <ns2:sources>
      <ns2:s>SELIBR</ns2:s>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

<! 来源馆的主标目,采用MARCXML格式;有到其他来源馆记录的链接>
  <ns2:mainHeadingEl>
    <ns2:datafield ind1=”1″ ind2=” ” tag=”100″>
      <ns2:subfield code=”a”>O’Brien, Flann</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
    <ns2:id>http://orlabs.oclc.org/viaf/DNB|119012871</ns2:id>
    <ns2:links>
      <ns2:link>
        <ns2:match type=”date”>
          <ns2:birth>1911</ns2:birth>
          <ns2:death>1966</ns2:death>
        </ns2:match>http://orlabs.oclc.org/viaf/BNF|11917976
      </ns2:link>

    <ns2:links>
  </ns2:mainHeadingEl>

<! 来源馆主标目:UMIMARC格式,只有法国国家图书馆采用,数据字段部分不同>
  <ns2:mainHeadingEl>
    <ns2:datafield ind1=” ” ind2=”|” tag=”200″>
      <ns2:subfield code=”7″>ba0yba0y</ns2:subfield>
      <ns2:subfield code=”8″>fre</ns2:subfield>
      <ns2:subfield code=”9″>0</ns2:subfield>
      <ns2:subfield code=”a”>O’Brien</ns2:subfield>
      <ns2:subfield code=”b”>Flann</ns2:subfield>
      <ns2:subfield code=”f”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
       <ns2:s>BNF</ns2:s>
    </ns2:sources>
    <ns2:id>http://orlabs.oclc.org/viaf/BNF|11917976</ns2:id>
    <ns2:links>

    </ns2:links>
  </ns2:mainHeadingEl>

</ns2:mainHeadings>

<! 固定长字段,二种MARC格式应该是不同的吧,如何体现?>
<ns2:fixed>
  <ns2:govtAgn>|</ns2:govtAgn>
  <ns2:authRef>a</ns2:authRef>
  <ns2:serUse>|</ns2:serUse>
  <ns2:rules>|</ns2:rules>
  <ns2:gender>u</ns2:gender>
  <ns2:encLevel>n</ns2:encLevel>
  <ns2:subjUse>a</ns2:subjUse>
  <ns2:catLang>|</ns2:catLang>
  <ns2:nameUse>a</ns2:nameUse>
  <ns2:roman>|</ns2:roman>
  <ns2:subType>|</ns2:subType>
  <ns2:source>|</ns2:source>
  <ns2:recStatus>n</ns2:recStatus>
  <ns2:nameDiff>a</ns2:nameDiff>
  <ns2:refStatus>|</ns2:refStatus>
  <ns2:dateEntered>19920923</ns2:dateEntered>
  <ns2:type>z</ns2:type>
  <ns2:authStatus>a</ns2:authStatus>
  <ns2:geoSubd>n</ns2:geoSubd>
</ns2:fixed>

<! 见参照,前一条是法国UNIMARC的,后一条是MARC21的,其实只有字段指示符不同>
<! 来源不同,即使同为MARC21,也做二条,即不重复sources>
<ns2:x400s>
  <ns2:x400>
    <ns2:datafield ind1=” ” ind2=”|” tag=”400″>
      <ns2:subfield code=”a”>Copaleen, Myles</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>BNF</ns2:s>
    </ns2:sources>
  </ns2:x400>

  <ns2:x400>
    <ns2:datafield ind1=”1″ ind2=” ” tag=”400″>
      <ns2:subfield code=”a”>Copaleen, Myles,</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
    </ns2:sources>
  </ns2:x400>

</ns2:x400s>

<! 参见参照>
<ns2:x500s>
  <ns2:x500>
    <ns2:datafield ind1=”0″ ind2=” ” tag=”500″>
      <ns2:subfield code=”a”>Myles na Gopaleen,</ns2:subfield>
      <ns2:subfield code=”d”>1911-1966</ns2:subfield>
    </ns2:datafield>
    <ns2:sources>
      <ns2:s>SELIBR</ns2:s>
    </ns2:sources>
  </ns2:x500>

</ns2:x500s>

<! 作者的作品一览及收藏馆,count指版本数?>
<ns2:titles>
  <ns2:data count=”25″>
    <ns2:text>at swim two birds</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:titles>

<! 作者作品出版社一览及收藏馆,count指版本数?>
<ns2:publishers>
  <ns2:data count=”35″>
    <ns2:text>suhrkamp</ns2:text>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  &

lt;/ns2:data>

</ns2:publishers>

<! 作者生卒年>
<ns2:birthDate>1911</ns2:birthDate>
<ns2:deathDate>1966</ns2:deathDate>

<! 以下不明>
<ns2:dates max=”200″ min=”193″>
  <ns2:date count=”3″ scaled=”1.58496250072″>193</ns2:date>
  <ns2:date count=”0″ scaled=”0.0″>194</ns2:date>
  <ns2:date count=”3″ scaled=”1.58496250072″>195</ns2:date>
  <ns2:date count=”21″ scaled=”4.39231742278″>196</ns2:date>
  <ns2:date count=”45″ scaled=”5.49185309633″>197</ns2:date>
  <ns2:date count=”44″ scaled=”5.45943161864″>198</ns2:date>
  <ns2:date count=”54″ scaled=”5.75488750216″>199</ns2:date>
  <ns2:date count=”35″ scaled=”5.12928301694″>200</ns2:date>
</ns2:dates>

<! 作品ISBN一览及条数,count指版本数?德国不同版本ISBN重复较常见>
<ns2:ISBNs unique=”118″>
  <ns2:data count=”9″>
    <ns2:text>3518374869</ns2:text>
    <ns2:sources>
      <ns2:s>DNB</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:ISBNs>

<! 作品封面吧>
<ns2:covers>
  <ns2:data count=”1″>
    <ns2:text>1564783286</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
    </ns2:sources>
  </ns2:data>
</ns2:covers>

<! 应该是作品出版地,scaled不明>
<ns2:countries>
  <ns2:data count=”25″ scaled=”5″>
    <ns2:text>GB</ns2:text>
    <ns2:sources>
      <ns2:s>LC</ns2:s>
      <ns2:s>BNF</ns2:s>
    </ns2:sources>
  </ns2:data>

</ns2:countries>

<! 作者所用语言及国籍>
<ns2:languageOfEntity>eng</ns2:languageOfEntity>
<ns2:nationalityOfEntity>IE</ns2:nationalityOfEntity>

<! VIAF处理情况及时间>
<ns2:history>
  <ns2:ht recid=”BNF|11917976″ time=”2009-03-03 17:03:22″ type=”add”/>
  <ns2:ht recid=”DNB|119012871″ time=”2009-03-03 17:03:29″ type=”add”/>
  <ns2:ht recid=”LC|n  50001905″ time=”2009-03-03 17:03:29″ type=”add”/>
  <ns2:ht recid=”SELIBR|196381″ time=”2009-03-03 17:03:42″ type=”add”/>
</ns2:history>

<! VIAF号>
<ns2:viafID>22146540</ns2:viafID>
</ns2:VIAFCluster>

杜威分类号中的斜线“/”

    杜威十进分类法(DDC)中是没有斜线“/”的,但书目记录中的DDC类号有不少带斜线的。前一阵有位网友曾在本博留言,问“/”的含意;这几天CALIS联合目录咨询中,又有同仁问同样的问题。可见对此迷惑的不在少数。

    以前我也同样迷惑不解。2005年3月,不知为何下了决心,要弄明白此问题。在美国国会图书馆网站上找到了十进分类法部主管Dennis McGovern的邮箱,举338.6/42/091724为例发邮件询问。不久收到回复,称“/”(正式名称segmentation marks),有两种含意:
    一表示简版号的结束(Abridged ed.)
    一表示标准复分号的开始
我的例子中的两个/正好分别是这两个意思。

    今天王绍平老师介绍了OCLC网站上的“Segmentation Marks in Dewey Numbers”(DDC现归OCLC旗下),表明LC已经不再用“/”(也称prime marks或slash marks)表示标准复分号的开始了。
    经由网站链接的博客025.431: The Dewey blog的博文Sweet segment solution (August 04, 2005),得知此决定由2005年9月1日起实施。

    换言之,目前的杜威分类号中的斜线“/”只有一个含意:
    分隔简版号码与完整版号码
如338.6/42/091724,按现在的规则,就是338.6/42091724。