OCLC关于MARC的最新报告

Implications of MARC Tag Usage on Library Metadata Practices / Karen Smith-Yoshimura … Dublin, Ohio : OCLC, March 2010. 72 p. ISBN: 1-55653-378-0 (978-1-55653-378-5)
PDF下载 (778KB):http://www.oclc.org/research/publications/library/2010/2010-06.pdf

OCLC近年大量发布研究报告,才3月中旬,关于MARC的这份报告编号已是2010-06。
本报告是OCLC研究部活动“搜集证据说明MARC元数据实践需要改变”的成果,由RLG Partnership MARC Tag Usage Working Group在2008-2009年研究完成。2009年9月OCLC曾发布报告《联机目录:用户和馆员需要什么》,本报告是其延续。与其他OCLC报告不同的是,本报告由五个独立论题组成,每个论题由不同人撰写。[以下方括号中为本人观点]

1. Requirements for Enhanced Library Data Mining
OCLC首席科学家研究部Timothy J. Dickey撰写的报告引论,强调需要强化图书馆数据挖掘。[这也是OCLC近年来一直在做的事]

2. MARC Tag Usage in WorldCat
OCLC研究部的Karen Smith-Yoshimura分析2009年9月时,WorldCat数据库中1.45亿条书目记录中MARC 21字段的出现情况。[记得某大牛曾说过我很认同的话,不能根据现有记录中MARC使用情况,确定用户需要什么,决定未来用什么]

3. MARC Fields and Subfields Used in Machine Matching
剑桥大学的Hugh Taylor建立了五个集成数据库,即检索记录用的英国研究图书馆联合目录(RLUK)、COPAC(由RLUK数据库衍生的公共联合目录)、WorldCat、前RLG联合目录及澳大利亚图书馆目录(Libraries Australia),分析进行记录匹配的MARC字段的使用,并与合作编目计划(PCC)的BIBCO与CONSER标准、OCLC编目级别3(简编)记录规定的必备字段进行比较。[机器处理是未来的重点,不仅有大量载入或上传判重需要的联合目录需要关心]

4. Comparison of Search Interfaces and Data Elements
澳大利亚国家图书馆的Catherine Argus分析了五个集成数据库的MARC索引字段,包括AMICUS(加拿大全国联合目录)、COPAC、澳大利亚图书馆目录(Libraries Australia)、WorldCat.org及OCLC的FirstSearch。[传统的检索系统中不是所有MARC字段都做索引]

5. Encoding Level and Tag Occurrences in WorldCat
明尼苏达大学的Chew Chiat Naun按不同的编目等级,分析了WorldCat记录中的MARC字段。[简化编目?]

6. Relator Terms and Form/Genre Designations in MARC Tagging
OCLC研究部的Timothy J. Dickey与纽约公共图书馆(NYPL)的Peter Hirsch合作,比较了NYPL本地目录与WorldCat中形式/类别指示词(655$a)及责任关系词(1xx/7xx$e)的使用。[这两方面有助于目录实现FRBR化。责任关系词在MARC 21实践中曾被舍弃但现在又想重拾]

报告最前部分照例是Executive Summary,除介绍五个论题外,点出研究的主要发现[很多已经是老生常谈了]。列举部分如下:
WorldCat中只使用很小的MARC 21字段子集
即使包括非书格式常用字段,出现在10%以上记录中的仅21-30个字段
在基于MARC数据元素对记录进行机器匹配时,大家各行其事
用于记录匹配的共同字段只有:头标5个元素,4个定长字段(008,010,020,022),核心书目数据(1XX,245,246,250,260)。
尽管机器匹配系统一般使用核心字段与子字段,但某些时候需要超过核心范围,以验证匹配的准确性
不可低估使用MARC数据进行匹配算法的复杂性。[做过匹配的机构如CALIS对此肯定深有体会]
一般图书馆检索系统仅对字段的一个子集做索引
许多与某一类型文献相关的字段,对检索可能很有用,但未被本研究中的主要图书馆系统索引。[这是编目员的悲哀]
附注字段常用,但机器不一定擅长解释文本内容
大量使用通用附注500…其他附注字段5XX相对用得少。[机器无法识别是关于什么的附注。当要提高效率、简化编目时,不区分5XX、改入500是最常见的]
用编目等级作为依据选择“最完整”记录全然不可靠
[很多时候原始编目就用一个模板,编目员并不根据记录完整性更改头标]
目前图书馆系统抓取的检索日志数据,通常不能对用户行为提供足够信息
许多系统不能提供用户的检索字段,以及结果是否满足其提问。[命中情况,命中后点击详细记录情况,最终借阅情况?]

Executive Summary的第二部分:对图书馆MARC元数据实践的意义。对目前的编目实践有指导意义,摘录部分如下:
√ 满足本地用户的需求。用户希望你花时间点图版数,还是链接到目次或全文?[人人都明白,但…]
√ 未来几年网上提供全文的文献数量将持续增加,对“描述性元数据”的需要将减少。应专注于全文关键词检索不会提供的规范名称、分类和控制词汇。
√ 使用合适的字段反映资源。对特定类型附注使用特定的MARC字段,而不是通用的500附注。[目前CNMARC在实践中做得比较好,MARC 21由于LC的示范作用未能践行]
√ MARC数据不仅用于用户检索与识别,还用于出版物的机器匹配、链接、机器操作、收割、内容分析、排序、系统视图。在使用关联数据利用其他来源生成的更完整描述及其他相关信息的环境中,机器匹配用字段的精确性正变得越来越重要。[参看前述机器匹配字段,未来机器利用数据是重点]

Executive Summary的第三部分:MARC’s Future? 2009年末与Nalsi合写了一篇MARC未来的文章(预计将于3月刊出),因而对此特别关注。本报告或者说工作组的观点已由标题中的那个问号显示,但未来仍不明朗:
√ MARC是特定领域的数据通讯格式,正接近其生命周期的终点。
[此句经典,值得原文抄录:MARC is a niche data communication format approaching the end of its life cycle.]
√ 未来的系统,如果能够在FRBR所述方法上满足用户需求,并利用新的RDA标准所设想的关联数据的优势,将需要更关联的方法存储数据。MARC不是解决办法。
√ 未来的编码方案需要有一个强大的MARC转换对照表,以摄入现有成百上千万记录。
√ 自问:如果我们不必使用MARC,如果我们不局限于以MARC为中心的图书馆系统,我们会如何创建、抓取、建构、存储、检索及显示对象与元数据?
√ 考虑如何最佳利用关联数据的优势,避免创建相同冗余元数据。考虑传统图书馆环境外的来源。
√ 与其强化MARC及基于MARC的系统,不如与其他编码方案和系统互操作。我们必须满足其他信息体产生的信息需求。

参见:
新闻报道:New Report, “Implications of MARC Tag Usage on Library Metadata Practices” (2010-3-12)
工作组活动主页:OCLC Research activity: Gather Evidence to Inform Changes Needed in MARC Metadata Practices

参见:OCLC报告——联机目录:用户和馆员需要什么 (2009-04-25)

update 2010-05-14
OCLC网络会议主页(Webinar)有3月17日关于此报告的网络会议音频及文字记录,报告的几位撰写者与会。

二维码及“图书馆与移动技术”报告下载

美国图书馆协会技术源博客(ALA TechSource Blog)前日发博文Annotating the real world (by Jason Griffey),倡导图书馆应用二维码,但并未举实例。想起一向领先的上图,去年在家谱展上应用过二维码。
昨日该博客再发一文,介绍Ellyssa Krosk在LTR《图书馆技术报告》2008年7月专题中也论及二维码(More on QR Codes in Ellyssa Kroski’s LTR / by Daniel A. Freeman)。博主说,作者真够领先的:Ellyssa was way ahead of the curve, exploring this topic in a Report that is still very relevant in 2010. 确实如此,该报告是移动图书馆的经典文献,附录“Quick-Response Barcodes”专论二维码。
博主还报告了一个好消息,该期LTR现正提供有限期的公开访问,有PDF及HTML二种格式。感兴趣者宜从速下载。

Library Technology Reports, Volume 44, Number 5 / July 2008
On the Move with the Mobile Web: Libraries and Mobile Technologies / by Ellyssa Kroski

附上图二维码应用介绍:一部手机搜遍上图藏书目录–3G时代手机图书馆的新体验

手机“二维码”技术助您获取族谱资料
2009年7月14日,在“寻根稽谱——上海图书馆藏家谱精品展”上二维条码技术服务正式向读者推出。此次展览采用入了IT技术,为读者获取展品信息、参与互动、搭设了平台。参观者可以利用任何一款拍照手机读取二维码,及时获取展品的信息介绍和照片,手机上不仅可以立刻显现出展品的相关信息,而且可以利用该链接定位到家谱网站,浏览丰富的家谱内容,相关展品的内容介绍等可以根据需要发送到读者指定的信箱。

[update 2010-3-14]
参见Keven对上图应用的介绍:
数图研究笔记:二维码应用一例 (2009-6-9)
http://www.kevenlw.name/archives/1320

未来五年影响校园的六大技术

    远洋过客在书社会介绍“2010 Horizon Report, 预告来年6大影响校园的技术领域”,这是由The New Media Consortium与EDUCAUSE Learning Initiative共同撰写的年度报告,每年提出在未来一至五年内会成为校园主流使用的6项新兴技术或实践。2010是第7年(2010 Horizon Report [PDF, 340 kb, 25p. ISBN 978-0-9825334-3-7])。

关键趋势 Key Trends
  通过互联网易于获取丰富的资源与关系,对于我们作为教育者的责任是一个持续的挑战
  人们期待能够随时随地工作、学习和研究
  我们使用的技术越来越基于云,我们的IT支持概念是去中心化
  学生的工作越来越具有协作性质,有越来越多各系之间的跨校园协作

严峻挑战 Critical Challenges
  学术的作用──以及我们为学生未来生活准备的道路──正在发生变化
  新的学术创作、出版与研究形式不断涌现,但适当的评估体系远远落后
  数字媒体能力(literacy)作为每个学科与专业的关键能力(skill),重要性日益上升
  在目前紧缩预算的经济环境下,机构越来越关注较狭窄的主要目标

技术观察 Technologies to Watch
短期(一年或更短)
  移动计算 Mobile Computing
  开放内容 Open Content
中期(二到三年)
  电子图书 Electronic Books
  简单增强现实 Simple Augmented Reality
远期(四到五年)
  基于手势的计算 Gesture-Based Computing
  可视数据分析 Visual Data Analysis

    报告主体是以上六大技术,每种技术均论述四个部分:概述、与教学或创新探索相关性、实践、进一步阅读。后两者提供链接及简介,可供进一步探索。

    在前几天博文“移动图书馆:设计开发移动网站要点”下,cc网友留言询问手机图书馆的前景。看此报告的“移动计算”部分及其提供的众多实例,当可解疑。
    报告中图书馆的例子是北卡州立大学的NCSU Libraries Mobile,有点意思的是Webcams──图书馆实景影像,如果国内也有,或可见排队抢座盛况。和前博介绍的Ball州立大学馆手机网站相同的是,有计算机空闲状态,看来到图书馆用计算机,在美国大学也很流行。介绍页面提供手机网站预览──此方式可借鉴,以前没看过这样的设计,其实很简单(不过如果网站用的是WML,就很痛苦了)。