编目与元数据2009

    Christine Schwartz总结了2009年编目与元数据方面的15个重要话题、报告及新服务。一些写过博文,一些关注过,还有一些竟然没有印象,正好恶补。以下为本人点评:

* OCLC record use policy
    WorldCat记录使用政策由于过份强调OCLC的利益,引起各方极大反弹,最终被迫撤回(Policy for Use and Transfer of WorldCat?Records)
参见:
圖書館觀點:關於「WorldCat書目記錄使用及轉出政策」(1st Apr 2009)
OCLC的云计算图书馆自动化系统 (2009-04-27)

* Google Books metadata problems
    Google图书的元数据问题也曾闹得沸沸扬扬,可Google说那数据是取来的,不是它OCR来的。
参见:
译言by Nalsi:Google能使用OCLC的数据么?能,但是……(译言暂时不能访问)
从Google图书搜索元数据错误说到数字化中元数据创建问题 (2009-09-16)

* Cooperative Cataloging Rules wiki
    RDA将替代AACR2,这需要对编目员进行培训。并且RDA将会发布为网络版,小馆在担心订价太高用不起。于是James Weinheimer倡导以维基方式编一个“合作编目规则”。
建在Google站点的Wiki:http://sites.google.com/site/opencatalogingrules/
建在Blogger的博客:http://coopcatwiki.blogspot.com/
(均需架梯访问)

* Linked data LCSH
    LCSH的官方版关联数据终于上线。
参见:关联数据:官方版与山寨版(DDC和LCSH)(2009-08-21)

* The Virtual International Authority File (VIAF)
    由若干国家图书馆与OCLC共同建设的虚拟国际规范档已有780万条记录,渐成气候。
参见:虚拟国际规范档XML格式 (2009-04-05)

* RDA publication delayed until 2010
    从2005年初宣布修订AACR2以来,已经五年了。开始名AACR3,计划2007年出版,后来改名RDA,计划2008年出版。RDA编制过程争议不断,出版一波三折,最新宣布2010年6月网络版发布
参见:RDA:20世纪的编目规则 (2007-01-23)

* biblios.net
* SkyRiver
    MARC数据提供领域的二个新军,不知会对图书馆MARC数据获取有多少影响。巧合的是两者的背景均为图书馆集成系统公司,前者是开源的Koha服务商LibLime,后者是INNOPAC/Millennium的Innovative。
参见:
数图研究笔记:面向未来的编目平台:biblios.net (一月 22nd, 2009)
Nalsi的西文编目笔记 II:关于Skyriver的几个note (2009-10-07) 关于Skyriver的note(二)(2009-10-15)

* OCLC’s Expert Community Experiment
    OCLC向得到授权的成员(即专家社区)开放WorldCat主记录维护。实验时间为2.15-8.15,共有1,690个机构参与,更新了108,766条记录。现已成为常态,自8月以来,每月更新数量在2万条左右。详见:Expert Community
参见:2009编目新进展 (2009-06-15)

* R2 Consulting’s report for LC on the MARC marketplace
    美国国会图书馆不想再承担MARC数据制作的主要责任了。可以说与书目控制未来工作小组报告一脉相承。
参见:Nalsi的西文编目笔记 II:国会图书馆北美MARC数据市场报告 (2009-10-31)

* Announcement of 2010 the year of cataloging research
    Allyson Carlyle的《编目与分类季刊》编语(Cataloging & Classification Quarterly, 47(8):687-690),宣布2010年为编目研究年。源自馆藏与技术服务协会的LC书目控制未来工作组报告实施专责组(ALCTS Implementation Task Group on the LCWG Report)。看来书目控制未来工作小组报告的影响正在持续。这是活动网站,可关注进展:2010 Year of Cataloging Research

* Thomas Mann’s report on the distinctiveness of the Library of Congress
    作为LC的雇员,托马斯·曼近年写了一系列质疑LC尤其是副馆长Marcum的长篇大论,发布在Library of Congress Professional Guild网站的编目未来版块(The Future of Cataloging)。最新一篇是2009年11月6日,(PDF, 30p) (竟然也要架梯了):
What is Distinctive about the Library of Congress In Both its Collections and its Means of Access to Them,
And
The Reasons LC Needs to Maintain Classified Shelving of Books Onsite,
And
A Way to Deal Effectively with the Problem of “Books on the Floor”

    好似LC也要放弃分类排架了
参见:让索书号见鬼去?美国国家医学图书馆停止提供克特号 (2009-12-23)

* Automatic metadata generation
    自动生成元数据(换言之取代人工编目)自然是热点,只不知这里所指为何。只找到前几年的:
《自动元数据生成应用项目最终报告》(Final Report for the AMeGA (Automatic Metadata Generation Applications) Project (PDF, 97p),2005年北卡州大学信息与图书馆学院Jane Greenberg等提交LC。
JISC Final Report: MetaTools – Investigating Metadata Generation Tools (pdf, 98p),英国JISC于2007.4.1-2008.10.31的元数据工具项目。

* Second draft issued: Functional Requirements for Subject Authority Data (FRSAD)
    在《规范数据的功能需求》(FRAD)于6月出版以后,《书目记录的功能需求》(FRBR)系列的最后一部《主题规范数据的功能需求》(FRSAD)也结束了草案的公示,问Marcia Zeng,明年能出版否?

* Judy Luther’s NISO/OCLC report on streamlining book metadata workflow
    《简化图书元数据工作流程》是Judy Luther为NISO和OCLC准备的白皮书。之前竟然错过了,补课中。
Streamlining Book Metadata Workflow / by Judy Luther. June 30, 2009. (PDF, 22p)

Via Cataloging and metadata: A year in review

[update 2010-04-13] 参见:简化图书元数据工作流程 (2010-01-03)

圣诞老人的名称规范

八十年代初,洋节还没有在上海流行。到八十年代中风气突变,自己也曾在圣诞夜跟同学去过衡山路的国际礼拜堂,装模做样地做了一次礼拜。还有一个圣诞夜玩过通宵,因为那个不是节假日,本地同学不回家,比元旦更适合迎新年活动。离开学校的同时成了家,不信教,再也不会在圣诞夜外出参加什么活动了。
初写博时曾写“中国人为什么过圣诞?”,那是应景杂文,以后再也不曾涉及。前几天看到WorldCat博客介绍圣诞老人的名称规范Searching for Santa,想着留到圣诞夜应景不错。

如2007年初所说的设想,现在WorldCat Identity已经有了虚拟人物的规范,下面就是圣诞老人的身份档页面:Santa Claus
有35种语言的2,434种作品、4,203个出版物,收藏馆282,961。
页面显示语言为中文的有28,但点击链接到WorldCat,却显示有63个结果,看来数据不同步。

相关人物(Related Identities)应该都是责任者。
相关链接(Useful Links)的LC规范记录,有交替名称Father Christmas,不知为何WorldCat Identity没有如个人名称那样提供交替名称。
相关主题(Associated Subjects)应该直接取自书目记录,电影、诗比较多,故事也不少。读者对象儿童为主不出意外,但听障者用的视频、电影也有不少,是不是弱智了点?
最奇怪的就是地点“纽约”(New York (State)–New
York)出奇地多,又不是圣诞老人的居住地?点击链接到WorldCat再次出错,因为主题检索su:不接受那两个短横。无论如何此处是需要改进的,或许两难,因为同名的缘故,从主题抽取地理位置如果没有前面的限定,就可能是另一个地点,有限定就要有标识──主题词间用破折号分隔是卡片年代的用法,在
MARC中用子字段分隔,在Web时代,要重新考虑。

参见:规范档2.0:WorldCat身份档 (2007-02-14)

另推荐OCLC的Andrew Pace的圣诞歌:Jingle Books

让索书号见鬼去?美国国家医学图书馆停止提供克特号

    12月21日,美国国家医学图书馆(NLM)宣布,将于2010年6月21日起停止为该馆编目的印刷图书给克特号。只有该馆参考部及医学史部的图书例外。作为国家图书馆,NLM与国会图书馆(LC)有些类似,其书目记录不只本馆使用,所以提前半年发通知,以便相关图书馆有充足时间应对。

    停止提供克特号的目的是提高编目效率。理由一是NLM本身早在15年前就已经不按索书号排架了,这么多年仍坚持提供克特号,只是为了方便其他使用NLM记录的图书馆。理由二是,对使用NLM的图书馆来说,由于索书号唯一性要求,即使NLM给了克特号,到本馆仍有可能需要做些调节才能避免重号。因此,NLM索性就省了提供克特号这件事了。

    NLM仍承诺提供分类号以反映图书的主题,因为认为分类信息有广泛的用途。

    目前大多数图书馆的索书号(即书标上的号码),由分类号+同类书区分号构成,方便读者在书架上自行浏览,有徜徉书海之感。多数馆用著者号做同类书区分号,少数馆采用种次号(流水号)。国外最流行的著者号就是各种版本的克特号(参见:克特著者号码表知多少?)。NLM一直采用的是3位克特号,与国内通用的相同。

    NLM馆内排架使用登到号已经15年,这是否意味着他们是闭架的?或者依赖OPAC查登到号,然后自己到书架取书,完全放弃开架书库的分类浏览功能?虽然还没有看到各方反应,但相信NLM的示范作用,对学术图书馆的潜在影响,将不亚于公共图书馆放弃杜威分类法(参见:杜威困境)。对西文来说,或许像大英图书馆外借部那样,直接按题名字顺排架更方便些(参见:远程存储二三事)。可惜汉字排序比较麻烦,不适合采用这种方法。

    看NLM排架规则Shelflisting Procedures for Monographs and Classed Serials,确定克特号占主要部分,是有点复杂。为了索书号(分类号+著者号)的唯一性,不论采用何种著者号,为了把同作者同类书排架贴邻,为了区分姓名相近作者同类书,编目员的确在索书号上要花不少精力,还常常会因一时疏漏,要到各书库去找出原书修改书标,花费的时间就更多。

    从提高工作效率角度,最简单而不影响目前排架方式的做法,就是放弃索书号的唯一性。很久以前就听某人说其馆索书号不唯一,但很少图书馆接受。现在开架书库能够做到全排并且不乱架的,不知有多少馆?反正做不到,索书号重号又何妨?如果是闭架书库,像NLM那样,用登到号排架最方便,还不用因库位预设不周而倒架。

    目前图书馆编目工作需要考虑的,不仅仅是外包。除了索书号、排架号,接下来还有什么是需要变革的?

via Catalogablog: Cuttering at the National Library of Medicine