Web化DDC·浏览LCSH

    图书馆界在知识组织方面的长期经验,在网络时代如何继续发挥作用?那就是别把自己的分类法、主题词表藏起来,而让大家都来采用,这才不至于被边缘化。这个观点keven在当年抱怨《中图法》电子版时就已经表达过了,他最近旧文重温,改名“情报检索语言脱胎换骨的六点议论”重发议论。
    keven因侯汉清老师在北大信管系建系六十年的学术报告而重提旧论。读研时,侯老师就是我的偶像,某个暑假侯老师到本校开PRECIS课,课程作业经侯老师指点后正式发表,还很让自己高兴了一阵。看了侯老师的“网络时代的情报检索语言:进展及热点”,认同keven所说“我知道侯老师以我的话为靶子,最终目的也是与我一致,就是把传统的图书馆对于知识信息的规范控制思想和方法,应用到数字资源和网络环境中去”。在PPT的最后发展趋势部分,专门论及检索语言的电子化与网络化,其中的数据是,网络版已达82.5%(367/445)。

    不过,网络版不等于开放。杜威十进分类法(DDC)网络版WebDewey已经出现很多年,但只限于注册用户使用。OCLC甚至还因为图书馆酒店用DDC的大类作房间号码而与之打知识产权官司。
    只是时代在发展,如今再固守版权,恐怕难逃被抛弃的命运。年中美国一家公共图书馆抛弃DDC,选用书店分类的新闻热闹一时,或许就是这种趋势的一种反应。而OCLC也正在试验开放的Web版DDC,有固定的URI,未来可能会用这样的形式引用DDC号码:
http://dewey.info/concept/333.7-333.9/

    与OCLC的主动相比,《美国国会图书馆标题表》(LCSH)则是被他人弄成了公开的网络版。近日德国布劳恩斯魏克大学图书馆的B. Eversberg在没有资助的情况下,做了“浏览LCSH”系统,数据来自allegro(http://www.allegro-c.de/)公司的“LCSH浏览”,含520万词条,有参照系统,据说是2006年以来的数据,大多是名称及名称/题名组合,所以并非完整版的LCSH。
    如系统说明所述,要查“法国女作家诗作评论”,很少人知道在LCSH中的确切用词,以及如何组合这些词(正式用词是:French poetry — Women authors — History and Criticism)。而现在,不但OCLC的联合目录WorldCat有LCSH,甚至Google图书搜索最近也开始加入LCSH。设计该系统的目的就是为方便不熟悉者查到LCSH的正式用词。
    系统提供多种查询浏览功能:词表正式用词、普通词组、单词、人名、题名。还有多途径的布尔检索功能。
    最有意思的是它并不是一个单一的LCSH浏览系统,还是一个实用的网络图书信息检索工具。点击正式用词后,右侧除有LSCH词条外,还有四个相关链接,都是使用LCSH的网上图书查询工具:
WorldCat(联合目录)
Google图书搜索
LibraryThing(个人网上图书馆)
OpenLibrary(开放内容联盟的维基型书目)

参见:
数图研究:谈谈我们的分类主题词表 (2005-11-24) http://blog.donews.com/kevenlw/archive/2005/11/24/638458.aspx
数图研究笔记:旧文重温:情报检索语言脱胎换骨的六点议论 http://www.dlresearch.cn/keven/index.php/archives/488

OCLC与图书馆酒店的故事:版权与商标 (2006-09-25) /posts/2006/0925/558#
游园惊梦:分类的命运 (2007-7-23) http://youyuan.wordpress.com/2007/07/22/%e5%88%86%e7%b1%bb%e7%9a%84%e5%91%bd%e8%bf%90/
Inquiring Librarian: Google Book Search and… LCSH? (http://inquiringlibrarian.blogspot.com/2007/10/google-book-search-and-lcsh.html)

Lorcan Dempsey’s weblog: Webified Dewey (http://orweblog.oclc.org/archives/001479.html)
Michael Panzer. Towards the “webification” of controlled subject vocabulary: A case study involving the Dewey Decimal Classification. 6th European NKOS Workshop, September 21, 2007, Budapest.(PPT下载

B. Eversberg. Browsing LCSH. (2007-10-04 / 2007-11-08) 

CASHL/CALIS & 日本旧忆·馆际互借

在日本图书馆参观与实习时,对他们的高校联合编目与馆际互借系统特别感兴趣。NACSIS(文部省学术情报中心,现为国立情报学研究所NII)是日本的高等教育文献保障系统,其联合目录NACSIS-CAT考虑到馆际互借方面的需求,馆藏信息包括期刊的卷期。馆际互借系统NACSIS-ILL会在收藏某刊的图书馆中,筛选出符合用户所需卷期的图书馆,供借入馆选择;借入馆可以同时选择多个提供馆,如果排在首位的馆不能提供,接下来会转到排在后面的其他馆。因此,如果需要馆际互借或文献传递,只要查联合目录,然后提交申请就可以一次搞定。
在研修结束时,要写一篇文章,当时选择的主题就是NACSIS-ILL。正巧需要参考某篇文章,所在的图书馆没有,于是亲身经历了一次文献传递。周一通过图书馆发出需求,中间隔了一个法定休息日,周四图书馆收到复印的纸本。图书馆通知我到邮局付费,然后凭邮局付费收据取纸本。如此迅速就得到了原文,自己感觉相当满意。

最近想看几篇文章,馆里没有,于是开始亲身体验CASHL的文献传递服务。可以自己直接在网上提交文献传递需求,email收到原文后网上划转费用,与十年前的日本经历相比,感觉上会好很多。可惜事情并不像想象的那样顺当。
在10月30日给XX大学提交了二份申请,11月1日收到一个回复,主题是“因该刊被借出而无法提供服务”,内含一份申请信息。因为不熟悉CASHL的服务规定,又傻傻地等另一篇而无结果,今天(11月5日)才想到登录去看,结果“事务状态”都是“服务不能被提供”,知道白等了。两份申请虽然是同一期刊,但是年份、卷次不同,难道都出借了?都出借也应该发两个通知,或者在一个通知中告知两份都无法提供服务才对呀。
首次申请没有收到,文章还是要的。这时就看出CASHL系统设计中的问题了,1、系统没有将申请自动转向另一个馆的功能;2、系统也不提供手动更换图书馆重新申请的功能,原来的请求作废,要申请还得从刊名检索开始,一切从头再来!真是又费时、又费事。

又想到CALIS联合目录。最初看到的联合目录设计中曾包括期刊的馆藏卷期信息,可最终实施时却去掉了。所以CALIS的联合目录无法用于期刊的文献传递,同属CALIS系统的CASHL文献传递就需要另建文献信息库。虽然强化了期刊目次信息,可省掉用户输入引文信息的麻烦,但实际造成了成员馆需要同时维护两个联合目录。从本馆以往的情况看,不准确的书目信息是造成文献传递未能满足的重要原因。
以现在的技术,如果CALIS联合目录包含期刊馆藏信息,CASHL直接采用CALIS联合目录的书目与馆藏信息,同时嵌入期刊目次信息,也是不难实现的。

技术发展了,但设计并没有做到人性化。要实现“无缝的用户体验”,还需要系统的设计者也做几次用户。

IFLA的“数字对象元数据工作组”

    为应对日益增加的数字出版物的编目工作,国际图联编目组在2005年成立了“数字文本文献书目标准工作组”(Working Group on a Bibliographic Standard for Digital Text Documents),2006年该工作组改名“数字文本文献书目建议工作组”(Working Group on Bibliographic Recommendations for Digital Text Documents),2007年再次改为“数字对象元数据工作组”(Working Group on Metadata for Digital Objects)。工作组计划在2008年IFLA加拿大魁北克年会前提交最终报告,作为编目指导委员会在年会上的一项活动。
    名称的不断更改,体现着工作组应对形势变化而对工作目标的改变:1、从文本型数字对象扩大到任意数字对象;2,从狭义的书目扩大到广义的元数据(也从图书馆扩大到了更广阔的领域);3、从强势的标准转为较温和的建议、指南。真是一年一个样,三年大变样。

工作组主要任务(Charge)
    为需要创建、共享与管理元数据者推荐一份指南,包括元素、工具、格式、协议。
基于以下原则开展工作:该指南是高层次的指南,意即[方括号后为本人理解]:
* 应当作为语义映射的轴心(a pivot for semantic mapping),也即作为一部数据元素词典,不同的社区可以映射他们自己的书目数据集
* 应当作为关于如何在文本文件中处理书目数据的指南[应当是纯文本数据]
* 不应当预设任何特定的标记系统[MARC也罢、XML也罢],但
* 应当作为一个针对可能采用的不同标记系统的模型,并且
* 应当适用于最通用的文本编辑程序
* 应当定义一个属性集,包括如语言、字体、大写规则等(language, script, capitalisation practice)[?],以方便进一步处理

    小组已经召开了三次会议,但没有关于这份指南的更详细信息,可能要到2008年3月第四次会议以后,才能看到草案。

    目前小组成员均来自欧洲:丹麦(主席)、法国、瑞典、荷兰、挪威。2006年时还有一位代表IT组的中国人(张智雄),据称由于未提出任何建议而不再作为成员。

参见:
IFLA. Cataloguing Section. Working Group on Metadata for Digital Objects

第一次会议:2006/8/23,韩国首尔第72届IFLA年会期间(会议报告
第二次会议:2007/2,丹麦哥本哈根(?)
第三次会议:2007/8,南非德班第73届IFLA年会期间(会议报告
第四次会议:2008/3/17-19,法国巴黎