不列颠图书馆在回溯转换和积压清理中采用FAST与简版DDC

年初不列颠图书馆(BL)就采用FAST代替LCSH、DDC简版代替完整版在网上征求意见(不列颠图书馆考虑采用FAST和简版DDC)。问卷包括3条建议,以及1对该建议的总体态度、2建议对自身工作与3对使用BL元数据的影响:
建议1:有选择地采用FAST,扩展当前和遗留内容的主题标引范围
建议2:在所有当前编目中实施FAST、取代LCSH,为减轻上述风险,尤其是可持续性
建议3:有选择地实施简版DDC,扩展当前和遗留内容的主题标引范围

上月BL公布了问卷结果:
Response to the consultation on Subject Standards (2016-07-18)
via British Library > Collection Metadata > News

60个回复者中33个说明了国别,其中21个来自英国(占2/3),剩下为美国6个、爱尔兰3个、比利时/加拿大/新西兰各1个。
问卷采用5级评价,其中总体评价结果如下:
建议1(扩展用FAST):很负面13、负面10、中立15、正面16、很正面6
建议2(FAST替代LCSH):很负面23、负面11、中立11、正面12、很正面2
建议3(扩展用DDC):很负面10、负面11、中立25、正面8、很正面5

除了数字,还有回复者对3个问题的看法。总体上对建议的负面评价居多,尤其是建议2用FAST取代LCSH。而对DDC中立居多,主要原因或许是不少回复者并不使用DDC。
回复中最详细文字是牛津大学对FAST存在问题的长篇看法。回复称,“我们欢迎简化主题标目系统,但非常关注FAST的当前状态及未来可能的发展。两者结合,导致我们对上述问题持“非常负面”的回答”。接着提出2个要点:1、FAST可能提供不可靠的搭配;2、FAST没有覆盖LCSH/LCNAF(名称规范档)主题系统。并报告了9个方面的问题,包括与OCLC的FAST团队沟通过的内容。

文件报告的BL下一步工作:
FAST:FAST正用于经选择的回溯转换和积压清理项目,以及某些原生数字资源。希望这不会对我们元数据和目录的用户有任何负面影响,因为不然的话不会对这些资源提供主题标引。
我们将测试以评估FAST相对于LCSH的有效性与质量,测试将包括比较时间与行动、可检索性研究。将于2016年8月报告结果。
DDC:考虑到当前产品与服务,本馆没有计划改变应用完整版DDC。
对于没有任何分类号的资源,包括遗留数据和未编目资源,我们看到回溯应用中简略DDC在改进发现与其他服务的机会。我们也会应用简略DDC到目前未提供DDC的现有内容流程。希望这不会对我们元数据服务的用户有任何负面影响。
总体上,我们发现简略DDC当前没有提供我们需要的效率,但正通过EThOS服务成功应用于英国学位论文。

BL对FAST的评估结果将会在其官网等发布。如果要研究FAST,牛津大学所提出的9个方面的问题以及BL将发布的报告,是必须关注的内容。

Thema:全球书业主题分类标准

看到百道网上译文图书分类新标准Thema正在走向世界(作者:霍华德·威洛斯;蒋雪瑶 编译 时间:2015年12月25日),似乎Thema已然是全球书业的主题分类标准了。目前是2014年11月发布的1.1版,2016年春将发布1.2版。
如ONIX一样,Thema由欧洲的EDItEUR主导开发,主要目的是在共享书目数据时不必在不同分类标准间相互映射。按文中说法,已有英语、德语、挪威语、瑞典语、阿拉伯语、丹麦语、西班牙语、法语、意大利语、日语、波兰语和俄语,即将有希腊语、土耳其语和中文版。美国的鲍克公司等也已采用,似乎在北美广泛使用也只是时间问题了。
到官网(Thema – the subject category scheme for a global book trade)下载了1.1版的代码表。共20大类,类号由1-4位字母加1-2位数字组成,如:
GL:Library & information sciences / Museology(图书馆和信息科学/博物馆学)
AKLC1:Graphic novel & Manga artwork(A艺术类,不知道与X类绘本和漫画有什么不同)
曾经有美国图书馆放弃DDC采用BISAC,未来会有图书馆改用Thema么?只是字母排序似乎不大方便。

——— Thema分类大纲及复分表(6个) ———
A:The Arts 艺术
C:Language & Linguistics 语言和语言学
D:Biography, Literature & Literary studies 传记,文学和文学研究
F:Fiction & Related items 小说及相关
G:Reference, Information & Interdisciplinary subjects 参考资料、信息和交叉学科
J:Society & Social Sciences 社会和社会科学
K:Economics, Finance, Business & Management 经济、金融、商业和管理
L:Law 法律
M:Medicine & Nursing 医学和护理
N:History & Archaeology 历史和考古
P:Mathematics & Science 数学和科学
Q:Philosophy & Religion 哲学和宗教
R:Earth Sciences, Geography, Environment, Planning 地球科学、地理、环境、规划
S:Sports & Active outdoor recreation 运动和户外娱乐
T:Technology, Engineering, Agriculture 技术、工程和农业
U:Computing & Information Technology 计算机和信息技术
V:Health, Relationships & Personal development 健康、人际关系和个人发展
W:Lifestyle, Hobbies & Leisure 生活方式、爱好和休闲
X:Graphic novels, Comic books, Cartoons 绘本、漫画、卡通
Y:Children’s, Teenage & Educational 儿童、青少年、教育

限定表(复分)
1:Geographical qualifiers 地理限定【地理复分表】
地理表对我们来说是个敏感地带。目前中国仅列出以下5个代码:
1FPC 中国;1FPCH 香港;1FPCM 澳门;1FPCT 西藏;1FPCW 台湾
代码构成没有什么问题,后4个看上去都是中国的下位类。但如果中国要如其他国家代码那样,按行政区划进一步细分的话,西藏代码显然不合适。相信国内参与机构会注意到这个问题,需尽早更新。
2:Language qualifiers 语言限定
还是关注涉及中文部分。目前汉语列出以下6个代码:
2GDC:Chinese 汉语;2GDCC:Cantonese 粤语;2GDCK:Hokkien 福建话/闽南话;2GDCM:Mandarin 普通话;2GDCW:Wu 吴语;2GDCY:Amoy 厦门话(不知道厦门话和Hokkien有什么差别)
3:Time period qualifiers 时期限定【时代复分表】(需要弄个中国时代表进去)
4:Educational purpose qualifiers 教育用途限定(如,4LEF:TOEFL)
5:Interest qualifiers 兴趣限定(如,5HCC:Chinese New Year 春节)
6:Style qualifiers 风格限定(如,6PD:Postmodernism 后现代主义)

第三届剑桥图书馆馆员活动日摘记

昨天(2014.1.6)在徐家汇上海交通大学参加剑桥大学出版社召开的第三届剑桥图书馆馆员活动日,据介绍前两届分别在台湾和香港召开。说是活动日,其实就是会议听报告,并无其他活动。会议主题“蜕变:为不断发展的学术界打造全新的图书馆”,听说相同活动近日在北京还将有一场。

剑桥大学出版社西蒙·罗斯(Simon Ross)把开幕致词变成了半个报告,题为“学术出版,路在何方”,谈该社应对市场环境变化的一些设想。一开始放了几个对照图,显示全球各地图书馆经费情况,除亚太地区在增长,其他地区都持平甚至下降,不免令我想到竹帛斋主最近吐槽数据库商涨价(“十问数据库商!!!”)。我以为,成本+预期收益=售价,其他地区因图书馆预算下降而售价无法与CPI同比提高,导致数据库商预期收益下降,此时亚太地区图书馆预算未受影响,数据库商为维持整体收益,自然对本地区有较高期望——说到底,就是数据库商觉得你有钱!真从经费统计上看不增长乃至下降了,数据库商自然无法再狮子大开口。

回到正题。除两个与该社合作出版的期刊广告外,会上共有6个报告,加上开幕致词,我总结热点为4个关键词:
开放获取(OA)、开放课程(MOOC)、发现系统、电子书
——最近MOOC大热,对于图书馆如何融入在线教育环境或在其中发挥作用,无论是此次会议还是其他地方,我都还未获知任何有启发的看法。

个人印象最深的是丹佛大学图书馆学术交流与馆藏服务副馆长Michael Levine-Clark分别在上下午的二个报告,分别是关于发现系统和电子书的大规模统计,做得相当细致,其方法值得借鉴,收到PPT后待详看:
1、Discovery or not? A major longitudinal study of the effect of web-scale discovery systems on online journal usage(发现与否?网络规模发现系统对在线期刊使用的影响的重要纵向研究)
这个由多所大学合作的项目,针对4家最流行的发现系统,试图研究使用发现系统是否对电子期刊的使用存在影响。每家发现系统选6所共24所图书馆(其中20所美国,英国、澳大利亚、加拿大、新西兰各1所),对于来自6家出版商的有完整24个月(实施前后各一年、以学期为界)counter数据的期刊进行使用对比,排除异常值(偏离较高的100多个),对数据进行统计分析:到底是图书馆、出版商还是发现系统对使用造成了影响?
有一个结论很有意思:发现系统对不同出版商影响不同,有的期刊在使用发现系统后使用反而下降
2、E-books’ impact on print(电子书对纸本图书的影响)
首先介绍丹佛大学5年中纸书购买下降50%,电子书中非永久性的也在增长(即重使用、轻收藏,或曰access vs ownership问题)。三类电子书采购方式:1、直接(单本、打包);2、永久,订购(打包);3、需要驱动采购DDA(无授权、STL、购买)。
调查针对丹佛大学图书馆购买的杜克大学出版社2008年的电子书,同时也购买纸本,在2009-2012每年年底统计使用。当然两种“使用”含义是不同的:纸书按借次,不同读者借期不同、借后实际使用不明;而电子书计算每次访问。
从统计观察到现象的一些推测:电子书会促进纸书的使用,反之不然;有些品种电子书和纸书利用均高,说明内容比形式重要。
[对电子书促进纸书使用的联想:常听某些读书人说,看了电子书后觉得不错,就下单买纸书了,大概是同样效应吧]

对我来说,此次参会的一个重要原因是想听上交大李芳的“电子资源自动分类专家系统的设计与实现”,也是她国家社科基金课题“中外分类知识组织体系互操作实证研究”的成果吧。这是我一直关注的基于统计的杜威十进分类法(DDC)与中图法(CLC)对照系统,以前上海图书馆也曾介绍过类似系统,目的是由CLC号给出DDC号,为中文编目数据提交WorldCat用;上交大系统则反之,目的是根据外文电子资源记录中的DDC号给出CLC号。
报告介绍了系统从数据清理、统计计数到数据匹配的过程,以及引入LCSH与CLC相关度计算辅助定类等方法,据评估测试,三级类可完成75%。未来希望实现DDC与CLC的双向映射。
目前系统可由MARC和Excel两种格式输入后输出。系统与商业公司合作,看来是要卖钱的,但在编目日益弱化的情形下,图书馆的需求应该不会太大,外包公司或可以考虑。

另:会议资料除剑桥大学出版社广告外,还有一份Linda Bennett的元数据介绍(Metadata: some brief notes),与会议主题没有太多关系(与发现系统略相关),与我的兴趣倒有些相关——但对元数据的理解与我的不尽一致。Bennett女士的头衔是Library Consultant,主持会议最后阶段的专题讨论,从会议日程资料看似乎是本次会议的策划人。
对于Library Consultant,联想到现任JSC主席Gordon Dunsire、元数据领域的Karen Coyle、图书馆自动化领域的Marshall Breeding等目前也是这种身份,不免好奇这个职业的存在,至少在中国是没有的。什么图书馆会向他们咨询呢?查了下Karen Coyle的联系页面,发现她明码标价着:咨询费每小时100美元,外出报告每场1500美元加旅行费。