读《书山蠹语》

周二在北京参加“资源描述国家标准项目启动会”,蒙顾犇博士送他刚出版的《书山蠹语》。回到上海后,两个晚上看完了这本博客书。虽说一直订着新浪的“书蠹精”博客,书中大部分内容应该都曾看过,不过重读博文还是很有兴味,有的还能回想起自己当年初读时的感受。顾主任交游广泛,书中提及的人不少,本人也有幸出现多次。

本书大致上按与本职工作密切程度编排,因为自己不是国图员工,所以第一部分看得比较沉闷(同时也与自己身体状况欠佳有关)。之后的内容读起来就比较有感觉了。看得最投入的是第五部分“生活体验”中的“故乡”和“美食”。顾主任所记录的美食,大多是故乡的美食,也是最令我深有同感的美味。印象中自己第一次在“书蠹精”博客留言,就是跟他探讨某种食物。家乡的美味最难忘,本月中旬政法大学欧阳馆长来沪参加中美法律信息与图书馆论坛,说是原籍上海的婆婆要她带泰康黄牌辣酱油回京,这该是怎样的一种思念呀。本书中也多次提到这个辣酱油。

当然,对我来说,最有专业价值的是第二部分“心得”中的“编目工作”、“国际交流”和“业界合作”,尤其是顾主任分享的参与国际编目界活动及相关标准制订工作,是绝无仅有的珍贵记录,对了解背景极有价值。

比较特别的是书中竟然有如此多的专业插图,大多在前一阵的“书蠹精”博客上有过介绍(韩盈老师插图介绍)。那幅“编目员是大厨”,我早已打算在下月的讲课中借用,注明出处、点明主角。

书山蠹语

豆瓣上的《书山蠹语

2012美国大学图书馆的新常态

在电脑桌面上看到《2012美国图书馆状况:美国图书馆协会报告》,《美国图书馆》杂志特辑,2012年4月出版,数据到2011年。下载后放了近一年,趁着寒假有空看看。报告中三次提到“新常态”(New Normal),二次是讲大学图书馆。以下为大学图书馆部分的摘译,以及──随想。

大学图书馆(p.28-33)
美国大学图书馆员及其在美国高等教育的同事继续航行于“新常态”中,其特点是停滞的预算、不可持续的支出、增长的学生入学率、减少的工作人员,高等教育证明其价值的压力,在2011-2012年有了新的紧迫性和重要性。一些激烈的报告认为,高等教育机构学生的学习成果有限、学生“学术上漫无目的”、不努力,另一些则看到了“价值差距”,并质疑不惜任何代价进入任何一所大学是否值得。(p.28)
──美国也开始出现“读书无用论”,高等教育本身显现危机,大学图书馆自然有“皮之不存、毛将焉附”之虞

– 关键问题:学生信息素养(p.28)
认证委员会和高等教育机构都承认培养学生信息素养能力的重要性。在博物馆和图书馆服务研究所(IMLS)资助、大学和研究图书馆协会(ACRL)召开的全国峰会上,旨在找到新方法来帮助大学图书馆展示其价值,认证官员肯定了信息素养的重要性,以及馆员在发展学生批判性思维能力上的贡献。
ACRL调查发现,信息素养已经结合进学生学习成果:56%专科院校,44%本科院校,52%综合大学,43%授予博士/研究性大学。不同机构正开始信息素养评估相关工作(略),而ACRL于2011年发布了《高等教育图书馆标准》。[update 2012-2-2 参见:高等教育图书馆标准(ACRL)]
──面对潜在的危机,图书馆需要努力寻找证据来证明自己的有效性。

– 大学图书馆的作用是什么?(p.29)(来自Ithaka S+R Library Survey 2010: Insights from U.S. Academic Library Directors)
1、图书馆支持和便利教员教学活动
2、图书馆帮助本科生开发研究与信息素养能力
3、图书馆提供积极支持,帮助增加教员研究与学术的产出
4、图书馆为教员所需资源,支付从学术期刊到图书到电子数据库
5、图书馆作为资源库,换言之,存档、保存并追踪资源
6、图书馆作为教员研究定位信息的起点或网关
──以上是被调查者对6个问题的重要性排序结果,而不是被调查者提出图书馆有这些作用。问题有导向性,感觉有点像问“你幸福吗?”
──调查对象应该是教员。如果我们做调查的话,老师会在多大程度上有这种感觉?尤其是1和3。

– 大学图书馆拥抱变革(p.29)
在数字资源环境下,大学图书馆正致力于转换项目和服务,再利用空间、迁移馆藏、重新部署工作人员。最近的支出数据反映了图书馆正由管理印刷材料的历史作用,改变到对数字资源和服务的新需求。电子书开支……从2008年到2010年,经通胀调整后同比增长13%。电子期刊支出……同比增长近24%。印刷书籍(以及其他非期刊资料)开支下降了近22%……。
获取学术资源(包括期刊和数据库)的费用继续上升,许多人认为是不可持续的速度:图书馆订阅电子书、电子期刊和数据库的支出自2008年以来增长了23%……。毫不奇怪,ACRL最近的一项调查结果显示,在谷歌,亚马逊、维基百科和HathiTrust提供更容易获得和更丰富馆藏的环境中,行业面临的最大挑战是重新定义图书馆和图书馆员的角色
(p.30)另一方面,大学图书馆利用也在上升:入学增加推动图书馆大门[开放]自2008增加8.89%。尽管员工减少4.5%,更多图书馆扩大开放,64%每周开放60-99小时,15.2%每周开放100小时以上,比2008年增加了6%。
馆际互借2010年1.12千万件,比2008年增长1%。Presentations to groups(?)比2008年增加4.4%,涉及个人增加7.7%。其他电子服务急剧增加:40.8%提供文献电子化服务(高于2008年的35.7%),17.1%支持电子学位论文制作(高于2008年的13.3%),54.1%为残疾客户提供技术支持(高于2008年的48.8%)。
──员工减少、开放时间增加,我们也有同样趋势;文献电子化、帮助制作电子版学位论文,我们这里应该也有需求。

– 新作用、新责任
— 出版
最近一项调查中,半数已经或正在发展出版服务,以支持学术出版的变化。四分之三表明其出版期刊,半数正出版专著和/或会议录。提供的最通常服务包括数字典藏、作者版权咨询、数字化服务和研究数据管理。
— 数据保管 Data curation
资助机构如NSF和NIH现在有要求,推动基金资助研究项目中得到数据的开放获取。自2011年1月起,提交给NSF的申请必须有描述数据管理计划的简明补充文档。一些大学图书馆已经创立服务,帮助学校研究者遵从要求创建这样的计划,一旦获得数据后存档与共享;更多正准备“拥抱数据保管责任,以维持对学者的相关性与重要性”。

– 大学图书馆员工急剧减少 (p.31)
2010年秋3689个大学图书馆折合全日制(FTE)员工88943人,比2008年减少4.8%共4495个职位,其中大学FTE图书馆员26706,减少1.2%,馆员约占员工30%。与此同时,FTE学生入学增加7.3%,达到2.06千万。
2011年大学图书馆提供17.7%的职位给新毕业图书馆学研究生,高于2010年的11.5%。由于经济低迷,很多老馆员不退休,代际差异和冲突成为工作场所最突出的人事问题之一。
2010年,薪金支出占大学/研究图书馆所有支出的49.8%,高于2008年的49.3%。尽管ARL的平均薪金2010年增长仅1.5%,但相比CPI1.2%的增长还是好的。
– 大学薪金数据,2009-2010(表)
──最高的馆长平均近9.8万,最低的初入职馆员平均4.7万,二则相差1倍略多。

– 图书馆员关注立法
为了帮助塑造未来的高等教育,对于促进或阻碍其提供获取信息能力的法律,大学图书馆和图书馆员持续监测并大声说出,为创新铺平道路。2011年的重大利益问题包括:
— 扩大纳税人资助研究的公共访问
2011年4月,ACRl向NIH、美国健康和与人类服务部HHS、白宫科技政策办公室OSTP发信,支持对联邦资助研究的公共获取。这封庆祝NIH公共获取政策3周年的信,要求NIH缩短目前的限制[?],要求HHS和OSTP扩大公共获取政策到其他联邦机构。
12月,ALA和ACRL提交评论,回应OSTP发布的建议,确保长期的管理和广泛的公众获取在同行评审的学术刊物上发表的联邦政府资助科研成果。
— 谷歌图书搜索和解
为回应2011年3月提出的和解被驳回,图书馆版权联盟LCA(由ALA、ACRL和ARL组成)发布声明,称由于孤儿作品问题,对有兴趣进行大规模数字化项目的图书馆,版权法继续显现为重要障碍。LCA法律顾问为帮助图书馆界了解此案,发布了系列指南。
— 数字环境中获取信息
数字千年版权法案……停止联机盗版法案SOPA……研究工作法案…… [对法律一无所知如我,实在难以理解其中的博弈]
──专业协会逮着机会就发声

———附:《2012美国图书馆状况》目录———-
The 2012 state of America’s Libraries: a report from the American Library Association. American Libraries. Special issue, [2012].
Executive summary … 1
Introduction … 5
Public libraries … 9
New focus on ebooks … 17
School libraries … 22
Academic libraries … 28
Social networking … 34
Library construction and renovation … 39
Outreach and diversity … 42
Washington scene … 46
Intellectual freedom … 53
Sources … 58 [按章列举的参考文献,特别适合做上述各专题研究]
Feedback and contact information … 66

《大数据时代》笔记

《大数据时代:生活、工作与思维的大变革》(英)维克托·迈尔-舍恩伯格,肯尼思·库克耶著;盛杨燕,周涛译. 浙江人民出版社,2013.1. ISBN 978-7-213-05254-5

预测,大数据的核心
01 更多:不是随机样本,而是所有数据
全数据模式,样本=总体
02 更杂:不是精确性,而是混杂性
允许不精确
03 更好:不是因果关系,而是相关关系
建立在相关关系分析法基础上的预测是大数据的核心
04 数据化:一切皆可“量化”
数据化,不是数字化
05 价值:“取之不尽,用之不竭”的数据创新
数据创新1:数据的再利用
数据创新2:重组数据
数据创新3:可扩展数据
数据创新4:数据的折旧值
数据创新5:数据废气
数据创新6:开放数据
06 角色定位: 数据、技术与思维的三足鼎立
专家的消亡与数据科学家的崛起
07 风险:让数据主宰一切的隐忧
08 掌控:自由与责任并举的数据管理

———-乱弹———-
看到“混乱,简单地说就是随着数据的增加,错误率也会相应增加”,“混乱还可以指格式的不一致性,因为要达到格式一致,就需要在进行数据处理之前仔细地清洗数据,而这在大数据背景下很难做到”(p.47-48),特别欣慰──每次做馆藏利用统计时,看到乱七八糟的原始数据,特别无奈。现在,放心了,因为“执迷于精确性是信息缺乏时代的模拟时代的产物”(p.55)。
———-思考———-
已有数据如何利用之外,如何采集与利用“数据废气”
数据废气“是用户在线交互的副产品,包括浏览了哪些页面、停留了多久、鼠标光标停留的位置、输入了什么信息等。许多公司因此对系统进行了设计,使自己能够得到数据废气并循环利用,以改善现有的服务或开发新服务”(p.146)。
复旦图书馆的电子资源利用统计就是采用此法