《大数据时代》笔记

《大数据时代:生活、工作与思维的大变革》(英)维克托·迈尔-舍恩伯格,肯尼思·库克耶著;盛杨燕,周涛译. 浙江人民出版社,2013.1. ISBN 978-7-213-05254-5

预测,大数据的核心
01 更多:不是随机样本,而是所有数据
全数据模式,样本=总体
02 更杂:不是精确性,而是混杂性
允许不精确
03 更好:不是因果关系,而是相关关系
建立在相关关系分析法基础上的预测是大数据的核心
04 数据化:一切皆可“量化”
数据化,不是数字化
05 价值:“取之不尽,用之不竭”的数据创新
数据创新1:数据的再利用
数据创新2:重组数据
数据创新3:可扩展数据
数据创新4:数据的折旧值
数据创新5:数据废气
数据创新6:开放数据
06 角色定位: 数据、技术与思维的三足鼎立
专家的消亡与数据科学家的崛起
07 风险:让数据主宰一切的隐忧
08 掌控:自由与责任并举的数据管理

———-乱弹———-
看到“混乱,简单地说就是随着数据的增加,错误率也会相应增加”,“混乱还可以指格式的不一致性,因为要达到格式一致,就需要在进行数据处理之前仔细地清洗数据,而这在大数据背景下很难做到”(p.47-48),特别欣慰──每次做馆藏利用统计时,看到乱七八糟的原始数据,特别无奈。现在,放心了,因为“执迷于精确性是信息缺乏时代的模拟时代的产物”(p.55)。
———-思考———-
已有数据如何利用之外,如何采集与利用“数据废气”
数据废气“是用户在线交互的副产品,包括浏览了哪些页面、停留了多久、鼠标光标停留的位置、输入了什么信息等。许多公司因此对系统进行了设计,使自己能够得到数据废气并循环利用,以改善现有的服务或开发新服务”(p.146)。
复旦图书馆的电子资源利用统计就是采用此法

《日本目录规则》笔记

此次进京,除了参加国家图书馆主办的RDA培训和会议,另有一大收获是向顾犇主任借到《日本目録規則》。看了二晚,并用相机拍了部分页面供日后细看。看完后的一个感想:其实我国应该也可以像日本一样,把中、日、西、俄……文的编目规则统一起来。

曾想通过查NII和NDL的OPAC,了解日本的编目规则。除了在NII看到过日文翻译本以作者原名做规范标目外,要更全面的了解很难。比如是否有惯用统一题名,不能以查到某条记录没有就做出判断。并且这两个OPAC都没有MARC格式显示,不知道查到的原题名(一般标为其他题名),是否按统一题名处理,等等。而看规则本身,很多问题就迎刃而解了。

第一晚,先解决特别想了解的日本编目规则的标目问题。
1、日本是否存在“名称/题名”标目
答案在“标目付侧2”, 被称为“单一记入制目录”的标目,其规则是由第1表选择一个著者标目,如果找不到合适的,再由第2表选择一个题名标目。也就是说,名称/题名是一种基本形式。不过列于附则而非正文,应该也是一种选项吧。
2、日本的统一题名规则
第26章统一题名。
首先,该章的规定是可选择性使用的(任意规定);
其次,范围仅限无著者古典著作、宗教经典及音乐作品(前两者可由附录4选择标目形式);
再次,有“复合形式”即“名称+统一题名”形式。
另外,没有作品集惯用统一题名

第二晚,了解外文(非日语)的处理方式。
《日本目录规则》是各语种(和、汉、洋)合一的编目规则,只是对洋资料有部分特别做法,还有部分在统一处理方法之外有交替做法(别法)。
1、著录方面:不同外语采用各自的著录语言;或者统一用英语
1.0.6.1A 欧美诸语言资料(指用拉丁字母、西里尔字母的),除题名与责任项外,缩略语参照付录2。另外,拉丁字母语言用缩略语用et al.和s.l.及s.n.,其他语言用相应缩写。
1.0.6.2别法 洋资料的形态及附注等,用英语。
2、标目方面
第21章 标目总则:
21.3.0通则 题名、作者名及主题标目,日文资料用片假名、西文资料用拉丁文字表示
第23章 著者标目:可采用原文形式
23.2.1.4D别法 外国人名,以名称的原文形式做标目。
23.2.2.6F别法 外国团体,一般以熟知的原文形式名称做标目。
3、附录2 略语表,包括:
付2.1 一般略语(欧文)[拉丁字母的德、法、英等语种]
付2.5 西里尔文字的略语

———-附《日本目録規則》概要———-
日本目録規則 / 日本図書館協会目録委員会編. 1987年版, 改訂3版. 東京 : 日本図書館協会, 2006.6. xxii, 445p ; 27cm. ISBN: 4-8204-0602-7 (別タイトル: NCR ; Nihon mokuroku kisoku ; Nippon cataloging rules)

《日本目录规则》简称NCR,最新版为1987年版改订3版,2006年出版。从版本看颇有AACR2风格。内容基于ISBD和AACR2,但标目部分更完整,包括主题、分类,另有目录排列部分,基本上包含了组织目录需要的各项规则。

目录委员会报告:文前有第22-30期报告,对规则的历次修订背景等有较全面介绍。
序说:正文首的“序说”之“3)NCR制定的经纬”,有1892年起的日本编目规则历史。
第I部 记述(著录):比AACR2多了单独的盲文资料(第11章),但没有“分析”。
第II部 标目:分别是 21标目总则,22题名标目,23著者标目,24主题标目,25分类标目,26统一题名。
第III部 排列:题名、著者、主题、分类目录的排序规则,是AACR2没有的部分。
附录:比较特别的是4:无著者名古典·宗教经典统一标目表。(我国的编目规则是不是也需要一个这样的表?)

读《信息共享空间实现机制与策略研究》

去年末向任树怀馆长索得《信息共享空间实现机制与策略研究》一书,乃2007年国家社科基金课题成果,2010年入选国家哲学社会科学成果文库。

信息共享空间实现机制与策略研究 / 任树怀等著. 上海人民出版社, 2011年4月. 457 p. ISBN 978-7-208-09832-9

拿到这本厚重的书,略翻后觉得需要花大块时间,便决定留着寒假里细读。正巧放假前馆里通报学校批准了老校区图书馆大修预算(原来估计要2013年),而去年开始本馆电子阅览室已经免费开放,于是看书的时候不免常常想此次大修是否可能引入IC模式,如果可能的话,又该如何调整布局(不考虑部门调整)。此书内容饱满,被我带着问题看,当作实施IC的手册了(以下所有IC均指书中所举实例)。

一、commons到底是什么?《21世纪大英汉词典》(有道词典)有一个解释是大学公共食堂,如此information commons则是公共信息空间了。现代图书馆本就是一定范围内的公共信息空间,IC作为图书馆的一种新型态,特别之处何在?
开篇指出:“信息共享空间……是20世纪90年代在信息技术革命、开放存取运动和共享式学习背景下出现的新概念”(p.1)。纵览全书,一个很深的印象就是,共享式学习、群组协作学习是IC存在的重要因素,如果不是主要因素的话。注意到IC一般都设置小组研讨室,体现协作学习;却很少设置个人研究室──即使如香港城市大学有“个人研究室”,实际上也“可容纳3-6人小组研讨”,只是比可容纳6-8人的“小组讨论室”小一些而已,并非单人研究室(p.385)。
可是在我国高校,共享式学习、群组协作学习在多大程度上存在?学生实际上有没有这方面的学习需求?(联想:武汉大学新馆的双人研修室,被媒体炒作为“情侣自习室”)
将要大修的这个馆,在1989年开馆时即设有个人研究室,那时还没有IC概念,我也不了解当初设置的目的与理由。20多年过去了,还需要单人研究室吗?

二、IC是实实在在的,小至图书馆楼层的一个区域,大至一整座楼。但同时,IC也是一个无所不包的概念,瑞典有学习空间布局的4LC模型(Learning commons=Learning Cafe+Learning center+Learning community)(p.143)[休闲+学习+社区],上海交大有IC平方(IC2=Information CommonsXInnovation Community)(p.411)。看IC包括的服务,恐怕所有图书馆都可以认为自己提供了某种程度的IC,至少电子阅览室和咨询台总是有的吧?
当然这肯定是偏颇的看法。对于IC来说,配合对环境的改变,对现有服务加以重组与整合,提供某种程度的一站式体验,应该是比提供一些新技术、新设备、新氛围更重要的考虑

三、一些比较有感觉的图表(实例):
p.150-151 北卡罗莱纳州立大学学习共享空间不同功能区的设备配置(图4.16)
p.155 信息共享空间多样化学习用家具(图4.17)
p.267 印第安那大学布卢明顿信息共享空间服务项目及内容(表7.2)
p.274 田纳西大学学习共享空间服务内容(图7.2)
p.385 香港城市大学学习共享空间服务区元素及其功能(表8.3)

[update 2012-2-9] 任馆曾经推荐的19个信息共享空间案例
The Learning Commons Model: Determining Best Practices for Design, Implementation, and Service. Sabbatical Project 2007. Susan McMullen (Professor, Reference and Information Resources Librarian, Roger Williams University)
书中提到的Susan McMullen,一位教授兼馆员,在2007年学术假中,实地探访后搜集的丰富图文资料
[update 2012-3-13] 直接在Google图片中搜information commons也有不错结果呈现
———-分割线———-

吴建中:开放存取环境下的信息共享空间(2005年4月27日)
吴建中馆长在上海市图书馆学会双月学术讲座的报告

Information Commons:信息共享or信息共用(2005年4月28日)
考证国内最早关注IC者,依次为:陈乐明1997、初景利2003、钱国富2004、毛军2004。

信息共享空间:从何处来、向何处去(2008年7月12日)
洪世昌在武汉大学举办的“第九届海峡两岸图书资讯学学术研讨会”上的论文“大学图书馆的新型态整合性服务模式──数位学习共享空间”,前二部分有很多的参考资料,第三部分为台湾师范大学IC──SMILE多元学习区(Searching资讯检索、Multimedia多媒体、Information参考咨询、Leisure休闲阅读、E-learning数位学习)。

从信息共享空间到跨学科实验室(2010年5月29日)
王雪茅在台湾“數位科技於圖書館資訊服務之應用研討會”上的PPT。博文提出疑问:这边信息共享空间(IC)整体上还处于开发中状态,那边已经过气了吗?

更多博文……