Google图书的全文阅读及下载

2011年3月5日 由 catwizard 1条评论 »
Jonathan Rochkind写了一篇博文“Google Books, no longer offer PDF for public domain? (March 3, 2011)”,怀疑Google不再提供公共域图书的PDF下载。有人留言说该文误导,因为前晚他还下载了好多本。Jonathan于是承认他弄错了,下载链接躲在右上角落里,远不如电子书店那么醒目,而且还要输入识别字符后才能下载──为的自然是防止批量下载。
想来Jonathan在写博文前很是为Google取消公共域图书下载困惑了一阵的,因此我也去访问Google图书,看看是何种情形。
进入Google图书首页,在登录状态,上部显示My Google eBooks,因为曾经收藏过几册书。在收藏图书的封面图片下是灰色的Read Now按钮,点击就是双页的电子书阅读模式,找不到下载链接。返回点击封面图片,进入元数据页,右侧是蓝色醒目的Read Now按钮,也没有下载链接。Wonderful Stories for Children(点击看效果)
再回到Google图书首页,在My Google eBooks区域下部是Classics区域,都是公共域图书,一连点了多本,都只能阅读片断(Snippet view),自然更不会有下载链接了。想起来曾经测试过,这与IP有关,要是美国的IP,这公共域才普遍起作用
那个神秘的下载链接在哪里呢?
于是试着在Google图书的搜索框里查上述书名。在结果一览中点击该书,显示页面完全不同,那个下载链接在页面右上角出现了,蓝色醒目的Read Now按钮则显示到了左侧,伴随着Google电子书店的购买广告。点击Download链接,选择下载PDF或EPUB,在输入识别字符后可以下载。Wonderful Stories for Children(点击看效果)
仔细看这同一本书两个链接,原来一个ebooks,一个是books。把上面网址后面部分去掉,就显示出非常相似的页面布局,只是Google图书有书内检索框,还有预览Preview this book链接。点击就预览就到了有下载链接的页面。
Google eBooks & Google Books
(上部:Google电子书店;下部:Google图书)
http://books.google.com/ebooks?id=ey8EAAAAQAAJ
http://books.google.com/books?id=ey8EAAAAQAAJ
在查找过程中发现,一方面,尽管是公共域图书,非美国IP也不一定能看全文;另一方面,很多新版图书,甚至是本世纪出版的,也可以全文阅读──不过没有下载链接。(在高级检索中选Full View即可)
Jonathan文中还说到HathiTrust仅向认证为其成员机构的用户提供完整的PDF,至少对其中Google扫描图书如此。他认为这是与Google协议规定必须限制PDF发布。
前些日子访问HathiTrust时就发现对于公共域可完全浏览的图书,只有单页PDF链接。难道登录后就会有整书PDF链接?HathiTrust中的同一本书:Wonderful Stories for Children(点击看效果)

公共知识计划(PKP):开源软件、开放存取

2011年3月1日 由 catwizard 没有评论 »
昨天OCLC宣布将2010年图书馆与信息技术研究奖(Frederick G. Kilgour奖)授予斯坦福大学教授、公共知识计划创始人John Willinsky博士。
公共知识计划(Public Knowledge Project, PKP)由加拿大不列颠哥伦比亚大学(UBC)教育学院、西蒙·弗雷泽大学图书馆、斯坦福大学教育学院及西蒙·弗雷泽大学加拿大出版研究中心合作,有教师、图书馆员与研究生参加,其主打产品是免费且开源的期刊、会议及出版软件,以此支持开放获取(OA)运动。其中若干软件很有人气,如有需要,很可以拿来用。
OJS (Open Journal Systems):开放期刊系统
这是一个电子期刊管理与出版系统,包括从论文提交到联机发布及索引的所有过程。曾经在网上查找OA期刊,发现很多都是用OJS的,当然也有一些用OJS做网站的期刊并非OA期刊。
据授奖公告,有超过5000种学术期刊使用OJS;计划网站则称截止2011年1月,全世界安装数超过8300个。
OCS (Open Conference System):开放会议系统
可用于创建学术会议网站,包括发布征文启示、接受论文及文摘提交/修改、注册、发布会议录等整套流程,
截止2011年1月,全世界安装数超过1200个。
OHS (Open Harvester Systems):开放收割系统
免费的元数据索引工具,可收割OAI元数据,包括DC、PKP的DC扩展、MODS和MARCXML格式,其他可通过插件支持。
目前网站上列有30个安装实例链接。
OMP (Open Monograph Press):开放专著系统
开发中,用于图书出版,据称与Fedora机构库兼容,基于现有PKP软件的模块(如提交、审核等)。
———-链接的分割线———-
Frederick G.Kilgour Award Recipient Named for 2010 (DUBLIN, Ohio, USA, 28 February 2011)
项目网站称1998年由John Willinsky在UBC创建。
The Frederick G. Kilgour Award:OCLC和LITA(美国图书馆与信息技术协会)共同主办的年度奖,始于1998年
维基百科词条:OCLC创始人Frederick G. Kilgour (1914-2006,1967-1980任OCLC总裁)

搬家周年致谢

2011年2月27日 由 catwizard 5 条评论 »
一年前,Sogg和钱老板出手,为我申请域名,把旧博文连带评论及文内链接转换好,全部搬进新家,结束了五年多寄人篱下、看人脸色的写博日子。诸事由两位CTO打理,很快习惯了自由自在、想发就写、想休就停,自然得忘记了纪念写博周年,也几乎忘了一年前下定决心搬家的缘由了──直到2月20日。
后来才知道那是茉莉花开的日子,当时瞎猜是不是和两天前中国防火长城之父接受《环球时报》采访有什么关系。据说那天人人网上“今天”也变成了敏感词──我不知道那位是怎么知道的?因为正好在那天,我在人人网上写家事日志,只是修改旧文,保存时却提示“对不起,您的文章发表失败。文章内容包含不合适内容,请检查。”只是写儿子往来沪汉两地的事,哪会有不合适的内容?前后看了N遍,自我审查、东删西改,每保存一次就告诉我检查,却不告诉我不合适的内容是什么,哪怕把个区域高亮,给点儿提示也好啊?最后因为实在猜不出用了哪个敏感词,以放弃修改告终。
今天总算知道我用了什么敏感词了,原来是“肯德基”、“麦当劳”!
看来人人网是在提醒我,别身在福中不知福啊。向两位CTO致谢(嗯,以下省略3个字)……
———-敏感词的分割线———-
@Beichen: 我在新浪微博说[“今天”在人人网是敏感词。] 被删。系统管理员还温馨提示说,请日后不要再发布敏感内容。我们将对您发布的微博内容审核一周,感谢您对新浪微博的支持与理解。
@CorndogCN: 经测试:两点,两会,王府井,肯德基,麦当劳,在人人网都成了敏感瓷,那么,幕后黑手到底是谁?是汉堡王?是卡乐星?还是永和豆浆?请看下集名侦探Twitter!(综合自Twitter众)

社会媒体与科研

2011年2月26日 由 catwizard 2 条评论 »
CIBER, University College London
Emerald Group Publishing Ltd
14 December 2010
伦敦大学学院信息学系的CIBER小组与Emerald出版集团合作于2010年12月推出了《社会媒体与科研》调查报告(pdf, 30p)。
报告开始说明参与调查的是1923名正使用社会媒体工具支持其研究活动的研究者,491名尚未以此方式使用社会媒体的研究者作为对照组,以更清楚地理解形成需求、开始采用的因素。结束部分说该调查是通过Survey Monkey Professional网上进行的,发出了超过10万份邀请,有4012人参与调查,似乎并未说明如何从4012人中选择1923+491人的。参与者来自215个国家(似乎世界上并没有这么多国家),从国家分布图看,中国大陆的不少(p30图33)。
需要强调的是,调查是指用社会媒体工具进行研究而非一般使用。需要注意的是,未使用者仅占被调查者的20%,且报告中部分统计只针对使用者,因而数据值可能比较高,如引用数据需注意辨别。报告末也说该调查样本是非随机样本,因而发现不能被普遍化到所有研究者,尤其是非社会媒体使用者。
研究目的有三
· 社会媒体对研究者工作有影响吗?
· 如果有,出版社与图书馆员如何应对?
· 年龄与其他因素如何影响对社会媒体的需求?
调查的八种社会媒体工具
· 社会网络 Social networking
· 博客 Blogging
· 微博 Microblogging
· 协作写作工具 Collaborative authoring tools for sharing and editing documents
· 社会标签与书签 Social tagging and bookmarking
· 日程安排与会议工具 Scheduling and meeting tools
· 会议 Conferencing
· 图像或视频共享 Image or video sharing
主要发现
1、社会媒体在研究过程的所有阶段都得到严肃应用,最流行的三个工具是协作写作会议安排会议(p5图1)
[针对使用者的调查,三者分别为62.7%,48.3%,41.0%]
2、研究人员对社会媒体了解程度很高,但对大部分工具,了解与实际使用间有很大落差(p9图6)
[了解但不使用的占很大比例,从高到低前三分别是图片共享72.1%、微博68.1%和社会网络66.5%]
3、商业、健康、生物科学及艺术与人文研究者较少在专业上使用社会媒体(p10图7)
[在人文社科领域之外,自然科学的生物也在此有点出乎意料,这是比较多利用电子资源包括OA资源的学科]
4、35岁以下的研究者更倾向于使用至少一种社会媒体应用,但不同工具情况各不相同(p11图9,p12图11)
6、社会媒体的专业使用者使用智能手机与其他移动设备的倾向性1.68倍于非使用者,使用iPad的倾向性2.11倍于非使用者。(p15)
7、研究者使用社会媒体工具支持研究的每个阶段:从识别研究机会到最后散布成果。用的不一定是相同的工具,但社会媒体对学术过程有着确实的影响(p17-20图15-22)
[八个阶段:1识别研究机会、2寻找协作者、3寻求支持(资助)、4查阅文献、5收集研究数据、6分析研究数据、7散发结论、8管理研究过程。不同工具、不同学科在不同阶段情况各不相同]

Social Media tools most frequently metioned

8、最流行的专业研究工具是主流技术或“知名品牌”如Skype,Google文档、Twitter和YouTube。研究者倾向于使用通用工具而非专业或定制方案,出版者或馆员需要适应这一现实。(p21图23)
9、采用社会媒体的主要推动力是来自研究者机构外的同行的压力。由于协作与跨学科研究的增长,社会媒体有助于达到研究者之间廉价的即时沟通。(p23图25)
10、使用社会媒体通常受阻于个人的进取心,因此要求清晰地理解这些工具的性能与益处。缺少时间的研究者仍然不清楚社会媒体的益处,这是采用的主要障碍,还有就是非常关注众包信息的认证。(p25图28)
11、查找学术信息时,社会媒体的使用者与非使用者有着几乎同样的偏好,首选开放网络,其次通过图书馆检索许可的电子内容,再次询问同事。调查发现的唯一不同是前者更倾向于在邮件列表或社会网络中发出求助。(p.26图30)
14、研究者也给馆员发送了明确的信息,他们最迫切的愿望是能够使用一个简单如Google的界面,检索所有本地拥有的许可电子内容全文。这个比图书馆转到社会媒体空间(比如可以让用户给图书馆目录加标签)有更大的潜在益处。(p29表7)
[优先级1-5,前者1.93,目录的社会化网络界面、标签等均超过3]

LibraryThing的FRBR应用

2011年2月20日 由 catwizard 没有评论 »

    最近Librarything正准备推出依用户之力实现书目信息FRBR化的新系统──版本(载体表现)和内容表达层次。这是继五年前以“作品”集中图书以后又一个深化层次的进展。当年LT正是以2.0方式,由用户实施书目记录的归并,后来还在用户集中作品的基础上,推出了与OCLC的xISBN类似的thingISBN API(免费)。

    LT目前的书目系统是三个层次,即:作品work—>版本publication line—>手头文献member’s book,新的系统将是五个层次,即work —> (expression) —> (edition) —> “publication line” —> member’s book。
    目前正在做的是揭示作品间关系,如包含、复述、删节、模仿、评论、前传等。由于是“作品级关系”,因而不包括翻译、影印等(内容表达与版本级)关系。LT的小组Board for Extreme Thing Advances成员在开发、细化此功能上做了很多工作(不知道目前的163个成员中有多少图书馆员),在消息发布时已经在LT中增加了约4500包含/被包含关系。接下来的工作仍将以用户参与的2.0方式进行。

    Tim称LT是一个独特的试验田,也是灵感与图书馆实际组织的潜在来源,因而希望图书馆界、图书馆员更多地参与意见:
1、LT的这一系统与FRBR的异同?
2、LT应当了解什么FRBR相关想法?
3、最后是一个玩笑:RDA和LT的新系统哪个先出现?

    新功能引起几位图书馆界博主的兴趣。FRBR博客博主William Denton很认同Tim的观点:“内容表达”的概念借自FRBR,但在图书馆并没有很好地实施,而LT的实施可能对图书馆界有启发和帮助。
    William简要列出了在LT的wiki帮助中的一些内容(HelpThing > Work > Relationships)。LT作品间关系为如下几种,与RDA附录J的关系相比,要简略得多

包含 contains
复述 is a retelling of
(非系列)续集 is a (non-series) sequel to
(非系列)前传 is a (non-series) prequel to
改写 is an adapation of
节选 is an abridged version of
扩写 is an expanded version of
模仿 is a parody of
回应 is a reply to
影响 was inspired by
研究 is a study of
参考指南/配套 reference guide/companion to
补充 is a supplement to
评论 is a commentary on the text of
词汇索引 is a concordance to
学生学习指南 is a student’ s study guide to
教师指南 is a teacher’s guide to

如下是关联操作界面:
LibraryThing's Set work-to-work relationships

 ———-出处的分割线———-
The Thingology Blog: LibraryThing and FRBR? / by Tim (2011-2-8)

Talk about LibraryThing: LibraryThing dives into editions and expressions (2011-2-8)

The LibraryThing Blog: LibraryThing gets work-to-work relationships! / by Jeremy (2011-2-10)

The FRBR Blog: LibraryThing tackles FRBR / by William Denton (2011-2-17)

Bibliographic Wilderness: LibraryThing adds FRBR ‘expressions’ / by jrochkind  (2011-2-17)

———-参见———-
Tim Spalding谈LibraryThing和图书馆(员) (2006年3月3日)
thingISBN――用户视角的FRBR化成果 (2006年7月2日)