JISC的PDA与元数据报告(元数据部分)

续:JISC的PDA与元数据报告(2012年2月12日)

全文搜索时代,元数据是不是还有作用?Ken Chad 咨询公司为JISC所作项目的最终报告“PDA及元数据在电子书的发现、选择和采访中的作用”提出了它的结论。读完报告后觉得,现在的元数据范围更广,与以往熟悉的元数据面貌已有很大不同,社会元数据的外延也在扩展。

Patron Driven Acquisitions (PDA) and the role of metadata in the discovery, selection and acquisition of ebooks: Final report for the JISC / Ken Chad Consulting Ltd., December 2011.
网页版:https://ebmotmet.wikispaces.com/Report;PDF下载

报告共22页,包括封面和参考文献(3页),正文内容中“7 元数据的作用”篇幅最大(8页)。

7.1 元数据的“能力” (p.11)
这里汇总了项目启动会上人们对元数据作用的看法。[由于并无最终用户参会,实际反映的是馆员、出版商和供应商的看法。(参前文)]
· 和全文索引相比,元数据能使搜索/发现更精确
· 元数据的关键能力是过滤,例如出版日期可作为至关重要的过滤器
· 元数据潜在的关键用法是帮助评估图书是关于什么的。但就此点而言,对“传统”元数据的价值有相当大的怀疑。题名重要,除了有时未能高度描述内容;学生很少了解LCSH。一致认为这类元数据的价值在后台,如链接到其他资源以寻找相关的替代品(以LCSH为例)。认为电子书平台可以使用这类数据,而不必显示给用户看。
· 对于用户确定图书内容、看是否与手头工作有关,文摘、章节标题及生产信息更有用。
· 需要唯一标识符,帮助区别有不同“权力”的不同电子书版本,比如有没有DRM更宽松的版本
· 某些情况下,图片很重要,因此关于电子书是否有图片的元数据会有帮助 [有点出乎意料,这至少提醒编目员,在什么情况下加上“插图”才是有意义、有必要的]
· 图书馆员尤其认为,用户不愿意花时间和精力增加诸如标签、评论推荐及评分之类的“社会元数据”,但用户却准备使用这类数据。自动形成数据可在某种程度上解决此悖论,如推荐可来自使用数据及点击。
· 关于用户的元数据可能是重要的,提供的服务因之了解该学生是谁、他们正学习的课程,可以传递更相关的结果。
· 使用与活动元数据可用于驱动其他服务如推荐/建议(如它构成了Elsevier的电子书采访循证模式)
· 元数据在对馆藏分组(scoping)中起关键作用,馆员基于元数据,在后台设置优先级。

7.2 质量问题
电子书元数据由出版商/集成商提供而非图书馆员编制。问题自然有,但PPT(见后)总结的馆员观点是,总体上记录质量是好的(p.27);

7.3 发现过程(Discovery)
所有参与项目及访谈者均认同元数据对发现的重要性。但电子书的发现路径不同,碰到的元数据也不同。路径按用户调查,依次为导师推荐31%、图书馆服务(包括目录、发现平台、数据库)31%、阅读清单18.7%、电子书网站11.6%等。(p.13)
报告认为导师推荐和阅读清单等超过图书馆目录,说明图书馆目录更适合作为他处发现(discovered)文献的寻找(finding)工具。其所举例子是焦点小组的某研究生在图书馆目录和Metalib里搜索,找到一本认为合适的书,发现图书馆没有,结果在Google图书里查到了免费版本。──本无收藏,自然无从发现。
另一个例子是学者(教师)更肯定阅读请单与导师推荐对发现的重要性,阅读清单还有对阅读重点说明──这个是毫无疑问的。报告由此引伸出,图书馆的发现与管理系统与阅读清单集成,会是一个明显的机会,并举Huddersfield大学的阅读清单系统、Talis的Aspire,以及其他发现系统。

7.4 选择和采购
对图书馆来说,采用PDA的主要问题是钱用得太快。因此需要使用元数据控制用户可发现的书目──换言之,通过某种过滤减少提供的书目。用于过滤的元数据包括主题、出版日期(去掉旧书)、语种、出版国,还有分类号。
这里提到了标识号问题,因为电子书与纸本书,或者不同来源电子书间如何判重,对书目过滤至关重要。而未来可能成为趋势的电子书内容碎片化(章节出版),让标识问题更需解决。BIC (book Industry Communications) Metadata Futures Group正致力于此。

7.5 评价
评价是选择过程中的关键活动──也就是说,找到后先判断是否有价值,再决定是不是选中它。
调查显示,对判断最有用的,按回答数量依次是:题名118、主题关键词112、列入阅读清单110、作者109、价格109、图书内容信息(护封耳页介绍、摘要)108;按得分高低依次是:题名、图书内容信息、列入阅读清单、作者、出版日期、主题关键词(p.17)。

社会元数据:标签、评论、评分、推荐。如Huddersfield大学的“读这本书的也读……”,ExLibris Primo发现服务对期刊文章的bX推荐服务……Kobo阅读器的Pulse功能……NISO在2011年10月法兰克福书市上举办了“电子书标注共享与社会阅读”研讨会。

8 结论和建议(2 对JISC的主要建议,内容近似)
8.2.2 社会元数据
有些复杂:社会媒体和元数据覆盖许多不同的事,包括评级、评论、标签标注等。有些可能由用户明确生成(如评论),而另一些可能自动生成(如基于以往利用的推荐服务)。同样重要的是它包括关于用户的元数据,或者是明确表达的(如其课程),或者是在其联机活动中隐含表达的(如点击)。

———-会议报告的元数据总结———-
最终报告页面有关于本项目的会议报告PPT,为最终报告中统计数据制作有彩色图示,也是项目内容概述:
ebooks: metadata & patron (demand) driven acquisitions / Ken Chad at the ‘ebooks unbound’ conference in Glasgow in October 2011

元数据部分的总结(p.30)
出版商和集成商的元数据质量总体是好的,并在改善中
图书馆主要用于管理──通过限制可检索的文献集来调节需求
学生使用评价性元数据吗──也许不,但……
目次及护封耳页介绍在发现与评价中都具宝贵作用
阅读清单注释极受到高度重视
社会元数据有潜力

———-项目网站之焦点小组———-
最后总结的对读者最有用的元数据:
电子期刊上的书评,对寻找相关电子书很好
不关注“主题” [但从报告的数据看,提到主题关键词的居第2位,只是打分在全部十项中列第6位]
出版日期相当重要(一致同意),印刷版可能是最新版,获取最新版很重要
索引对寻找信息相当重要──一旦定位图书,目次并不总是寻找特定信息的最佳途径,使用索引更快,快速到达正确的页面。[在全文搜索时代,书后索引仍很重要,可惜本国学术著作附索引的太少]

JISC的PDA与元数据报告

看到2011年12月 Ken Chad 咨询公司的报告“PDA及元数据在电子书的发现、选择和采访中的作用”,近两三年用户驱动采购/读者决策采购(PDA)在英国高校图书馆呈蔓延之势,主要读者对象是大学生(而非研究人员)。现在的主要矛盾是读者需求高涨而采购经费不足,很多时候需要限制可供书目,而元数据正是重要手段──当然这些元数据是出版社提供的,与图书馆编目员无关。

该报告是JISC项目的最终成果,项目名称:元数据在电子书的发现、选择和采访中的作用
The Role of Metadata in the Discovery, Selection and Acquisition of e-Books

项目wiki完整展示了项目进行过程中的各种详尽信息,不仅对了解PDA,对做其他项目也有参考价值:
(1)Workshops: ‘Jobs-to-be-done’ 项目启动研讨会
与会者为馆员、出版商和供应商(利益相关人)。对项目的研究方法、任务、用户(读者)、环境、元数据相关及PDA作了梳理。
(2)Stakeholder interviews 利益相关人访谈
包括馆员、出版商、供应商(电子书平台提供者)、学者和学生,采用结构化的访谈模板,包括元数据相关。
针对每种访谈对象,有被访者简介、访谈问题(及该提问的意图)清单,以及逐个的访谈记录。
(3)Case studies 案例
九所大学及EBSCO的实例,注重元数据在电子书用户驱动采购中的作用。有模板(机构调查问卷)。
(4)User Survey 用户调查
与Dawsons公司合作的最终用户联机调查(首次小型调查),了解使用动机、发现途径、元数据(对用户有用的元素)、电子书是否满足需求。有调查结果汇总。
(5)End user focus group 最终用户焦点小组
十名学生参加的焦点小组,包括研究生和大学生,来自人文、社科和自科。学生回答问题,考察其使用电子书的动机、发现与定位电子书的方法、评估电子书的技术。有特定问题考察元数据用于定位电子书的途径。学生使用的电子书来源不同,从免费电子书如Goolge图书,到馆藏中的已购电子书。
(6)Other relevant work 其他相关作品
与使用电子书动机和元数据相关的出版与未出版作品、博文等资料,含摘要,并说明项目关注该作品的原因。很好的参考资料。

———-报告的分割线———-
报告:Patron Driven Acquisitions (PDA) and the role of metadata in the discovery, selection and acquisition of ebooks: Final report for the JISC, December 2011
网页版:https://ebmotmet.wikispaces.com/Report;PDF下载 (22 p.)
一半关于PDA,一半关于元数据的作用。

同页有关于本项目的会议报告,有最终报告中统计数据的彩色图示,也是项目内容概述:
ebooks: metadata & patron (demand) driven acquisitions / Ken Chad at the ‘ebooks unbound’ conference in Glasgow in October 2011

via all things cataloged: Metadata for PDA(需架梯)

———-关于PDA/DDD的分割线———-
PDA:电子图书的用户驱动采购(2010年12月14日)

读者决策的图书馆藏书采购——藏书建设2.0版 / 张甲,胡小菁. 中国图书馆学报, 2011年第2期
小词条:PDA——读者决策采购 / 胡小菁. 中国图书馆学报, 2011年第2期(安徽省图书馆网站上的转贴

LC书目框架转换行动:首届更新论坛

在1月举行的2012年ALA仲冬会议上,举办了LC书目框架转换行动的首届更新论坛,会议记录日前发布:
Bibliographic Framework Transition Initiative – Update Forum
ALA Midwinter Meeting, Dallas, Texas, January 22, 2012
(Last updated: February 6, 2012)

此次论坛可说是国会图书馆(LC)与美国图书馆界(the community)的一个初步沟通。会议记录显示,虽然转换行动的最初倡导者Deanna Marcum已在1月份从LC副馆长任上退休,但她仍将担任咨询组主席,继续主导此项目。

最后问答/开放讨论阶段的问答,还是反映了图书馆界的一些不同声音。不是支持取代MARC与否,还包括对LC运作此事的态度。毕竟时代不同了,用Paul J. Weiss的说法,图书馆界是把LC当作合伙人(partner),而非父母(parent)

———-致词与介绍———-
会议首先由LC采访与书目获取部主任Beacher Wiggins致词,欢迎参加首届更新论坛的约110名与会者(包括德国国家图书馆、西班牙国家图书馆、加拿大图书馆与档案馆的代表)。他解释,作为1960年代后期主导MARC开发的机构,LC意在尽必要长久地(as long as necessary)维护MARC,但与此同时开始在更广泛意义上寻求编码与发布书目数据的更好框架,也包括规范数据
Wiggins同时介绍了除他本人外,目前从事此项目的其他LC员工,涉及多个部门:
· ILS项目办公室:主管Ann Della Port
· 网络开发与MARC标准办公室:数字项目协调人Kevin Ford,主管Sally McCallum(会议主要发言者之一)
· 采访与书目获取部:主任特别助理Susan R. Morris(消息发布者)
· 政策与标准部:高级编目政策专家Dave Reser,主任Barbara Tillett
· 技术政策主任Ruth Scovill

———-开场白———-
首先发言的是Deanna Marcum,题目是“需要新书目框架”。她回顾了她在2005年ALA仲冬会议上谈“编目的未来”以来的历史,指出有两个现象显示,新框架时代已经到来:
第一,2008年1月书目控制未来工作组向LC及图书馆界提出108个建议;
第二,美国RDA测试协调委员会最终报告指定“可靠地走向取代MARC”作为实施RDA的必要条件之一。
因此,2011年5月Marcum任命Wiggins、McCallum及若干LC管理者开始转换到新书目框架。
考虑到LC在MARC上的巨大投资,她问LC团队,在Google时代,MARC主要发明者Avram会做什么。所有人都同意,Avram不会视MARC为最终答案,会看到MARC的演化,以满足现代需求。2011年10月31日发布计划草案,将建立两个小组,咨询组建立总原则,以及技术开发组。她同意以自愿者身份,担任咨询组组长。
──上述第二点,听上去像是MARC不灭就不实施RDA,其实(progress toward)应该是同时进行。就好象最终报告第一条建议用的是重写(rewrite),现更正为改写(reword),当初有点语不惊人势不休的味道。

接下来是Sally McCallum概述书目框架转换最初规划(2011年10月31日发布)
她强调该计划目前还处于比较空泛的阶段(very high-level),其目的是提出未来需求,探索未来步骤的途径,建议LC及图书馆界如何处理其遗产数据及系统。计划设想的新框架具有以下特征(略)。

———-最新信息(更新)———-
首先由Sally McCallum概述对最初转换计划的回应。她鼓励所有参加论坛者订阅BIBFRAME邮件组,并发表评论。
──从最后讨论阶段看,多人对鼓励大家参与,而LC本身员工不参与颇有微词。LC方面也未对此回应,似乎不想改变这种状况,难道是只用于收集意见,不解释?

至今为止的评论集中在几个主题:
· 核心数据:开发者如何确定什么元素是核心?在这个世界上,每个数据元素都会对某个人是核心
· 关于最终用户,书目框架转换的目标:如何能使图书馆向客户传递更多的价值
· 关于编目员的目标:新框架不大会规定一个界面
若干外国的国家图书馆已提交对转换行动的支持声明。
──后面还多次强调其他国家的国家图书馆对此行动的支持。又是时代不同了,曾经各个国家都要做有自己特色的标准,现在更愿意用共同标准,既省事又方便互用

接下来Deanna Marcum介绍转换行动的资助情况。她承诺为转换行动找资源,希望今冬得到一些。对新书目框架的图书馆界交流必须包括来自其他国家及全美国的声音,这会使计划昂贵。
Wiggins提到,论坛后LC小组希望在不同地区主办一系列邀请会议,如同书目控制未来工作组在2007年那样。Marcum任咨询小组主席,将提供长期指导、监控费用、确保图书馆管理者获知行动进展情况。
──当年MARC研制也是得到外部资助的。

最后是Beacher Wiggins介绍两个小组:咨询小组、技术小组。技术组将按模块开发新框架。名单计划在小组成员完全确定后再公布。LC还设想针对框架的不同部分,组成若干技术分小组。Wiggins鼓励有兴趣参加小组或分小组者联系。

———-问答/开放讨论———-
Elizabeth O’Keefe:咨询与技术小组成员所承诺的时间与资源的性质?
Wiggins:LC与Marcum正寻求资助,在2012年至少每个小组主办一次面对面会议。不要求小组成员以之为全职。

Paul J. Weiss:其他国家的MARC维护机构的职责
McCallum:他们渴望获邀参与。若干国家图书馆已发送支持行动信息。

Louise Ratliff:请在网站上提供一些“阅读建议”。
Wiggins:很好的建议。LC将承担提供阅读书目。推荐阅读涉及RDF、关联系统及相关论题。

John Espley:有没有办法让邮件组的评论更正点?有时论调是负面的。
McCallum:我们觉得人们需要发出声音,应该觉得他们的输入被考虑。
──这说明邮件组中负面评论不少。对比RDA正式发布前,RDA-L邮件组中也多负面评论,改变不是件容易的事。刚去邮件组粗粗浏览,似乎是同样一批人在讨论。

John Attig:邮件组读者与论坛观众欢迎与转换行动决策者直接交流。他们要LC的人在邮件组里表达个人观点。
──此发言及后面Hillmann的发言,说明LC项目成员并不参加邮件组讨论,而这点很让两人不快。并且这两个发言都没有得到LC方面的回应。
──提问者John Attig为RDA联合指导委员会(JSC)的ALA代表,其实在RDA-L邮件组,印象中也极少见到JSC成员发言。

Robert Ellett:Marcum和Wiggins在ALCTS于2011年8月的RDA网络会议上很棒,还会有更多这样的机会吗?
Wiggins:更多由LC、ALCTS或其他实体的网络会议正在考虑中

Janet Ahrberg:转换行动中是否包括厂商?
Wiggins:已经进行中

John F. Myers:当习惯于一定的认知框架,就难以认识打开的另一个维度。致力于转换行动者不应该因负面评论而气馁。提供从MARC到新框架的转换很重要,但先开发新框架,然后建立返回MARC的桥梁也有道理。

Diane Hillmann:希望LC成员可以在邮件组中以个人观点回应评论。LC正在开发下一个大事(the Next Big Thing)的建议要求保证图书馆界将是完全参与者,因此可避免silo。图书馆界关心,所有人都在讨论中发出声音者。

Paul J. Weiss:可以理解厂商与国家图书馆必须有统一的声音,但是现在图书馆界把LC当作合作伙伴,而非父母。框架开发者不应该担心与图书馆界观点不一致。

John Attig:“LC制造”,或者甚至“图书馆制造”,不是所希望的
──此意不明?是要非图书馆制造?

Cheryl Cook:框架小组应该看看Kuali OLE,一个面向社区的研究图书馆管理系统,使用开源软件,因为它连接财务和书目数据。
Wiggins:框架确实会考虑这类连接

论坛闭幕时发表意见,图书馆社区需要扎克伯格(脸书CEO)

Via RDA-L: US RDA Test Update and BibFrame Forum minutes available
书目框架邮件组:BIBFRAME listserv

———-关于书目框架转变行动———-
准备抛弃MARC?美国国会图书馆启动“书目框架转变行动”(2011年5月24日)

“书目框架转变行动”引来一片赞扬(2011年5月25日)

MARC的日子屈指可数?(2011年11月1日)
《LC书目框架计划总体规划》发布

国会图书馆书目框架计划总体规划(2011年11月2日)

未来书目格式的目标与测度(2011年11月2日)

Karen Coyle博文,从费用、协作与创新三个方面,为该计划撰写她所设想的目标与测度。
(本次论坛她因要参加同时间召开的图书馆关联数据孵化小组会议而未能参加,但在邮件组中要求提供信息)