JISC的PDA与元数据报告(元数据部分)

续:JISC的PDA与元数据报告(2012年2月12日)

全文搜索时代,元数据是不是还有作用?Ken Chad 咨询公司为JISC所作项目的最终报告“PDA及元数据在电子书的发现、选择和采访中的作用”提出了它的结论。读完报告后觉得,现在的元数据范围更广,与以往熟悉的元数据面貌已有很大不同,社会元数据的外延也在扩展。

Patron Driven Acquisitions (PDA) and the role of metadata in the discovery, selection and acquisition of ebooks: Final report for the JISC / Ken Chad Consulting Ltd., December 2011.
网页版:https://ebmotmet.wikispaces.com/Report;PDF下载

报告共22页,包括封面和参考文献(3页),正文内容中“7 元数据的作用”篇幅最大(8页)。

7.1 元数据的“能力” (p.11)
这里汇总了项目启动会上人们对元数据作用的看法。[由于并无最终用户参会,实际反映的是馆员、出版商和供应商的看法。(参前文)]
· 和全文索引相比,元数据能使搜索/发现更精确
· 元数据的关键能力是过滤,例如出版日期可作为至关重要的过滤器
· 元数据潜在的关键用法是帮助评估图书是关于什么的。但就此点而言,对“传统”元数据的价值有相当大的怀疑。题名重要,除了有时未能高度描述内容;学生很少了解LCSH。一致认为这类元数据的价值在后台,如链接到其他资源以寻找相关的替代品(以LCSH为例)。认为电子书平台可以使用这类数据,而不必显示给用户看。
· 对于用户确定图书内容、看是否与手头工作有关,文摘、章节标题及生产信息更有用。
· 需要唯一标识符,帮助区别有不同“权力”的不同电子书版本,比如有没有DRM更宽松的版本
· 某些情况下,图片很重要,因此关于电子书是否有图片的元数据会有帮助 [有点出乎意料,这至少提醒编目员,在什么情况下加上“插图”才是有意义、有必要的]
· 图书馆员尤其认为,用户不愿意花时间和精力增加诸如标签、评论推荐及评分之类的“社会元数据”,但用户却准备使用这类数据。自动形成数据可在某种程度上解决此悖论,如推荐可来自使用数据及点击。
· 关于用户的元数据可能是重要的,提供的服务因之了解该学生是谁、他们正学习的课程,可以传递更相关的结果。
· 使用与活动元数据可用于驱动其他服务如推荐/建议(如它构成了Elsevier的电子书采访循证模式)
· 元数据在对馆藏分组(scoping)中起关键作用,馆员基于元数据,在后台设置优先级。

7.2 质量问题
电子书元数据由出版商/集成商提供而非图书馆员编制。问题自然有,但PPT(见后)总结的馆员观点是,总体上记录质量是好的(p.27);

7.3 发现过程(Discovery)
所有参与项目及访谈者均认同元数据对发现的重要性。但电子书的发现路径不同,碰到的元数据也不同。路径按用户调查,依次为导师推荐31%、图书馆服务(包括目录、发现平台、数据库)31%、阅读清单18.7%、电子书网站11.6%等。(p.13)
报告认为导师推荐和阅读清单等超过图书馆目录,说明图书馆目录更适合作为他处发现(discovered)文献的寻找(finding)工具。其所举例子是焦点小组的某研究生在图书馆目录和Metalib里搜索,找到一本认为合适的书,发现图书馆没有,结果在Google图书里查到了免费版本。──本无收藏,自然无从发现。
另一个例子是学者(教师)更肯定阅读请单与导师推荐对发现的重要性,阅读清单还有对阅读重点说明──这个是毫无疑问的。报告由此引伸出,图书馆的发现与管理系统与阅读清单集成,会是一个明显的机会,并举Huddersfield大学的阅读清单系统、Talis的Aspire,以及其他发现系统。

7.4 选择和采购
对图书馆来说,采用PDA的主要问题是钱用得太快。因此需要使用元数据控制用户可发现的书目──换言之,通过某种过滤减少提供的书目。用于过滤的元数据包括主题、出版日期(去掉旧书)、语种、出版国,还有分类号。
这里提到了标识号问题,因为电子书与纸本书,或者不同来源电子书间如何判重,对书目过滤至关重要。而未来可能成为趋势的电子书内容碎片化(章节出版),让标识问题更需解决。BIC (book Industry Communications) Metadata Futures Group正致力于此。

7.5 评价
评价是选择过程中的关键活动──也就是说,找到后先判断是否有价值,再决定是不是选中它。
调查显示,对判断最有用的,按回答数量依次是:题名118、主题关键词112、列入阅读清单110、作者109、价格109、图书内容信息(护封耳页介绍、摘要)108;按得分高低依次是:题名、图书内容信息、列入阅读清单、作者、出版日期、主题关键词(p.17)。

社会元数据:标签、评论、评分、推荐。如Huddersfield大学的“读这本书的也读……”,ExLibris Primo发现服务对期刊文章的bX推荐服务……Kobo阅读器的Pulse功能……NISO在2011年10月法兰克福书市上举办了“电子书标注共享与社会阅读”研讨会。

8 结论和建议(2 对JISC的主要建议,内容近似)
8.2.2 社会元数据
有些复杂:社会媒体和元数据覆盖许多不同的事,包括评级、评论、标签标注等。有些可能由用户明确生成(如评论),而另一些可能自动生成(如基于以往利用的推荐服务)。同样重要的是它包括关于用户的元数据,或者是明确表达的(如其课程),或者是在其联机活动中隐含表达的(如点击)。

———-会议报告的元数据总结———-
最终报告页面有关于本项目的会议报告PPT,为最终报告中统计数据制作有彩色图示,也是项目内容概述:
ebooks: metadata & patron (demand) driven acquisitions / Ken Chad at the ‘ebooks unbound’ conference in Glasgow in October 2011

元数据部分的总结(p.30)
出版商和集成商的元数据质量总体是好的,并在改善中
图书馆主要用于管理──通过限制可检索的文献集来调节需求
学生使用评价性元数据吗──也许不,但……
目次及护封耳页介绍在发现与评价中都具宝贵作用
阅读清单注释极受到高度重视
社会元数据有潜力

———-项目网站之焦点小组———-
最后总结的对读者最有用的元数据:
电子期刊上的书评,对寻找相关电子书很好
不关注“主题” [但从报告的数据看,提到主题关键词的居第2位,只是打分在全部十项中列第6位]
出版日期相当重要(一致同意),印刷版可能是最新版,获取最新版很重要
索引对寻找信息相当重要──一旦定位图书,目次并不总是寻找特定信息的最佳途径,使用索引更快,快速到达正确的页面。[在全文搜索时代,书后索引仍很重要,可惜本国学术著作附索引的太少]