西班牙国家图书馆关联数据发布

还是来自远洋师在书社会发布的消息:
西班牙国家图书馆书目的关联数据发布了
相同内容另见:W3C关联开放数据邮件组消息链接(From: Boris Villazon-Terrazas, 13 Feb 2012)

远洋师认为,“这个书目数据的本体显然是以FRBR为基础的http://www.bne.es/es/Catalogos/DatosEnlazados/Modelos/”

有240万条转为RDF的书目记录,含专著、录音资料和乐谱;还有400万条个人、团体、统一题名及主题的规范记录。这些规范记录生成了5800万条RDF三元组,以及60万wol:sameAs关联到DBPedia、VIAF及法国、德国、瑞典的国家图书馆目录。

作为“西班牙国家图书馆关联数据”项目(Linked data at the BNE)的一部分,在国图支持下由马德里理工大学的本体工程组(Ontology Engineering Group, OEG)实施,采用OEG自己的MARiMbA工具,由MARC21记录生成采用不同RDFS/OWL词表的RDF。
与德国图书馆图书馆一样,也采用CC0(创作共用-公共域)协议。

访问地址:
http://datos.bne.es/
SPARQL endpoint网址
项目网址:the Data Hub
MARiMbA工具网址

———-西方国家的国家图书馆发布关联数据的时间线———-
瑞典(书目2008)、美国(词表2009)、匈牙利(书目/规范2010)、英国(书目2010,未直接发布)、德国(规范2010,书目2012)、西班牙(书目/规范2012)。

参见:德国国家书目发布为关联开放数据(2012年2月1日)
更多链接参见:德国国家图书馆规范数据发布为关联数据(2010年10月9日)

JISC的PDA与元数据报告(元数据部分)

续:JISC的PDA与元数据报告(2012年2月12日)

全文搜索时代,元数据是不是还有作用?Ken Chad 咨询公司为JISC所作项目的最终报告“PDA及元数据在电子书的发现、选择和采访中的作用”提出了它的结论。读完报告后觉得,现在的元数据范围更广,与以往熟悉的元数据面貌已有很大不同,社会元数据的外延也在扩展。

Patron Driven Acquisitions (PDA) and the role of metadata in the discovery, selection and acquisition of ebooks: Final report for the JISC / Ken Chad Consulting Ltd., December 2011.
网页版:https://ebmotmet.wikispaces.com/Report;PDF下载

报告共22页,包括封面和参考文献(3页),正文内容中“7 元数据的作用”篇幅最大(8页)。

7.1 元数据的“能力” (p.11)
这里汇总了项目启动会上人们对元数据作用的看法。[由于并无最终用户参会,实际反映的是馆员、出版商和供应商的看法。(参前文)]
· 和全文索引相比,元数据能使搜索/发现更精确
· 元数据的关键能力是过滤,例如出版日期可作为至关重要的过滤器
· 元数据潜在的关键用法是帮助评估图书是关于什么的。但就此点而言,对“传统”元数据的价值有相当大的怀疑。题名重要,除了有时未能高度描述内容;学生很少了解LCSH。一致认为这类元数据的价值在后台,如链接到其他资源以寻找相关的替代品(以LCSH为例)。认为电子书平台可以使用这类数据,而不必显示给用户看。
· 对于用户确定图书内容、看是否与手头工作有关,文摘、章节标题及生产信息更有用。
· 需要唯一标识符,帮助区别有不同“权力”的不同电子书版本,比如有没有DRM更宽松的版本
· 某些情况下,图片很重要,因此关于电子书是否有图片的元数据会有帮助 [有点出乎意料,这至少提醒编目员,在什么情况下加上“插图”才是有意义、有必要的]
· 图书馆员尤其认为,用户不愿意花时间和精力增加诸如标签、评论推荐及评分之类的“社会元数据”,但用户却准备使用这类数据。自动形成数据可在某种程度上解决此悖论,如推荐可来自使用数据及点击。
· 关于用户的元数据可能是重要的,提供的服务因之了解该学生是谁、他们正学习的课程,可以传递更相关的结果。
· 使用与活动元数据可用于驱动其他服务如推荐/建议(如它构成了Elsevier的电子书采访循证模式)
· 元数据在对馆藏分组(scoping)中起关键作用,馆员基于元数据,在后台设置优先级。

7.2 质量问题
电子书元数据由出版商/集成商提供而非图书馆员编制。问题自然有,但PPT(见后)总结的馆员观点是,总体上记录质量是好的(p.27);

7.3 发现过程(Discovery)
所有参与项目及访谈者均认同元数据对发现的重要性。但电子书的发现路径不同,碰到的元数据也不同。路径按用户调查,依次为导师推荐31%、图书馆服务(包括目录、发现平台、数据库)31%、阅读清单18.7%、电子书网站11.6%等。(p.13)
报告认为导师推荐和阅读清单等超过图书馆目录,说明图书馆目录更适合作为他处发现(discovered)文献的寻找(finding)工具。其所举例子是焦点小组的某研究生在图书馆目录和Metalib里搜索,找到一本认为合适的书,发现图书馆没有,结果在Google图书里查到了免费版本。──本无收藏,自然无从发现。
另一个例子是学者(教师)更肯定阅读请单与导师推荐对发现的重要性,阅读清单还有对阅读重点说明──这个是毫无疑问的。报告由此引伸出,图书馆的发现与管理系统与阅读清单集成,会是一个明显的机会,并举Huddersfield大学的阅读清单系统、Talis的Aspire,以及其他发现系统。

7.4 选择和采购
对图书馆来说,采用PDA的主要问题是钱用得太快。因此需要使用元数据控制用户可发现的书目──换言之,通过某种过滤减少提供的书目。用于过滤的元数据包括主题、出版日期(去掉旧书)、语种、出版国,还有分类号。
这里提到了标识号问题,因为电子书与纸本书,或者不同来源电子书间如何判重,对书目过滤至关重要。而未来可能成为趋势的电子书内容碎片化(章节出版),让标识问题更需解决。BIC (book Industry Communications) Metadata Futures Group正致力于此。

7.5 评价
评价是选择过程中的关键活动──也就是说,找到后先判断是否有价值,再决定是不是选中它。
调查显示,对判断最有用的,按回答数量依次是:题名118、主题关键词112、列入阅读清单110、作者109、价格109、图书内容信息(护封耳页介绍、摘要)108;按得分高低依次是:题名、图书内容信息、列入阅读清单、作者、出版日期、主题关键词(p.17)。

社会元数据:标签、评论、评分、推荐。如Huddersfield大学的“读这本书的也读……”,ExLibris Primo发现服务对期刊文章的bX推荐服务……Kobo阅读器的Pulse功能……NISO在2011年10月法兰克福书市上举办了“电子书标注共享与社会阅读”研讨会。

8 结论和建议(2 对JISC的主要建议,内容近似)
8.2.2 社会元数据
有些复杂:社会媒体和元数据覆盖许多不同的事,包括评级、评论、标签标注等。有些可能由用户明确生成(如评论),而另一些可能自动生成(如基于以往利用的推荐服务)。同样重要的是它包括关于用户的元数据,或者是明确表达的(如其课程),或者是在其联机活动中隐含表达的(如点击)。

———-会议报告的元数据总结———-
最终报告页面有关于本项目的会议报告PPT,为最终报告中统计数据制作有彩色图示,也是项目内容概述:
ebooks: metadata & patron (demand) driven acquisitions / Ken Chad at the ‘ebooks unbound’ conference in Glasgow in October 2011

元数据部分的总结(p.30)
出版商和集成商的元数据质量总体是好的,并在改善中
图书馆主要用于管理──通过限制可检索的文献集来调节需求
学生使用评价性元数据吗──也许不,但……
目次及护封耳页介绍在发现与评价中都具宝贵作用
阅读清单注释极受到高度重视
社会元数据有潜力

———-项目网站之焦点小组———-
最后总结的对读者最有用的元数据:
电子期刊上的书评,对寻找相关电子书很好
不关注“主题” [但从报告的数据看,提到主题关键词的居第2位,只是打分在全部十项中列第6位]
出版日期相当重要(一致同意),印刷版可能是最新版,获取最新版很重要
索引对寻找信息相当重要──一旦定位图书,目次并不总是寻找特定信息的最佳途径,使用索引更快,快速到达正确的页面。[在全文搜索时代,书后索引仍很重要,可惜本国学术著作附索引的太少]

JISC的PDA与元数据报告

看到2011年12月 Ken Chad 咨询公司的报告“PDA及元数据在电子书的发现、选择和采访中的作用”,近两三年用户驱动采购/读者决策采购(PDA)在英国高校图书馆呈蔓延之势,主要读者对象是大学生(而非研究人员)。现在的主要矛盾是读者需求高涨而采购经费不足,很多时候需要限制可供书目,而元数据正是重要手段──当然这些元数据是出版社提供的,与图书馆编目员无关。

该报告是JISC项目的最终成果,项目名称:元数据在电子书的发现、选择和采访中的作用
The Role of Metadata in the Discovery, Selection and Acquisition of e-Books

项目wiki完整展示了项目进行过程中的各种详尽信息,不仅对了解PDA,对做其他项目也有参考价值:
(1)Workshops: ‘Jobs-to-be-done’ 项目启动研讨会
与会者为馆员、出版商和供应商(利益相关人)。对项目的研究方法、任务、用户(读者)、环境、元数据相关及PDA作了梳理。
(2)Stakeholder interviews 利益相关人访谈
包括馆员、出版商、供应商(电子书平台提供者)、学者和学生,采用结构化的访谈模板,包括元数据相关。
针对每种访谈对象,有被访者简介、访谈问题(及该提问的意图)清单,以及逐个的访谈记录。
(3)Case studies 案例
九所大学及EBSCO的实例,注重元数据在电子书用户驱动采购中的作用。有模板(机构调查问卷)。
(4)User Survey 用户调查
与Dawsons公司合作的最终用户联机调查(首次小型调查),了解使用动机、发现途径、元数据(对用户有用的元素)、电子书是否满足需求。有调查结果汇总。
(5)End user focus group 最终用户焦点小组
十名学生参加的焦点小组,包括研究生和大学生,来自人文、社科和自科。学生回答问题,考察其使用电子书的动机、发现与定位电子书的方法、评估电子书的技术。有特定问题考察元数据用于定位电子书的途径。学生使用的电子书来源不同,从免费电子书如Goolge图书,到馆藏中的已购电子书。
(6)Other relevant work 其他相关作品
与使用电子书动机和元数据相关的出版与未出版作品、博文等资料,含摘要,并说明项目关注该作品的原因。很好的参考资料。

———-报告的分割线———-
报告:Patron Driven Acquisitions (PDA) and the role of metadata in the discovery, selection and acquisition of ebooks: Final report for the JISC, December 2011
网页版:https://ebmotmet.wikispaces.com/Report;PDF下载 (22 p.)
一半关于PDA,一半关于元数据的作用。

同页有关于本项目的会议报告,有最终报告中统计数据的彩色图示,也是项目内容概述:
ebooks: metadata & patron (demand) driven acquisitions / Ken Chad at the ‘ebooks unbound’ conference in Glasgow in October 2011

via all things cataloged: Metadata for PDA(需架梯)

———-关于PDA/DDD的分割线———-
PDA:电子图书的用户驱动采购(2010年12月14日)

读者决策的图书馆藏书采购——藏书建设2.0版 / 张甲,胡小菁. 中国图书馆学报, 2011年第2期
小词条:PDA——读者决策采购 / 胡小菁. 中国图书馆学报, 2011年第2期(安徽省图书馆网站上的转贴