KBART:向链接解析器知识库提交元数据的推荐格式

NISO最近推出KBART(知识库及相关工具,Knowledge Base and Related Tools)第II阶段推荐实践报告:
Knowledge Bases and Related Tools (KBART) Recommended Practice: a Recommended Practice of the National Information Standards Organization (NISO RP-9-2014) / prepared by the KBART Phase II Working Group. NISO, 2014. ISBN 978-1-937522-41-4. 71 p.

KBART是一种向链接解析器知识库提交元数据的推荐格式。据NISO发布的消息称,自第I阶段推荐实践发布以来,超过75个出版社与内容供应者已签署KBART,承诺按此提供高质量元数据(NISO News: NISO Publishes Revised Recommendations for Knowledge Bases and Related Tools (KBART),07 Apr 2014)。项目主页(Knowledge Base and Related Tools (KBART))有签署机构一览表,包括协会、学会、出版社、厂商等数十家知名机构。

KBART第I阶段推荐实践针对的是期刊,第II阶段扩大到了开放获取出版物、电子书和会议录。并且特别针对提交联盟订购电子资源订制包清单的方法作出了规定。

——— KBART背景 ———
“2007年,非赢利组织UKSG委托制作报告《链接解析器与连续出版物供应链》(Link Resolvers and the Serials Supply Chain),指出影响OpenURL链接有效性的一系列问题。报告建议(7.1.1节)建立一个小组,确定与推进‘最佳实践’解决方案,以改进知识库元数据的交换。”“UKSG与NISO一同建立工作组,集合电子资源供应链各方面的成员,说明UKSG报告中发现的问题,提供解决方案……2007年12月NISO/UKSG KBART工作组建立,初步成果为第I阶段推荐实践(Phase I Recommended Practice),于2010年1月出版(NISO PR-7-2010)。”(p. v)
“KBART第I阶段完成……NISO于2010年初成立新的第II阶段工作组,继续此工作。”(p.1)

“KBART格式是用制表符(tab)分隔的文本文件,既可用于人读、也可用于机读,可以网页提供,或者通过FTP在内容提供者与知识库供应商系统间传递。对于没有充足本地开发专家或资源的出版者,也是有效知识库元数据传输的低成本方法。”(p.4-5)
“……KBART小组正与EDItEUR讨论对KBART消息实施ONIX,可能基于现有的ONIX-SOH消息。这对于已经使用ONIX的内容供应者尤其有价值。”“作为格式的一部分,将开发KBART到ONIX的对照表。”(p.5)

——— 报告的主要部分 ———
Section 3: Metadata for Consortia
定义联盟元数据文件名。文件中应包括联盟所购定制包的清单、各连续出版物的覆盖时间段。

Section 4: Open Access Metadata
(4.3)OA的三种场景:延期OA(如1年后OA)、期刊OA变化(出版者变化导致由OA变订购或反之)、作者支付混和OA(期刊需订购,但某些文章因作者付费而OA)。
(4.4)目前KBART元数据只到期刊级而非文章级,针对此给出二个字段:
notes(修改):可以文本说明OA情况
access_type(增加):两个值:F=OA或免费),P=付费。如对延期1年OA的期刊,需提供两条,时间段为最近12个月的=P,12个月以前的=F。

Section 5: E-book and Conference Proceedings
(5.3)增加出版类型字段publication_type,区别连续和单行资源;
增加单行资源的出版日期(印刷、联机)、卷册、版本字段;
增加第一编者字段,不同于已有的第一作者字段;
为指明会议录单册与会议录连续出版物间关系,增加parent_publication_id字段【单向标识,没有子出版物标识——表格形式,字段不可重复之故?】
针对连续出版物(期刊和系列会议录)改名,增加前题名ID字段【单向标识,没有后题名ID】

Section 6: Guidelines for Effective Exchange of Metadata With Knowledge Bases
(6.4)数据格式
以制表符分隔,纯文本,UTF-8编码;一个出版物一行,每字段一栏,字段如6.6节定义;……
同一期刊,如覆盖范围中断大于等于12个月,需重复列出相同内容、仅覆盖范围不同【因字段不能重复】
元数据文件中题名应按字母排序,以方便知识库开发者校验与导入。
(6.6)KBART数据字段。共25个,大部分看字段名就能够理解含义:
publication_title
print_identifier(通常为9位ISSN或ISBN-13)
online_identifier(同上)
date_first_issue_online(日期)
num_first_vol_online(卷)
num_first_issue_online(期)
date_last_issue_online
num_last_vol_online
num_last_issue_online
title_url(刊或书的主页URL)
first_author(期刊为空)
title_id(私有ID)
embargo_info(限制信息,包含:限制类型、时间长度、时间单位)
coverage_depth(3个值:全文、部分文章、文摘)
notes
publisher_name
publication_type(2个值:连续、单行)
date_monograph_published_print
date_monograph_published_online
monograph_volume
monograph_edition
first_editor(期刊为空)
parent_publication_title_id(会议录丛编或电子书丛书)
preceding_publication_title_id(连续出版物改名前题名ID)
access_type(2个值:付费、免费)