EDTF:扩展日期时间格式

如果在元数据中看到日期为2020-41,会不会感到很晕?是不是弄错了?并没有!这个日期表示的就是当下:2020年下半年。

编目或元数据描述中涉及时间的,通常推荐采用国际标准的日期时间格式ISO 8601,MARC21中常使用美国国会图书馆的扩展日期时间格式(EDTF)。EDTF基于ISO 8601,在2012年发布草案,当前版本发布于2019-2-4。

制定EDTF的背景(EDTF – Background),首先是当时的ISO 8601-2004不足以表达很多应用需要的语义限定与概念,需要加以扩展,例如大致年份(如可能是1984年)。其次是ISO 8601作为国际标准,在很多情况下提供多种格式供选择,实际使用时需要选定、即限制到一个更小的支持集。

ISO 8601-2019基本集成了EDTF扩展的功能,但由于后一原因,现在编目中仍使用EDTF而不是直接使用 8601。换言之,在8601有多个选项时使用EDTF的选项,基本上可以认为现在的EDTF是8601的子集。

Extended Date/Time Format (EDTF) Specification

EDTF采用8601的“扩展格式”(而非“基本格式”)。扩展格式的基本形式是:日期以-分隔,时间以:分隔。(不用分隔符的是基本格式)

日期时间是一个不带空格的字符串。以下概述用到的其他符号、摘取某些数字代码以及常用样例,完整的可查EDTF规范本身。

(一)T 连接日期和时间;Z 世界标准时间(UTC);+或- 比UTC早或晚

1985(年);1985-04(月);1985-04-12(日)。
1985-04-12T23:20:30(本地时间);1985-04-12T23:20:30Z(世界标准时间);1985-04-12T23:20:30+04:30(比UTC早4个半小时)。

(二)表示一年中时间段的数字,除1-12表示月份,21-41分别表示4个季节、4个季度、3个四月期、上下半年。常用的如下:

21-24 春夏秋冬;33-36 第1-4季度;40-41 上下半年
2001-21(2001年春天);2001-34(2001年第2季度)

(三)时间不确定

(1)? 与年连用,~ 与月连用,% 与日连用(符号在数字右边,表示之前整个串不确定;符号在数字左边,表示本段不确定)

1984?(年不确定);2004-06~(年月不确定);2004-06-11%(年月日不确定);
2004-06~-11(年月不确定、日确定);2004?-06-11(年不确定、月日确定);
?2004-06-~11(年日不确定、月确定);2004-%06-11(月不确定、年日确定)。

(2)X 任何年、月、日值的末若干位(不能是单个值的中间位)

201X(2010年代);20XX(21世纪);2004-XX(2004年某月);1985-04-XX(1985年4月某日);1985-XX-XX(1985年某天);
156X-12-25(1560年代某个耶诞日);XXXX-12-XX(某年12月的一天);1XXX-12(11世纪后某个12月);1984-1X(1984年10-12月)

(四)/ 起讫时间;空或.. 时间未知或不确定。起始或结束时间可以用以上(一)(二)(三)表示:

1964/2008(起讫年);2004-02-01/2005(起始日/结束年)
1985-04-12/.. 或 1985-04-12/(结束日期未知或不确定);../1985-04 或 /1985-04(开始月份未知或不确定)
2004-06-~01/2004-06-~20(大约2004年6月1-20日);2004-06-XX/2004-07-03(2004年6月某日到7月3日)

在书目记录中记录作品创作年代

《书目记录中记录分面年代数据的最佳实践》2020-6-19发布0.9版。目前正征求意见(发送到SSFV主席Casey Mullin的邮箱caseymullin1@outlook.com,截止期2020-8-31),之后将定稿发布1.0版。

本最佳实践由美国图书馆协会/图书馆馆藏和技术服务协会/编目和元数据管理部/主题分析委员会/分面词表分委员会(ALA/ALCTS/CaMMS/SAC/SSFV)撰写,具体操作者是SSFV年代任务组成员……在我看来,这一长串机构名显示的是积极参与的专业精神,让我想到大狗小狗都要叫!(绝对不是贬义,如同说孔子是丧家犬!)

Best Practices for Recording Faceted Chronological Data in Bibliographic Records / Issued by the ALCTS CaMMS Subject Analysis Committee (SAC), Subcommittee on Faceted Vocabularies (SSFV). Version 0.9. Approved by SAC to release for broader community feedback on June 19, 2020. URI: http://hdl.handle.net/11213/14591

本最佳实践的目的是推广在书目记录中包含作品/内容表达的创作年代(不同于出版年代或作品描述的年代),以期为发现系统增强功能、增加作品年代分面提供基础数据:“书目元数据中分面年代数据的存在,促进发现环境中许多潜在用途……实际上,开发围绕一般分面数据的增强功能,要求在给定发现环境的书目记录中必须存在大量分面数据。希望这些最佳实践指南,通过鼓励在当前编目和回溯工作中纳入年代数据的分面方法,能够促进这一临界质量。”文件最后有附录“显示和索引分面数据:书目”,如作相关研究可参考。

具体说,本文件介绍如何采用MARC21中已经定义的046和388字段,来表达创作年代,不涉及作品主题的年代(6XX字段)。

针对FRBR/LRM的作品和内容表达的创作年代分成四类,独立作品汇编中被汇总作品汇总作品(汇编、选集等)和内容表达,分别详述如何确定创作年代,以及046、338字段的使用。以下摘取若干样例,略述字段的使用:

一、046 (Special Coded Dates) (R) 特定编码日期

046字段有不同子字段,记录各种日期信息,本文件采用与资源被修改或创建日期相关的子字段。以编码格式表示

指示符1和2均未定义。
$k 起始创作日期或单个创作日期(NR)
$l 结束创建日期(NR)
$o 合集内容的单个或起始日期(NR)
$p 合集内容的结束日期(NR)
$2 日期来源。指日期格式代码,无$2表示采用默认格式(ISO 8601)
EDTF(Extended Date and Time Format,扩展日期和时间格式,LC以ISO 8601为基础扩展的格式)
例:046 ## $k 2002 $o 1660 $p 1810 $2 edtf
(创作于2002年的汇编作品,包含1660-1810年间创作的单部作品;日期为EDTF格式)

二、388 (Time Period of Creation) (R) 创作时间段

作品或内容表达的创作或起源时间段,包括汇编中的作品或内容表达,以术语(文字)形式表达,与046编码配套使用。

第1指示符 时段类型:# 无信息提供,1 创作作品,2 创作合集作品;第2指示符 未定义。
$a 创作时间段术语(R)(受控/非受控术语)
$0 规范记录控制号或标准号(R)($a记录术语的规范记录标识符、含URI)
$1 真实世界对象Real World Object URI (R)(年代实体的RWO URI)
$2 术语来源(NR)($a受控术语来源代码)
$3 特定资料(NR)(标识本字段所应用的被描述资料的部分)
例:388 1# $a Middle Ages $2 lcsh
(中世纪创作作品。采用LCSH术语)
例:388 1# $a Cultural Revolution (Chinese history, 1966-1976) $2 iconauth
(文革期间创作作品。采用Getty Iconography Authority术语)
例:388 1# $a Han Dynasty (China) $2 fast $0 http://id.worldcat.org/fast/1696746 $1 http://www.bbc.co.uk/things/3bd616ba-2bde-4dd3-b636-f88c91c1a128#id
(汉代创作作品。采用FAST术语,有FAST控制号URI和BBC事物URI。
例:388 1# $a Regency era $1 http://www.wikidata.org/entity/Q25861
388 2# $a Edwardian era $1 http://www.wikidata.org/entity/Q185852
(爱德华时代汇编,由摄政时代创作作品组成。2个术语均非控,但有Wikidata的RWO URI)

三、045 – Time Period of Content (NR) 内容的时间段

见于旧MARC记录,不同类型文献采用不同日期格式。从举例看,多与6XX配套使用。在本最佳实践中不推荐

2020居家办公时期的BIBFRAME更新论坛

新冠肺炎全球横行,工作仍要继续,于是很多时候变成了居家办公。BIBFRAME开发几乎没有中断,原本在ALA年会期间召开的BIBFRAME更新论坛,如期举办但改为线上会议——BIBFRAME from home于2020-6-24举办,PPT日前已上网。

5个报告,美国国会图书馆(LC)3个,分别介绍进展概况、新的BF编辑器和BF到MARC转换;另外2个介绍梅隆基金资助项目,也是延续先前的LD4P系列和OCLC。

BIBFRAME Update Forum – June 2020(2020-6-24)

一、BIBFRAME from home / Beacher Wiggins,LC采访与书目获取部主任

介绍会议日程,概述BF试验进展(由另2位报告人详述)。

二、Cataloger’s editor / Matt Miller, LC网络开发与MARC标准办公室(NDMSO)

BIBFRAME编辑器(BFE)重构,主要重点放在用户(编目员)界面与体验,NDMSO委托SAMHAENG做UX咨询与设计。

新的编辑器界面设计(截屏)见BF官网:BIBFRAME Implementation, Tools, and Downloads 之Editor interface design

当前编辑器见:BIBFRAME Editor(正常显示需架梯)

五、BIBFRAME to MARC refined / Sally McCallum, LC NDMSO主任

2020-5-1,LC宣布提供新的BIBFRAME 2.0组件,用于将BIBFRAME数据转换为MARC。

特别说明与半年前ALA仲冬会议BIBFRAME更新论坛上Jodi报告中的2个变化(更新):

  • 没有007字段 -> 007字段添加007/00(资料类别)和007/01(特定资料标识)
  • 仅通用008字段 -> 添加特定媒介008数据
参见:
LC发布BIBFRAME到MARC转换(2020-5-6)
2020ALA仲冬会议BIBFRAME更新论坛(2020-2-11)

三、LD4P, LD4P2, LD4P3, and community / Philip Schreur, Stanford University

概述2016-2018年的LD4P和LD4L-Labs,2018-2020年的LD4P2(实施之路),以及最新的2020-2022年LD4P3(闭环 CLOSING THE LOOP)

LD4P3目标:发现;合作编目项目PCC的自维持数据池;扩展Sinopia;扩展质询规范;扩展合伙人培训计划。

参见:LD4系列

四、Shared Entity Management Infrastructure Project update / Chelsea Dalgord, OCLC元数据服务部产品分析师

共享实体管理基础设施项目的进展。基本情况可参见:OCLC获梅隆基金资助开发实体管理基础设施(2020-1-11)

项目计划交付:实体主干:数百万实体、永久URI;生产规模;生产基础设施;通过API访问搜索、读取、创建、更新;基本的用户界面。

对图书馆有什么好处:基于Web的发现结果;丰富的背景、联系材料和馆藏;数据品质;数据的机器可操作性和使用;跨馆藏和资料类型的元数据工作流程的一致性和效率。