EDTF:扩展日期时间格式

如果在元数据中看到日期为2020-41,会不会感到很晕?是不是弄错了?并没有!这个日期表示的就是当下:2020年下半年。

编目或元数据描述中涉及时间的,通常推荐采用国际标准的日期时间格式ISO 8601,MARC21中常使用美国国会图书馆的扩展日期时间格式(EDTF)。EDTF基于ISO 8601,在2012年发布草案,当前版本发布于2019-2-4。

制定EDTF的背景(EDTF – Background),首先是当时的ISO 8601-2004不足以表达很多应用需要的语义限定与概念,需要加以扩展,例如大致年份(如可能是1984年)。其次是ISO 8601作为国际标准,在很多情况下提供多种格式供选择,实际使用时需要选定、即限制到一个更小的支持集。

ISO 8601-2019基本集成了EDTF扩展的功能,但由于后一原因,现在编目中仍使用EDTF而不是直接使用 8601。换言之,在8601有多个选项时使用EDTF的选项,基本上可以认为现在的EDTF是8601的子集。

Extended Date/Time Format (EDTF) Specification

EDTF采用8601的“扩展格式”(而非“基本格式”)。扩展格式的基本形式是:日期以-分隔,时间以:分隔。(不用分隔符的是基本格式)

日期时间是一个不带空格的字符串。以下概述用到的其他符号、摘取某些数字代码以及常用样例,完整的可查EDTF规范本身。

(一)T 连接日期和时间;Z 世界标准时间(UTC);+或- 比UTC早或晚

1985(年);1985-04(月);1985-04-12(日)。
1985-04-12T23:20:30(本地时间);1985-04-12T23:20:30Z(世界标准时间);1985-04-12T23:20:30+04:30(比UTC早4个半小时)。

(二)表示一年中时间段的数字,除1-12表示月份,21-41分别表示4个季节、4个季度、3个四月期、上下半年。常用的如下:

21-24 春夏秋冬;33-36 第1-4季度;40-41 上下半年
2001-21(2001年春天);2001-34(2001年第2季度)

(三)时间不确定

(1)? 与年连用,~ 与月连用,% 与日连用(符号在数字右边,表示之前整个串不确定;符号在数字左边,表示本段不确定)

1984?(年不确定);2004-06~(年月不确定);2004-06-11%(年月日不确定);
2004-06~-11(年月不确定、日确定);2004?-06-11(年不确定、月日确定);
?2004-06-~11(年日不确定、月确定);2004-%06-11(月不确定、年日确定)。

(2)X 任何年、月、日值的末若干位(不能是单个值的中间位)

201X(2010年代);20XX(21世纪);2004-XX(2004年某月);1985-04-XX(1985年4月某日);1985-XX-XX(1985年某天);
156X-12-25(1560年代某个耶诞日);XXXX-12-XX(某年12月的一天);1XXX-12(11世纪后某个12月);1984-1X(1984年10-12月)

(四)/ 起讫时间;空或.. 时间未知或不确定。起始或结束时间可以用以上(一)(二)(三)表示:

1964/2008(起讫年);2004-02-01/2005(起始日/结束年)
1985-04-12/.. 或 1985-04-12/(结束日期未知或不确定);../1985-04 或 /1985-04(开始月份未知或不确定)
2004-06-~01/2004-06-~20(大约2004年6月1-20日);2004-06-XX/2004-07-03(2004年6月某日到7月3日)

在书目记录中记录作品创作年代

《书目记录中记录分面年代数据的最佳实践》2020-6-19发布0.9版。目前正征求意见(发送到SSFV主席Casey Mullin的邮箱caseymullin1@outlook.com,截止期2020-8-31),之后将定稿发布1.0版。

本最佳实践由美国图书馆协会/图书馆馆藏和技术服务协会/编目和元数据管理部/主题分析委员会/分面词表分委员会(ALA/ALCTS/CaMMS/SAC/SSFV)撰写,具体操作者是SSFV年代任务组成员……在我看来,这一长串机构名显示的是积极参与的专业精神,让我想到大狗小狗都要叫!(绝对不是贬义,如同说孔子是丧家犬!)

Best Practices for Recording Faceted Chronological Data in Bibliographic Records / Issued by the ALCTS CaMMS Subject Analysis Committee (SAC), Subcommittee on Faceted Vocabularies (SSFV). Version 0.9. Approved by SAC to release for broader community feedback on June 19, 2020. URI: http://hdl.handle.net/11213/14591

本最佳实践的目的是推广在书目记录中包含作品/内容表达的创作年代(不同于出版年代或作品描述的年代),以期为发现系统增强功能、增加作品年代分面提供基础数据:“书目元数据中分面年代数据的存在,促进发现环境中许多潜在用途……实际上,开发围绕一般分面数据的增强功能,要求在给定发现环境的书目记录中必须存在大量分面数据。希望这些最佳实践指南,通过鼓励在当前编目和回溯工作中纳入年代数据的分面方法,能够促进这一临界质量。”文件最后有附录“显示和索引分面数据:书目”,如作相关研究可参考。

具体说,本文件介绍如何采用MARC21中已经定义的046和388字段,来表达创作年代,不涉及作品主题的年代(6XX字段)。

针对FRBR/LRM的作品和内容表达的创作年代分成四类,独立作品汇编中被汇总作品汇总作品(汇编、选集等)和内容表达,分别详述如何确定创作年代,以及046、338字段的使用。以下摘取若干样例,略述字段的使用:

一、046 (Special Coded Dates) (R) 特定编码日期

046字段有不同子字段,记录各种日期信息,本文件采用与资源被修改或创建日期相关的子字段。以编码格式表示

指示符1和2均未定义。
$k 起始创作日期或单个创作日期(NR)
$l 结束创建日期(NR)
$o 合集内容的单个或起始日期(NR)
$p 合集内容的结束日期(NR)
$2 日期来源。指日期格式代码,无$2表示采用默认格式(ISO 8601)
EDTF(Extended Date and Time Format,扩展日期和时间格式,LC以ISO 8601为基础扩展的格式)
例:046 ## $k 2002 $o 1660 $p 1810 $2 edtf
(创作于2002年的汇编作品,包含1660-1810年间创作的单部作品;日期为EDTF格式)

二、388 (Time Period of Creation) (R) 创作时间段

作品或内容表达的创作或起源时间段,包括汇编中的作品或内容表达,以术语(文字)形式表达,与046编码配套使用。

第1指示符 时段类型:# 无信息提供,1 创作作品,2 创作合集作品;第2指示符 未定义。
$a 创作时间段术语(R)(受控/非受控术语)
$0 规范记录控制号或标准号(R)($a记录术语的规范记录标识符、含URI)
$1 真实世界对象Real World Object URI (R)(年代实体的RWO URI)
$2 术语来源(NR)($a受控术语来源代码)
$3 特定资料(NR)(标识本字段所应用的被描述资料的部分)
例:388 1# $a Middle Ages $2 lcsh
(中世纪创作作品。采用LCSH术语)
例:388 1# $a Cultural Revolution (Chinese history, 1966-1976) $2 iconauth
(文革期间创作作品。采用Getty Iconography Authority术语)
例:388 1# $a Han Dynasty (China) $2 fast $0 http://id.worldcat.org/fast/1696746 $1 http://www.bbc.co.uk/things/3bd616ba-2bde-4dd3-b636-f88c91c1a128#id
(汉代创作作品。采用FAST术语,有FAST控制号URI和BBC事物URI。
例:388 1# $a Regency era $1 http://www.wikidata.org/entity/Q25861
388 2# $a Edwardian era $1 http://www.wikidata.org/entity/Q185852
(爱德华时代汇编,由摄政时代创作作品组成。2个术语均非控,但有Wikidata的RWO URI)

三、045 – Time Period of Content (NR) 内容的时间段

见于旧MARC记录,不同类型文献采用不同日期格式。从举例看,多与6XX配套使用。在本最佳实践中不推荐

LC发布BIBFRAME到MARC转换

LC在2017年发布了MARC到BIBFRAME转换,包括转换规范、转换程序及转换结果对照查看工具。参见:MARC到BIBFRAME转换:并列比较工具(2017-4-7)

2020年4月底,LC发布了BIBFRAME到MARC转换,同样包括转换规范、转换程序及转换对照查看工具:New BIBFRAME-to-MARC Conversion Tools

BIBFRAME到MARC转换,是已持续多年的BIBFRAME 2.0试验的一部分。转换规范与程序由LC网络开发与MARC标准办公室委托Index Data公司开发,基于MARC到BIBFRAME转换规范,LC方面提供指导。转换规范以EXCEL格式提供,共15个按MARC字段组织的文档。转换程序在LC的Github页面提供。

—— 转换中所用MARC约定 ——

BIBFRAME到MARC转换中,偶尔需要做选择。同时LC在BIBFRAME数据中广泛使用URI,希望避免丢失在MARC描述版本中的URI。因而遵循以下约定。【本人注释】

  • 转换008和007/00和/01,尽管在可以记录其取值的URI时,也同时在格式的其他位置重复。
  • 对数据在MARC中会有多个位置的情况,通常只选择一个。【除以上008、007外,数据不重复】
  • 对MARC允许可选的数据,必须作出选择。例如,对包含非拉丁字母数据的记录,选择模型B【简单多文字记录】而非模型A【原文字+音译】(多文字记录)。因此记录中不使用880字段。非拉丁字母数据将在正常字段出现,较少非拉丁字母数据的音译。【不采用880字段】
  • 对LCSH主题标目,整个字符串的URI在字符串之前,而组成部分的URI在其适用的组成部分之后。
  • 如果在相应的BIBFRAME元素中不带标点,则不会在子字段边界插入标点。【省略ISBD标点】
  • URI放在MARC$0子字段中。【默认为$0(规范记录控制号或标准号)而非$1(RWO真实世界对象URI)】

—— 转换对照查看工具 ——

BIBFRAME到MARC的转换对照查看工具(Compare BIBFRAME back to MARC

MARC到BIBFRAME的转换对照查看工具(Compare MARC converted to BIBFRAME

两者版式与使用方法一致,即通过LCCN或书目记录号查找记录,左侧为来源格式、右侧为目标格式。

目前BIBFRAME到MARC的默认样例是LCCN=2018958785的记录(Bibframe2Marc),看右侧由BIBFRAME转换成的MARC记录,不禁好奇同样记录在MARC到BIBFRAME转换中会是一样的吗(Marc2Bibframe)。比较下来不一样的,见以下由BIBFRAME转换的MARC记录【及本人注释】

     nam a22     5i 4500【头标:17位编码级别5=部分级,此记录为计划出版/CIP记录;18位描述编目规则i= 含ISBD标点,从记录看并未采用ISBD标点,当取c=省略ISBD标点】
001    20674836
003    DLC【原生MARC记录中无003,默认DLC】
005    20180919121044.0
008    180919s2019    nyu   00| |eng |【原生MARC记录中不用“|”而用“0”或空】
010    $a  2018958785
020    $a9781419738074
040    $aDLC$beng$cDLC$eisbd$erda【不知是否因头标18位=i而有$eisbd?在当前编目实践中,即使含ISBD标点,也不用$eisbd】
042    $apcc
100 1  $aLondon, Kaye.$4http://id.loc.gov/vocabulary/relators/ctb【原生MARC记录无责任方式,添加$4“关系”而非RDA编目通用的$e“关系词术语”。MARC21标准的中有一例https://www.loc.gov/marc/bibliographic/bd100.html:100 1#$aBach, Johann Sebastian.$4aut$0(DE-101c)310008891】
245 10 $aCovered in crochet$bstylish crochet projects and ideas to yarn bomb your life$cKaye London ; [edited by] Meredith Clark【子字段末尾没有ISBD标点】
264  1 $ahttp://id.loc.gov/vocabulary/countries/nyu$c2019【增加出版地URI,原生MARC记录无】
264  1 $aNew York, NY$bAbrams$c2019
300    $apages cm【没有页码、尺寸,表明为CIP数据;原生MARC记录有263字段=1909,即计划2019-09出版。经查转换规范,没有263字段】
336    $atext$0http://id.loc.gov/vocabulary/contentTypes/txt【原生MARC记录没有用$0URI,使用$b代码和$2来源】
337    $aunmediated$0http://id.loc.gov/vocabulary/mediaTypes/n【同上】
338    $avolume$0http://id.loc.gov/vocabulary/carriers/nc【同上】
884    $aDLC bibframe2marc v1.0.0 $g20200430171644.0 $qDLC $uhttps://github.com/lcnetdev/bibframe2marc【原生MARC记录没有的字段:884描述转换信息,共5个子字段:$a转换过程,$g转换日期,$q转换机构$uURI,没有使用$k来源元数据标识符】