UNIMARC书目和规范格式2020和2021修订

UNIMARC书目格式和规范格式最新版都是第3版,书目格式为2008年,规范格式为2009年,之后的更新在2012年首次发布(updates),自2016年起每年发布。之前更新都写了博文,昨天因故翻看博客,再查IFLA网站,发现2020-2021正常更新。

UNIMARC Updates

  • 大致看过,新增与更新主要在3方面:1)编码、代码及取值;2)专门附注;3)相关作品/内容表达。总体上有助于专指表达、抽取数据用于发现与关联等。
  • 书目格式:新增1个专门附注字段,半数更新在附录,与编码取值相关。
  • 规范格式:新增10个,包括更多编码数据字段(6个)、专门附注字段(3个)以及作品形式/体裁。更新也多在编码数据,以及相关检索点(链接相关的作品/内容表达)。

—— 2020-2021新增与更新 ——

UNIMARC Bibliographic (3rd ed.) Updates

  • 书目格式:2020年新增1处、更新6处(其中4处为附录代码);2021年更新4处(其中2处为附录代码)
  • 100 – General Processing Data (update 2020)【变化:Added related field information to $a/8-16 and $a/17-19. Updated table in $a/34-35. Errata / text edit (deleted FRBR align, no field 184)】
  • 110 – Coded Data Field: Continuing Resources (update 2021)【变化:Update and additions in $a/0】
  • 225 – Series (update 2020)(Update for multipart monographic resources【变化:scope, added $g and $z[y], notes, examples, related fields】
  • 231 – Digital File Characteristics (update 2021)【变化:New subfield $i 可访问性, correction Ex 6】
  • 346 – Note on Accruals and Frequency of Use (new 2020) 累积与使用频率附注
  • Appendix A – Source of Language Code / Sources of Codes (update 2020) (update 2021)
  • Appendix B – Relator Codes (update 2020) (update 2021)【误写作Appendix C】
  • Appendix G – Subject Systems Codes (update 2020)【网站文件链接有误,未看到原文】
  • Appendix H – Cataloguing Rules (update 2020)【网站文件链接有误,未看到原文】

UNIMARC Authorities (3rd ed.) Updates

  • 规范格式:2020年新增9处、更新5处;2021年新增1处、更新5处
  • 101 – Language of the Entity (update 2020)
  • 104 – Coded Data Field: Main Dates of Entity (new 2021)
  • 105 – Coded Data Field: Form of Notation of Expression (new 2020) (update 2021)
  • 127 – Coded Data Field: Duration of Sound Recordings, Visual Projections, Musical Compositions and Performances (update 2020)
  • 128 – Coded Data Field: Form of Musical Work and Key or Mode (update 2020)
  • 140 – Coded Data Field: Content and Form of Work (new 2020)
  • 145 – Coded Data Field: Content Type of Expression (new 2020)
  • 146 – Coded Data Field: Medium of Performance (new 2020)
  • 147 – Coded Data Field: Colour and Sound Content (new 2020)
  • Control Subfields (update 2020)
  • 333 – Users/Intended Audience Note (update 2020)
  • 334 – Awards Note(new 2020)
  • 371 – Note on Expression (new 2020)
  • 378 – Abstract of Work or Expression (new 2020)
  • 531 – Related Access Point – Title (Work) (update 2021)【相关检索点块2021更新多】
  • 532 – Related Access Point – Title (Expression) (Provisional) (update 2021)
  • 541 – Related Access Point – Name/Title (Work) (update 2021)
  • 542 – Related Access Point – Name/Title (Expression) (update 2021)
  • 608 – Form or Genre of Work (new 2020)

参见:

LC目录查BIBFRAME转换记录无果

今年年中看到BIBFRAME更新论坛又讲到“BIBFRAME 100”,即美国国会图书馆(LC)去年有100名编目员、每周2天、以BIBFRAME编目,2021年起改为全部350名编目员、每周5天、以BIBFRAME编目,并且不再做MARC记录,此100仍100%之意。

计算一下:350人*5天*25周/半年=43750人天

假定每人每天做3种,就会有13万条BIBFRAME记录,即使少至1种、也该有4万条以上。

由于LC并未更换系统,因此其目录中的新增记录应该都是由BIBFRAME转换而来的MARC记录。这些记录长什么样?是不是和BIBFRAME到MARC转换界面看到的一样?于是想查一下。

在BIBFRAME到MARC转换中,转换而成的MARC记录中有884字段(2015年新增),形如:

884 $aDLC bibframe2marc v1.1.0-SNAPSHOT $g20210619231058.0 $qDLC $uhttps://github.com/lcnetdev/bibframe2marc

用LC目录的专家搜索查这个特征,是不是可以找出来由BIBFRAME转换而来的记录呢?
于是到LC目录:

一、关键词搜索(专家搜索)Keyword Search (Expert) https://catalog.loc.gov/vwebv/searchKeyword

  • 884A bibframe2marc(Your search could not be processed as entered.)
  • K884 bibframe2marc(Your search could not be processed as entered.)
  • 说明884不可查。

二、再看搜索帮助:Search/Browse Help — Keyword Bibliographic Index Configurations https://catalog.loc.gov/vwebv/ui/en_US/htdocs/help/index_keyword.html

三、是真没有,还是查不到?再试着查2021年或2020年编制的记录(LCCN以2021或2020起始)。

  • 高级搜索,选择途径LCCN:
  • 2021(Your search found no results.)
  • 2020:2条(分别是010=2020,显然有误;010=2020938908)
  • 查其他年份,没有结果——结论:LCCN只能完全一致检索(2020年那条能搜索到的原因不明)

四、再查2021或2020年出版文献(008字段第1出版年),专家搜索:

  • 008D 2021(大多在版编目记录,有263字段计划出版日期)
  • 008D 2020(大多在版编目记录,有263字段计划出版日期;今天查在版编目记录明显减少)
  • 记录005或008字段显示2021年的,均未看到884转换字段。
  • 放弃。

今天与同行讨论此事,想起当初(2021-7-8)所写上述内容,放出。

个人猜测,LC当前的自动化系统在导入由BIBFRAME转换而成的MARC记录时,屏蔽了884字段,导致字段信息丢失?

参见:

LC联机目录的“专家搜索”(2015-10-6)

BIBFRAME/MARC数据双向转换程序更新(880字段消失)(2021-6-20)

884字段:描述转换信息(2015新增)https://www.loc.gov/marc/bibliographic/bd884.html

  • $a – Conversion process (NR) 转换处理(如: DLC bibframe2marc v1.1.0-SNAPSHOT)
  • $g – Conversion date (NR) 转换日期(yyyymmddhhmmss.X,如:20210619231058.0)
  • $k – Identifier of source metadata (NR) 来源元数据标识符
  • $q – Conversion agency (NR) 转换机构
  • $u – Uniform Resource Identifier (R) [转换程序]URI(如:https://github.com/lcnetdev/bibframe2marc)

《记录分面时间顺序数据最佳实践》(书目记录中作品和内容表达的日期)

ALA核心主题分析委员会(SAC)日前发布《记录分面时间顺序数据最佳实践》(1.0版),本版本在2020年0.9版征求反馈基础上修订完成。竟然长达43页,估计各种情况都可以找到示例。

记录分面时间顺序数据最佳实践(1.0版) / ALA核心主题分析委员会(SAC)分面词表分委员会(SSFV), 2021-6-11. https://alair.ala.org/handle/11213/16710

Best Practices for Recording Faceted Chronological Data in Bibliographic Records (Version 1.0) / Issued by the ALA Core Subject Analysis Committee (SAC), Subcommittee on Faceted Vocabularies (SSFV) ; Approved by SAC on June 11, 2021.  43 pages

本文档描述在书目著录中编码作品和内容表达日期的最佳实践。在MARC书目记录环境中,通过046字段(特殊编码日期)和388字段(创建时间段)实现。文档包括以下4个方面:

  • 1、单作品创建日期(创建日期=出版日期,创建日期<出版日期,大致创建日期,无准确日期时使用388字段)
  • 2、汇编中被汇总作品日期(046字段中特定日期vs不准确日期/含世纪,单个046字段中日期范围vs独立046字段,无准确日期时使用388字段,由记录中其他信息推断日期或大致日期)
  • 3、合集作品(汇编、选集等)创建日期
  • 4、内容表达日期(拍摄/播放日期)

【遵循LRM、合集略有不同理解】本最佳实践遵循《国际图联图书馆参考模型》 (IFLA-LRM) 中对“作品”和“内容表达”的定义。对于合集资源,本最佳实践主要与IFLA-LRM中描述的“汇编合集”子类型有关。 本文档中描述的单作品情况可能符合 IFLA-LRM 中描述的“并列”或“增强”合集;在这种情况下,046和/或388字段中描述的是主要作品。这一重点与MARC书目记录中的其他字段保持一致,这些字段类似地描述了此类资源中包含的主要作品/内容表达。

【目的:增加发现系统的时间分面】书目元数据中分面时间数据的存在,能促进发现环境中的许多潜在用途,本文档不假定任何特定的索引、显示和搜索/分面行为的规范集。事实上,开发增强功能的理由围绕分面数据,通常需要在给定发现环境中的书目记录中存在大量分面数据。希望这些最佳实践指南将通过鼓励在当前编目和回溯性工作中纳入时间数据的分面方法来加速这一临界质量。

以上译自导言。另外,SSFV表示:由于046字段有更新,计划继续修订,推荐使用新的 046字段第1指示符值的方法,以便对作品和内容表达的日期进行明确编码。

【046字段】原用于未能在008/06-14(出版日期)中表示的日期,比如公元前日期、错误日期等,换言之,转录文献显示的出版日期;其代码值与定义与008/06-14相同或对应,只是用子字段表示,方便计算机处理。046字段2021年更新有二,与LRM有关的是第1指示符,增加定义:1=作品,2=内容表达,3=载体表现。

【388字段】以文字/术语表示作品或内容表达的创建或起源时间段。388字段在2014年新增时就定义了第1指示符:1=作品创建,2=合集作品创建。除$a=术语,还定义有:$0=规范记录控制号或标准号,$1=真实世界对象URI,$2=术语来源,等。预设了关联数据环境中的使用。

参见:IFLA-LRM的“合集”(笔记)(2018-7-9)

—— 示例选 ——

【大致创建日期】(1.0版中例子,046第1指示符均为#未定义)

  • 046 ## $k [2015,2016]【=[2017 or 2018]】
  • 046 ## $k 197X【=[between 1970 and 1979?]】
  • 046 ## $k [1973..1984]【=[between 1973 and 1984]】
  • 046 ## $k 18【=19th century】

【无准确日期时使用388字段】(有或没有046字段)

  • 388 1# $a Elizabethan era
  • 388 1# $a Renaissance $2 lcsh【2个相同时代、不同称呼】
  • 388 1# $a American Civil War (1861-1865) $2 fast $0 http://id.worldcat.org/fast/1351658【有URI】

【被汇总内容日期】

  • 046 ## $o 1885 $p 1922 $2 edtf
  • 046 ## $o -05 $p -03【公元前世纪】