MARC21准备弃用ISBD标点

本人做编目始于西编,后来学机读目录也是从MARC21开始,一直觉得MARC21(或者说LC的做法)比CNMARC好,相信要做书目FRBR化的会认同。但对MARC21最不以为然的,是其大量使用ISBD标点,并且需为字段末要不要那个“点”这样无聊的事费神。很赞德国,转用MARC21时决定不使用字段/子字段末的ISBD标点,为此MARC21头标第18位在2010年新增代码c(省略ISBD标点)。
2010年使用RDA后,美国国会图书馆的“政策声明”中还为MARC记录中的那个点留有位置,看到觉得很无语。但实际上,美国人按规则行事,也在准备改变,只是动作有点慢。2011年3月,合作编目计划成立“PCC ISBD和MARC任务组”研究此问题,当年9月完成提交最终报告,但没有下文。2015年12月任务组被再次召集,从转换操作角度重新组织最终报告。2016年10月,完成《PCC ISBD和MARC任务组(2016年修订最终报告)》。相应地在2016年6月MARC21修订中,头标第18位再新增代码n(省略非ISBD标点)。详见:
《PCC ISBD和MARC任务组(2016年修订最终报告)》Revised Final Report, PCC ISBD and MARC Task Group(86页)

本报告内容涉及省略ISBD标点修改相应的MARC21子字段两方面,子字段变化借鉴UNIMARC之处不少。建议是首先实施停止使用字段末尾句点、停止使用与MARC 21编码相对应的分隔标点(即有子字段,则省略相应的冗余标点)。报告提出一年多后,PCC终于准备好对此报告的建议进行测试。已由LC、NLM和OCLC各提供一套去掉了部分ISBD标点的书目数据集,供图书馆、厂商等下载测试并提供反馈,测试截止日期2018.7.1。之后将进行评估,再决定是否改变现有做法(停用ISBD标点)。
测试公告(含说明及数据下载):Record sets for testing limited ISBD punctuation
测试调查(反馈):PCC ISBD Punctuation Test Record Survey

报告说,“在MARC记录中省略ISBD标点是世界各地使用的其他MARC格式的通行做法”(1.5 目标)——看到这句,不免脑补说服守旧编目员的场景。接下来报告自问自答(1.6 MARC的未来):既然都要放弃MARC了,为啥还要费力改变目前的做法,甚至还涉及修改MARC21?因为转到BIBFRAME还要很久,期间需要软件在两个格式间来回转换,忽略标点可以简化加上标点、除去标点这样的编程工作。
去除ISBD标点,无疑将减少编目员无效劳动。但报告中有很大部分是对MARC21格式的修订,如果采用修订建议,则编目员需要再培训,对新增子字段也会有一个适应期。如果用程序对已有数据进行处理,将原来多义的子字段用新增有明确含义的子字段来替代,会简化未来转换到非MARC环境。不过,如果程序能够解决,大可到时再处理。或许这是报告初稿拖了多年没有付诸实施,而目前只对修订报告的去标点部分进行测试的原因吧。
报告中提到,任务组有一位成员认为不值得花时间费用修改MARC21格式、除去标点,而应该直接采用MARC替代品(1.6 MARC的未来)。但我觉得,在MARC被取代前,先不用ISBD标点,可以省掉编目员很多无效劳动,还可简化培训。CALIS联编中心在更新编目员考试试题库时不再有涉及ISBD标点的选择题,但原编时标点不符合规定还是要扣分的。

Via BIBFRAME Listserv. Testing use of limited ISBD punctuation in bibliographicrecords / Lori Robare (2018-2-7)

参见:
ISBD著录用标识符有何用?(2008-10-2)
【书蠹精的博客】关于ISBD著录用标识符答编目精灵问(2008-10-25)

——— 《PCC ISBD和MARC任务组(2016年修订最终报告)》目次———
1 – Pre-ISBD/ISBD Punctuation and MARC 21(历史回顾:前ISBD/ISBD标点和MARC21)
2 – Terminal Periods in Bibliographic and Authority Records(书目和规范记录中的结束句点)
3 – Fields Requiring Editorial Changes to MARC 21(仅需忽略ISBD标点的字段)
4 – Fields Requiring Substantive Changes to MARC 21(需实质性改变的字段)
5 – Access Point Fields Requiring Substantive Changes to MARC 21 Bibliographic and Authority Formats(需实质性改变的检索点字段)
第3-5部分,逐个列出有标点变化的字段,变化前后对照样例,忽略的标点为红字,很醒目。同时提供MARC21及相应ISBD、UKMARC、UNIMARC链接。第4-5部分,还涉及子字段本身的变化,包括:修改定义、新增(代替相应的标点)、改为可重复(标点改为重复子字段)。子字段变化借鉴UNIMARC之处不少。
Appendix A – Fields Which Require No Punctuation and Coding Changes(无需改变字段表)
Appendix B – Summary of Recommended MARC Coding Changes for Bibliographic Records(书目记录建议修改字段/子字段一览)
Appendix C – Whole Record Examples(整条记录对照样例)
附录C样例:共9条,按AACR2编目的图书、计算机文档、连续性资源、地图、乐谱、录音、音像各1条,按更早条例及RDA的图书各1条。
Appendix D – Specifications for Removal of Punctuation in Bibliographic Records(删除书目记录中标点规范)

创制和获取URI的常用词表和参考源指南

应用关联数据,并不是简单地把数据以三元组形式发布。要能使发布的数据相互关联,在数据中采用或关联已有URI/IRI是很重要的工作。美国合作编目项目(PCC)MARC中URI工作组在2018年2月14日发布了一份文档《创制和获取URI:常用词表和参考源指南》,总结了40个图博档领域常用的词表和参考源的信息。自然以英语为主,但从图示看有些有中文(如《艺术和建筑叙词表》AAT、联合国粮农组织《多语种农业叙词表》AGROVOC)。中文开放资源总体上不多,如果也能参照总结一个,会是很有益的工作。

创制和获取URI:常用词表和参考源指南 FORMULATING AND OBTAINING URIs: A GUIDE TO COMMONLY USED VOCABULARIES AND REFERENCE SOURCES / Prepared by the Program for Cooperative Cataloging Task Group on URIs in MARC. Version Date: 2018-02-14

文档称,“MARC最近开发了一种机器可操作的方式,指定规范URI或规范所描述事物URI(https://www.loc.gov/marc/mac/2017/2017-08.html),但填充这些子字段的实践是新生的”。所说的机器可操作的方式,指MARC21分别为实体描述和实体本身(真实世界对象,RWO)定义了不同的子字段:
$0 Authority record control number or standard number
$1 Real World Object URI (R)(新增)
参见:600字段含$t时,$0代表作品还是个人?(附:MARC21新增$1子字段)(2017-12-4)
其中实体描述通常是各种书目和规范记录,当然还有图书馆界之外的描述记录;而实体本身及其URI,对编目而言完全是新概念,如何获取更是新挑战。

本文档把数据源分为2类,第1类是关联数据资源,共28项;第2类是具有控制号或其他标准标识符但未发布为RDF的数据源,共12项。不知道是不是因为这些资源太过有名,所有40个资源都没有介绍收录内容或范围。
每个资源列出的具体信息,第2类比较简单,基本只有名称、最后查看日期和主页(网址),仅其中的IMDb还列出了联系信息、使用限制及图示。第1类则有与使用有关的详细信息,除前述IMDb所列各项外,还包括:建模(基于SKOS的较多),存放URI的MARC子字段($0记录、$1实体、$4关系词),创建或获取URI方法与样例、截屏图示、API或Web Services或批下载、查询获取URI样例等,数据版本/更新频率、使用者(多为空)、工具(多为空),其他(相关资源,偶有)。
以下按大致内容对2类资源重新排列(有$0 $1 $4的为关联数据资源):

艺术
AAT – Art & Architecture Thesaurus($0)
TGM – Thesaurus for Graphic Materials($0)

音乐
AllMusic 音乐
Discogs 唱片
LCMPT – Library of Congress Medium of Performance Thesaurus($0)
MusicBrainz – The Open Music Encyclopedia($1)

影视戏剧
AllMovie
BFI – British Film Institute
IBDB – Internet Broadway Database
IMDb – Internet Movie Database

游戏
GAMECIP Computer Game Media Format Vocabulary($0)
GAMECIP Computer Game Platform Controlled Vocabulary($0)

地理
Canadian Geographical Names
GNIS – Geographic Names Information System,GeoNames($1)
TGN – Getty Thesaurus of Geographic Names($0,$1)

个人团体
ISNI – International Standard Name Identifier($1)
Legal Entity Identifier 企业标识号
ORCID($1)
ResearcherID
Scholar Universe
ULAN – Union List of Artist Names($0,$1)
VIAF – Virtual International Authority File($1)

农业:AGROVOC($0)
医学:MeSH RDF- Medical Subject Headings RDF($0)

综合
BBC Things($1)
CERL Thesaurus($1)欧洲1450-1830年间地名、人名
DBpedia($1)
GND – Gemeinsame Normdatei (Integrated Authority File) 德国国家图书馆规范档($0主题,$1会议或事件、团体、家族、个人、地点或地理名称、作品)
LC/NACO Authorities($0规范,$1 RWO)
Library of Congress Authorities
Wikidata($1)

综合(主题词表/元数据词表)
FAST – Faceted Application of Subject Terminology($0),
LCSH – Library of Congress Subject Headings($0)
LC Children’s Subject Headings($0)
LCDGT – Library of Congress Demographic Group Terms($0)
LCGFT – Library of Congress Genre/Form Terms($0)
MARC Relator Terms and Codes($4)
RDA Vocabularies($0取值,$4元素)
RBMS Controlled Vocabularies($0)珍本与特藏编目用受控词表

UNIMARC书目和规范格式2017年修订发布

UNIMARC加快了更新的步伐。第3版书目格式发布于2008年、规范格式发布于2009年,第1次更新2012年,到2014年才发布(RDA课题2013年结项时盼望而未等到);第2次更新2016年,当年底、次年初发布;今天发现IFLA网站已经有了2017年更新(网页更新于2017-10-30),看说明似乎以后会每年即时发布更新。

UNIMARC Bibliographic, 3rd edition (with updates)
UNIMARC Authorities, 3rd edition (with updates)
书目格式有19处更新,其中新增4个字段;规范格式有4处更新,其中新增1个字段。新增字段如下:

017 – Other identifier 其他标识符(书目、规范)
(书目)不适用其他字段的单件标识符。是用于标识单件的唯一、永久、国际认可的字母数字代码。没有举例。
经查2008年版有此字段,名为Other standard identifier,原定义中“标准号或标准码”现改称“标识符”。
对应MARC21的024字段Other Standard Identifier(1993年增加字段)
(规范)不适用其他字段的、与2XX字段命名实体相关的标识符。参考:2016年新增010 ISNI。1个例子,ORCID号
017 7# $a0000-0002-8038-722X$2orcid

231 – Digital File Characteristics(书目)
可重复。也可记录在215$c。可以采用不同来源术语。以下为例6,分别采用RDA和Wikidata术语(没有举ISBD术语的例子):
231 ##$aImage file$2rda
231 ##$bQ2195$e3 Mo$2wikidata
对应MARC21的347字段(2011年新增)

283 – Carrier Type(书目)
2016年新增181-183代码字段,分别对应ISBD0的内容形式、媒介类型和载体类型;又定义了203内容形式和媒介类型,使用相应的术语,分别与181和182配套使用。此次补上了与183配套使用的283。
203字段没有定义$2来源,举例用的是ISBD术语。此次几个例子都是用的RDA而非ISBD术语,或可预计203字段也将增加$2来源。例2:
183 #0$8main part$asd$2rdacarrier
183 #0$8liner notes$anb$2rdacarrier
283 ##$8main part$aAudio disc$2rdacarrier
283 ##$8liner notes$aSheet$2rdacarrier
对应MARC21的338字段(2009年新增)。MARC21用336-338同一个字段记录代码和术语,UNIMARC用2个字段,记得2012更新时曾经讨论过,不知最终的决定是出于何种考虑。

338 Funding Information Note(书目)
资助项目信息。对应MARC21的536字段(原有字段)。

参见:
Publications from UNIMARC
UNIMARC书目和规范格式2016修订发布(2017-7-31)
UNIMARC书目和规范格式2012修订发布(2014-7-21)