600字段含$t时,$0代表作品还是个人?(附:MARC21新增$1子字段)

MARC21中$0子字段是控制子字段,在很多字段中出现,其定义为“规范记录控制号或标准号”(可重复)
MARC 21 Bibliographic: Appendix A – Control Subfields
$0 – Authority record control number or standard number (R)
在字段开始先用括号加代码说明来源(规范记录的机构代码、标准号的标识符),如:
100 1#$aBach, Johann Sebastian.$4aut$0(DE-101c)310008891
100 1#$aTrollope, Anthony,$d1815-1882.$0(isni)0000000121358464
但是,(uri)目前省略(原因后述),如:
710 2#$aCalifornia Poets in the Schools (Project),$eissuing body,$epublisher.$0http://id.loc.gov/authorities/names/n85319780

BIBFRAME邮件组中,芬兰国家图书馆的Osma Suominen询问:600字段含$t时,$0代表什么?
600 field with $t: what does the $0 represent? (2017-11-27)
事情的起源是:有条MARC记录,有作品(名称-题名)作为主题(600$a$t),其中含有作者规范控制号($0),当用marc2bibfram2转换时,$0被当作了作品ID。因此Osma Suominen问,600字段含$t时,$0代表个人还是作品?
康奈尔大学的Steven Michael Folsom回复是:如果没有$t(名称)则$0关于“作者”;如果有$t(名称-题名)则$0指代“作品”,如果没有作品URI,字段中不应该有$0。700等也如此。

实际上更确切地说,以上$0子字段代表的是个人或作品的“(规范)记录”,而非个人或作品“本身”,后者由MARC21新定义的$1子字段表示。见MARC建议No. 2017-08,建议已于2017.8.7获批,不过MARC21标准网站中各字段尚未更新。

——— MARC建议No. 2017-08:用子字段$0和$1捕获URI ———
MARC PROPOSAL NO. 2017-08: Use of Subfields $0 and $1 to Capture Uniform Resource Identifiers (URIs) in the MARC 21 Formats

“转换MARC21到关联数据的实验建议,在MARC21中存储URI有很大好处。……对指代不同实体类型的URI使用不同MARC21子字段,是与关联数据对话的重要前提,建议细化$0定义,并新定义$1”:
$0原来的定义是:规范记录控制号或标准号。如果是URI,则用前缀(uri)表示。为更简便解引HTTP格式URI,现去除前缀(uri)(但其他号码仍然保留,样例见前)。
建议新定义$1作为真实世界对象(RWO,Real-World Object)URI,即$0为规范(记录)URI,而$1为Thing URI。涉及所有格式(书目、规范、分类、馆藏、社区信息)中大量与规范形式相关的字段。例子如:
600 00 $a Zeus $c (Greek deity)
$0http://id.loc.gov/authorities/names/no2014048635
$1 http://viaf.org/viaf/308237987

650 #0 $a Kindness
$0 http://id.loc.gov/authorities/subjects/sh85072376
$1 http://dbpedia.org/resource/Kindness
$1 http://www.wikidata.org/entity/Q488085

830 #0 $a Oxford history of art.
$0 http://id.loc.gov/authorities/names/n96099923
$1 http://viaf.org/viaf/184384669
$1 http://www.wikidata.org/entity/Q24039213

UNIMARC书目和规范格式2016修订发布

后知后觉,UNIMARC第3版(2008 & 2009)已在年末年初发布了2016更新,包括书目格式(2016年12月30日更新)和规范格式(2017年1月2日更新)。第3版之前有过一次修订,是为2012更新,参见:UNIMARC书目和规范格式2012修订发布(2014-7-21)

看了新增字段,发现2016更新解决了3个问题
1、记录RDA的内容/媒介/载体类型(书目)
2、个人名称,记录其 ISNI(国际标准名称标识)(规范)
3、揭示演员与所扮演的角色(书目)

UNIMARC Authorities, 3rd edition: UPDATES 2012 and UPDATES 2016
UNIMARC Bibliographic, 3rd edition: UPDATES 2012 and UPDATES 2016

规范格式有11个更新(包括对2012年更新或新增字段的更新)、1个新增。新增字段为010国际标准名称标识(ISNI)

书目格式有10个更新(包括对2012年更新或新增字段的更新)、7个新增。新增字段如下:
181、182、183:代码数据字段,内容形式、媒介类型、载体类型
203:(描述信息)内容形式和媒介类型
623、631、632:(主题)角色/人物、职业、职能

前4个字段与ISBD第0项对应,也解决了CNMARC采用RDA的主要格式问题
18X字段是代码、203字段是术语。根据说明,181-183可以用RDA(以$2子字段说明代码类型),使用MARC21的相应代码 。203只能用ISBD术语,但只有在不能根据181-183生成说明语的情况下才需要使用本字段——本来就是冗余信息,可以不需要人工重复录入,由系统转换生成即可。

623字段解决揭示演员与所扮演角色的关联问题。623为角色名(虚拟人物),通常与323演员表(附注字段)一同使用,并通过$6子字段关联7XX演员名。通过灵活使用子字段,可以处理角色在作品中改名(多个不同身份?)、多个演员扮演同一角色(如童年与成人)的复杂情况。

631职业、632职能,是对606论题主题的细化,揭示描述对象的职业与职能、活动等。定义有与其他6XX字段类似的子字段,如$x论题复分、$y地理复分、$z时间复分、$j形式/体裁复分等。

LC提供2500万书目记录免费批下载(附LC在Library.Link)

2017年5月,美国国会图书馆(LC)宣布免费提供2500万条书目记录批下载。时间段为1968-2014年,应该就是2014年前LC制作的所有MARC记录。很多年前LC的书目记录就可以通过Z39.50逐条获取,但批量数据以前是付费订购的。虽说“主要供研究与开发利用”(MARC Open-Access),但因为并未限制使用目的,估计很多书目服务商听到消息第一时间就去下载备用了。
根据LC网站的 MARC Distribution Services (data set) 网页上的FAQ说明,本次免费提供的数据截止到2013年12月,以后可能每年更新。订购数据则更及时,目前截止2015年12月底,同时提供每日、每周更新。
开放MARC数据的目的是希望书目数据得到原有目的之外的、更广泛的利用。LC采访与书目访问部主任Beacher Wiggins在报道中说:“为了更有效的信息分享、更方便可视化与其他不可预知的分析,我们希望社会科学家、数据分析师、开发者、统计学者及其他人在工作中使用数据,对大数据集做创新工作,强化新知识的学习与生成”。
via Fortune: The Library of Congress Just Made 25 Million Records Available for Free (2017-5-17)

——— Library.Link中的LC书目数据 ———
今天看到Library.Link中,对LC书目记录经关联数据转换后发布。LC宣布开放数据是2017-5-17,数据被载入Library.Link是2017-6-12,发布是2017-6-15,可谓反应迅速。不知道是不是最早的公开发布应用。
关于Library.Link,参见:2016 ALA年会BIBFRAME更新论坛(2016-8-27)

LOC.Library.Link
LC像其他加入Library.Link的图书馆一样,有一个主页。如果有帐号,可以看访问统计。
右栏是“资源”,即由MARC记录转化后的Bibfra.me类(共16个)及数量,字顺排列:
Agent 2338223
Collection 667912 (由相关题名字段转换而来?)
Concept 6546780
CopyrightEvent 564
Family 25860
Form 9336
Instance 12898932
Meeting 228118
Organization 1200225
Person 4891149
Place 634135
ProviderEvent 6005730
Series 958273
Temporal 8906
Topic 303503
Work 13649505

每次在新形态下看发布的书目数据,总不免看到一些原本埋没着不知道的原始数据错误,如以前看分面OPAC,现在看关联数据。选择“个人”随意浏览,本当为人名,但排序在前几页的都是非字母开头的(标点符号、数字),有些可能是非拉丁字母转化的字符问题,还有相当部分应该是原始数据有问题。
比如有个”16 juli 1993″,根据题名返回到LC目录查原记录,LCCN=94124897(https://lccn.loc.gov/94124897),果然有:
7001_ |a “16 juli 1993.”
本书1993年出版,可能把500误作700了。

接下来还有不少以冠词A起始的,很有意思,比如:A 1st class boy, A British officer, A Californian, A lady of this city …
比如:A lady of this city
LC目录中查到原记录LCCN=16009701(https://lccn.loc.gov/16009701)
245 04 $a The life of the beautiful and accomplished danseuse, Mademoiselle Fanny … $c … Selected and comp. by a lady of this city.
700 0# $a A lady of this city.
原来还有这样直接用题名页上称呼做个人名称检索点。