IFLA图书馆参考模型中的Nomen实体(附LRM成为IFLA标准)

——— 引言:LRM成为IFLA标准 ———
IFLA图书馆参考模型(FRBR-LRM / IFLA-LRM),在2016年上半年征求全球评审。正式版未能在2017年初如期发布,然后到5月先期发布了3月版(IFLA Library Reference Model (LRM) – March 2017 version – available),等着今年年会期间获批。8月18日,IFLA专业委员会终于通过,与其他几个编目相关文件一起公布成为IFLA标准。
IFLA Library Reference Model (LRM)
日前在IFLA网站发布的8月版(网页8月17日更新),封面仍注明等待批准,只是日期由3月改成了8月。
这几天正好在看3月版。没有逐一比对,只发现 Table 4.3“属性/特性等级”中遗漏的 LRM-E9-A1(名称)类别,在8月版中仍然遗漏。

参见:
FRBR家族新进展:LRM 2017年3月版、IFLA标准PRESSoo 1.3发布(2017-5-25)
《FRBR图书馆参考模型》评审反馈(2016-5-7)
《FRBR图书馆参考模型》全球评审(2016-2-29)

——— Nomen的起源 ———
在《书目记录的功能需求》(FRBR)中,原本是没有Nomen(名称)实体的,Nomen是在《主题规范记录的功能需求》(FRSAD)中引入的。
主题在FRBR中定义为第3组实体,有4个:概念、实物、事件、地点(一直被诟病缺少时间)。当然主题也可能针对第1组4个实体和第2组3个实体——《规范记录的功能需求》(FRAD)增加了家族实体。
FRSAD建模时,抛弃了FRBR/FRAD定义的所有实体,引入更高层的新实体,采用拉丁文标识:主题Thema,以及其名称Nomen。
LRM作为FR家族的统一版,保留了Nomen实体,将其扩展为所有实体的名称。在LRM中,名称本身是“实体”,而不是其他实体的“属性/特性”(Figure 4.1)。实体的实例由名称来指代,但名称并非实例本身(4.1.3)——比如个人及其称呼,是2个不同的实体(的实例)。
与此同时,无所不包的Thema实体似乎变成了模型中的顶层实体Res(资源)——如此说来,似乎是FRSAD模型构成了整个LRM的底层结构。LRM没有对实体分组,也没有针对主题的实体,泛化的主题在LRM中通过Work(作品)实体和Res实体之间的一对互逆“关系” has as subject / is subject of 来表示,表示方法与FRBR(Figure 3.3)作品与三组实体间的主题关系 has as subject 相同。

——— 实体 LRM-E9 Nomen 名称 ———
以下摘录LRM中与Nomen有关的内容,基于2017年3月版【略有标注】。

Nomen定义:实体与指称它的称呼之间的关联

Attribute 特性/属性(9个:类别、Nomen字符串、方案、目标受众、使用情境、参考源、语言、文字、文字转换)
LRM-E9-A1 Category 类别。3种类型:1 被命名事物的种类(个人名称、作品题名等);2 名称被证实的来源(书脊题名、逐页题名等);3 名称的功能(标识符、受控检索点、分类号等)
LRM-E9-A2 Nomen string Nomen字符串。可以用任何形式的符号表示,如书写系统中的符号组合、化学结构符号、数学符号或其他任何类型的符号,如声音等。
LRM-E9-A3 Scheme 方案。2种编码方案:1 值编码方案(主题词表,叙词表,分类法,名称规范表等);2 语法编码方案(日期编码标准等)
LRM-E9-A4 Intended audience 目标受众【样例:特定年龄层次、特定语言对象】
LRM-E9-A5 Context of use 使用情境【领域?样例中取值有:文学作品,评论作品,数学作品,侦探小说】
LRM-E9-A6 Reference source 参考源。类别:1 传记辞典、百科全书等;2 其他方案;3 任何出版物;4 等等【样例为规范记录,MARC 21用670字段,UNIMARC用810字段】
LRM-E9-A7 Language 语言
LRM-E9-A8 Script 文字
LRM-E9-A9 Script conversion 文字转换

Relationship 关系(5个,有互逆关系:称谓、分配、等同、部分、派生)
LRM-R13 RES has appellation NOMEN 称谓(一对多,互逆关系 is appellation of)【各种变异名称】
LRM-R14 AGENT assigned NOMEN 分配/赋值(一对多,互逆关系 was assigned by)。在书目情境中,名称的赋值【机构】适用于主题词、受控检索点、标识符等的创建。
LRM-R15 NOMEN is equivalent to NOMEN 等同(多对多)。两个名称是同一Res的称谓【多个名称指代相同资源】
LRM-R16 NOMEN has part NOMEN 部分(多对多,互逆关系 is part of)。一个名称是使用另一个名称作为组件构造的【部分的样例:个人名称中的姓氏;个人规范检索点中的生卒年】
LRM-R17 NOMEN is derivation of NOMEN 派生(多对一,互逆关系 is derivation of)。一个名称被用作另一个名称的基础,两者都是同一资源的称谓【派生出来的样例:首字母缩略词;基于编目规则的作品规范检索点】

5.4 图书馆情境中的Nomen
在图书馆情境中,个人、集体代理(如家族和团体)或地点的Nomen传统上称为名称(Name),作品、内容表达和载体表现的Nomen称为题名(Title),而用于主题情境中的资源Nomen以不同方式称为术语、叙词、主题标目和分类号
标识符是一种Nomen类型,其目的是在特定的应用领域中具有持久性和唯一性……。标识符通常由规范分配机构根据商定的规则分配。分配机构的实例包括但不限于 ISO 标识符的登记机构、为公民和居民提供标识符的国家政府。标识符系统的范围可能很广(如 URI)或高度专门化(特定作曲家作品的目录编号)。
在图书馆信息系统中,受控检索点是一种Nomen,传统上被分配用于为个人、集体代理(即家族和团体)、作品和内容表达提供搭配【名称】,以及作为其他实体用作“has as subject”关系的对象【主题】。
在当前的图书馆实践中,名称规范记录通常是为每个具有书目重要性的Nomen群集创建的【只对部分实体做规范记录】,它们指代实体的同一实例,并同时记录表示检索点的首选形式(一个Nomen)的Nomen字符串和对应于任何变异检索点或标识符(附加Nomen)的Nomen字符串。虽然规范记录控制Nomen,但作为Nomen所指代实体的实例的快捷方式信息,通常与有关Nomen的信息记录在同一规范记录中,从而模糊了实体资源和Nomen之间的区别。目前图书馆实践中使用的各类规范记录的建模是相当复杂的,超出了本模型的范围。

ORCID 2017上海研讨会:笔记与联想

本着了解ORCID应用进展的想法,报名参加了 ORCID 2017上海研讨会。参会者以图书馆界为主、出版界次之,研究人员/科研管理只占很小部分,并且这小部分似乎下午都已不在场。
1、ORCiD /ɔ:kid/
拼单词就out了。官网Logo中间有个小写,但文字中通常全大写。

2、这是ORID首次在中国大陆召开的会议,有从北京来参会的出版界人士。据ORCID中国区总监胡昌杰介绍,大陆注册人数估计35万(根据机构邮箱、国内常用邮件服务),仅次于美国。机构会员情况:
大陆4家(清华大学,中科院文献情报中心,中科院高能物理研究所,中国农业科学院)
香港7家(8所大学中除香港科技大学)
台湾9家(未列出)

3、中科院文献情报中心曾有 iAuthor.cn 网站提供ORCID注册(“中国科学家在线”平台正式上线,2014-10-30),已是过去完成时(今天发现网站无法访问、烂尾了)。
如果个人需要ORCID号,直接到ORCID官网,免费注册 。官网有给ORCID号生成二维码功能,有国别选项,仅20多个国家、不含中国——此选项含义不明,会议问答阶段说明,注册信息中不含国家,如更换国籍无须更新个人信息。

4、可使用API利用ORCID数据
API有3等,免费的公共API有查询功能,基本会员API和高级会员API有不同的更新记录权限(成员资格与费用,3-120万不等)。更新记录将丰富会员单位下属个人ORCID信息,并且增加个人信息的可信度。

5、个人ORCID数据目前由CrossRef提供基于DOI的自动更新,也可如上由会员单位更新。否则的话,只能由个人自己更新,自己更新信息的可信度级别较低。ORCID本身不提供其他通报功能。
已注册了ORCID的都了解,目前中文成果基本上没有自动更新。没有国外发文的话,目前注册这个号码作用尚未能体现。这也是最后专家讨论阶段,社科文献出版社集刊运营中心副主任柴宁提问的:人文社科为什么要用它?

6、科研信息管理需要用到个人ID,以区别姓名相同或者姓名形式相同的情况 。目前有不少通行的个人ID,通常需要并行使用,才能拼出相对完整的个人成果。
香港理工大学图书馆研究支援部主任谢佳燕(Janice Chia)介绍,理大在学校层面推进ORCID注册,其学者库将ORCID与Scopus author ID、ResearcherID整合,以获取相对完整的个人成果信息。该馆Researcher Profile网页也列出了本次报告介绍的数据整合流程。
上海交通大学图书馆潘卫副馆长介绍,上交大机构知识库目前根据学校需求,侧重研究者数据管理,近期目标是实现学院年度成果考核,要求成果精确归属(自动判断+认领),同时减少对成果的反复识别。因此下决心对全校数千研究人员做人名规范,除以上3种个人ID,还使用ISNI及一些专业平台的作者ID。上交大自身并推动在DRAA电子资源谈判中,增加数据获取的权利

7、图书馆界关注个人ID,是因为它能区分同名者、汇聚研究者成果,属于传统图书馆学编目中的规范控制范畴。但是,如会议最后提到的,研究者才是ORCID的主角,如何让研究者愿意使用,方便其工作,才是ORCID是否能够成功的关键。目前国内已有期刊要求作者、审核者提供ORCID,除此之外呢?

8、会议赞助商Nature和Science的报告,关注点在提高科研成果的可信度,因为近年科学丑闻太多。
Nature Research大中华区执行主编印格致(Ed Gerstner)讲加强透明度,如通过研究数据的开放获取、研究预注册、提高成果的可重复性。
AAAS亚太业务开发总监初晓英讲要求研究者声明自己的责任,采用贡献元数据+责任方式(Credit)词表。
两家方向一致,思路不同。前者通过开放,实现第三方监控;后者是要求自律。尽管看到元数据、受控词表感觉很亲切,但我不相信自律,更相信开放的制度设计。

2017-6-23 update:
官网上的会议主页,PPT已上线(figshare.com在线浏览+下载)
– 会上初晓英提到有篇用ORCID数据做的科学家流动研究文章发表在Science系列,文章中那个跳槽最多、在10个国家工作过的人现在到了上海大学。文章中译版:
用ORCID追踪全球科学家的流动(原文作者John Bohannon & Kirk Doran)
除了很炫的可视化图。其中还提到ORCID存在的问题:(1)用户偏年轻化;(2)不同国家用户数量与研究人员数量不匹配,如西班牙和葡萄牙偏高,因为这两个国家的科研资助机构都要求科学家使用ORCID;(3)学术界研究人员有更大发表论文压力,因而比产业界的科学家更积极地注册。
– 会后反馈。包括:(1)问卷调查:评介会议、报告、场地、建议等——第一次见到给每个报告评分的问卷。(2)收集参会者ORCID号,如果没有,也可即时注册——既收集信息、也是推广。为免干扰,在此就不提供链接了。

ONIX-PL:ONIX出版物许可格式

电子资源管理平台使用标准:ONIX-PL
随着图书馆馆藏中数字资源数量的增长,图书馆所拥有的不同许可数量也相应增长,增加了管理与确保遵守相应条款的困难。ONIX-PL让图书馆可以:
– 以机器可读格式表达许可
– 载入电子资源管理系统
– 链接到数字资源
– 向用户传递关键使用条款
– 比较不同许可的条款
ONIX-PL自2008年11月发布1.0版以来,schema定义保持稳定,通过ONIX-PL词典增词扩展,随着新用户需求的提出,词典增词过程仍在继续。
EDItEUR免费提供编辑工具OPLE(开源软件)用于创建模板、复制与编辑OPIX-PL格式的许可文件。处理后的XML表达可装入能解释ONIX-PL格式的图书馆系统。

——— ONIX-PL Format specification v1.0 ———
《ONIX出版物许可格式》(ONIX-PL)用于支持传递电子资源许可条款,涉及许可者、被许可者,以及任何参与许可过程的中介,如订购代理与图书馆联盟。许可条款及资源使用许可和政策的描述,通称“ONIX许可条款”。

XML格式,主体部分为“出版物许可表述”PublicationsLicenseExpression,有10个主要部分(后5个为可选,但建议均用):
1 ExpressionDetail 表述细节
2 LicenseDetail 许可细节
3 Definitions 定义(包括以下5个子项,每个定义均须有唯一标签label:参与者 AgentDefinition,资源 ResourceDefinition,时间点 TimePointDefinition,地点 PlaceDefinition,文件 DocumentDefinition)
4 LicenseGrant 许可
5 UsageTerms 使用条款 (包括以下元素:使用状态UsageStatus,使用者User,使用资源UsedResource,使用目的UsagePurpose,使用方法UsageMethod,使用条件UsageCondition,使用例外UsageException)
6 SupplyTerms 提供条款
7 ContinuingAccessTerms 连续获取条款
8 PaymentTerms 支付条款
9 GeneralTerms 通用条款
10 LicenseDocumentText 许可文件文本