URI是标识符还是资源?

Dan Scott在BIBFRAME邮件组中提问:什么时候一个bf:Identifier是URI?并举如下例子:
@prefix bf: <http://id.loc.gov/ontologies/bibframe/> .
<http://example.org/2335409#Work> a bf:Text, bf:Work ;
bf:identifiedBy <http://worldcat.org/entity/work/id/638612>.
<http://worldcat.org/entity/work/id/638612> a bf:Identifier .

其下有跟贴20余条,算得上热烈讨论,问题一度变成了“bf:Identifier怎么用、是什么意思”。
因为我也曾有过困惑(为什么URI还要用引号),因此总结下相关信息点。
首先记录答案:对于URI,有引号的是标识符,没有引号的是资源/Thing

一、在BIBFRAME中,bf:Identifier 标识符(类)的定义是:与资源关联的标记或名称,例如URI或ISBN(Token or name that is associated with a resource, such as a URI or an ISBN.)。
解说:标识符是“名称”,因而以文字/字符串表示(即取值必须用引号),即使是URI——如果URI作为标识符,必须用引号。

二、与bf:Identifier同用的一对互逆属性是bf:identifiedBy/bf:identifies.
表达资源标识符的最基本形式:<资源> bf:identifiedBy “标识符”
解说:对于属性的使用条件,BIBFRAME2没有用“定义域”Domain、“值域”Range,而是用限制不太严格的“用于”Used with、“期望值”Expected Value。

三、LC的BIBFRAME样例中,标识符最常见的使用形式如:
@prefix bf: <http://id.loc.gov/ontologies/bibframe/> .
<http://example.org/2335409#Work> a bf:Text, bf:Work ;
bf:identifiedBy [ a bf:Identifier ;
rdf:value “http://worldcat.org/entity/work/id/638612”
] .
解说:bf:Identifier 有很多子类,包括其定义中所举的bf:Isbn,但没有bf:Uri。如果标识符取值是URI,直接用bf:Identifier类。
LC回应如有用例,不排除增加子类【当URI作为标识符而非Thing,似乎也没有特别强调其为URI的必要?】

四、不加引号的URI代表资源而不是标识符
本文最初Dan Scott的例子,可以简化为:
<http://example.org/2335409#Work> bf:identifiedBy <http://worldcat.org/entity/work/id/638612>
LC的BIBFRAME团队讨论后(由Ray Denenberg回复)认为,上例是断言两个资源相同:
A机构有一个作品:<http://example.org/2335409#Work>
B机构有一个和它一样的作品:<http://worldcat.org/entity/work/id/638612>
尽管资源不能标识资源(bf:identifiedBy用法不对)。
LC同时承认BIBFRAME中没有断言相同资源的属性:我们认识到需要做出这样的断言,而bibframe目前没有提供,我们将进一步调查。

讨论见:[BIBFRAME] When a bf:Identifier is a URI (2019.2.15-)
相关讨论:rdf:value和rdfs:label的差别(2016-6-22)

民国时期的部聘教授

部聘教授指由国家教育部直接聘任的教授,一般用来特指中华民国大陆时期国民政府教育部遴选的的两批。教育部部聘教授是当时中国教育界的最高荣誉,有人称之为“教授中的教授”。……(部聘教授– 维基百科)

有人说“部聘教授 ”相当于现在的长江学者,从教育部给钱这点上也许是相当的,但从数量上看“部聘教授”要比“长江学者”牛得多,因为总共只有45人。沈卫威教授的“民国教授的三大荣誉——部聘教授、最优秀教授党员、院士”(民国研究,2014年春季号(总第25辑):1-23),对民国时期著名学者的获名情况有较多详细介绍。

因为最近查资料接触到“部聘教授”,发现公开网络上可以查到的资料不是很准确,如维基百科及上文等均称第一批公开发布28人,实际当年各报所用中央社讯为27人。国内各网络百科没有词条,而维基百科所列名单数量不对、内容有误:比如“部聘教授”词条中物理学家胡刚复误为数学家胡敦复,“分类:中华民国大陆时期部聘教授”中有“戴修瓒”和“戴修駿”(两人均为法学家、湖南常德人,不知是否兄弟),实际后者为误列(后者词条中也错误多多)。【嗯,我知道应该去编辑改错,可是长时间不用密码忘了,想重置密码,网站提示“您无法修改用户密码,因为您正被全域封锁”,因为我……】
商业数据库爱如生收录不少民国时期报纸,但其《晚清民国大报库》只有扫描图像,且字迹模糊、文字难以辨识;《申报》已识别全文,但文字偶有缺漏或错误,且该报没有首届部聘教授的报道。
为提供准确信息,本人特通过手工录入+复制/纠错/繁转简,汇集当时报纸中相关报道如下——出发点是这样,但由于原件字迹模糊原因,实际也不能保证完全没有错误。

一、1942年8月27日发布首届部聘教授(30人,公布名单27人)
(中央社讯)教育部设置部聘教授一案,前曾拟订办法,呈举行政院核准实施,此项教授人选之决定,极为审慎,先由部令饬国立大学及独立学院,暨具有全国性之学术团体遴选合格候选人,再由该部分科制成候选人名单,先后发交公私立专科以上学校教务长(或主任)、学院院长、各系科主任、及任教十年以上之教授荐举,荐举结果,并交由学术审议委员会第三次全体会议,及本月廿四日该会常务委员会临时会议审议,该会已就荐举结果,决定人选,现此项人选并已由教育部完全核定,计分中国文学、史学、哲学、英国文学、数学、物理、化学、生物、心理、地理、地质、教育、政治、法律、经济、社会学、农学、林学、土木水利工程、机械航空工程、电机工程、矿冶工程、医学生理解剖学、各科共三十名、并为崇尊师道起见,特于本年教师节发表,其在后方各院校任教或已来后方”之各部聘教授姓名,探志如下:
杨树达、黎锦熙(中国文学)、陈寅恪、萧一山(史学)、汤用彤(哲学)、吴宓(英国文学)、苏步青(数学)、吴有训、饶毓泰(物理学)、曾昭抡、王琎(化学)、张景钺(生物学)、艾伟(心理学)、胡焕庸(地理学)、李四光(地质学)、周鲠生(政治学)、胡元义(法律学)、杨端六(经济学)、孙本文(社会学)、吴耕民(农学)、梁希(林学)、茅以升(土木水利工程)、庄前鼎(机械航空工程)、余谦六(电机工程)、何杰(矿冶工程)、洪式闾(医学)、蔡翘(生理剖解学)
(出自:新华日报,1942年8月27日第2版 .教部发表部聘教授名单;大公报,1942年8月27日第3版.部聘教授各科共三十名 教部发表人选;中央日报,1942年8月27日第2版.部聘教授人选 教育部已完全核定 定今日教师节发表。三报均引中央社讯,仅发布“在后方各院校任教或已来后方”共27人名单(意指仍在沦陷区者为保护未发布姓名),其中教育无人)

二、1943年12月发布第二届部聘教授(15人)
胡光炜(中国文学科)、楼光来(外国文学科)、柳诒徵(史学科)、冯友兰(哲学科)、常道直(教育科)、何鲁(数学科),胡刚复(物理科)、高济宇(化学科)、萧公权(政治科)、戴修瓒(法律科)、刘秉麟(经济科)、邓植仪(农科)、刘仙洲(工科)、梁伯强(医科)、徐悲鸿(艺术科)
(出自:大公報,1943年12月17日第3版. 学术审委会通过部聘教授十五人;中央日報,1943年12月17日第3版.学术审委会通过部聘教授人选。)

三、1947年7月首届部聘教授29人获续聘(比1942年发布多2人:孟宪承(教育)、秉志(生物学),另有一人不明)
第一届部聘教授杨树达·黎锦熙·吴宓·陈寅恪·萧一山·汤用彤·孟宪承·苏步青·吴有训·饶毓泰·郑昭抡·王琎·秉志·张景钺·艾伟·胡焕庸·李四光·周鲠生·胡元义·杨端六·孙本文·吴耕民·梁希·茅以升·庄前鼎·余谦六·何杰·洪式闾·蔡翘等廿九人,续聘五年。
(出自:申报,1947年7月25日第5版.学术审议会昨常会通过 硕士学位候选人计程天赋刘骏等十九名 部聘教授杨树达等廿九人续聘五年;中央日报,1947年7月26日第4版.学术审议会昨常会 通过硕士名单一批 部聘教授二十九人续聘)

四、1943年宣布将增加部聘教授名额时,公布了首届第28人是孟宪承(这就是通常称当年公布28人的原因吧):
(中央社讯)教育部本学年度所聘部聘教授,业经于上年教师节先将在后方及国外之人选发表。该教授等除一人在美讲学,一人另有职务,须俟返国或原职务解除后始可指定学校讲学外,其余已先后就聘,并分别在指定之学校开始讲学。另孟宪承教授原在战区,现已来后方,谈判经由该部照聘指定在国立师范学院讲学。兹悉该部下学年度拟再增聘十五人……
(出自:新华日报,1943年6月20日第2版.部聘教授名额教部拟再增加,转派休假教授出国;大公报,1943年6月20日第3版.增加部聘教授下学年度拟再聘十五人 教授休假进修将续实行;中央日报,1943年6月20日第3版.部聘教授额增加 休假教授可出国进修 人选将于教师节发表)

五、教育部设置部聘教授办法(1941)
第一条、教育部设置部聘教授、适用本办法、
第二条、部聘教授、须具备左列条件、(一)在国立大学或独立学院任教授十年以上者、(二)教学确有成绩声誉卓著者、(三)对于所任学科、有专门著作、且具有特殊贡献者、
第三条、部聘教授、须由教育部提经学术审议委员会全体会议出席委员三分之二以上之后可聘请之、
第四条、部聘教授候选人、除由教育部直接提出者外、国立大学及独立学院处经教育部备案之具全国性之学术团体、得就各该学校、或团体中合于第二条规定之人员、呈请教育部提出之、
第五条、部聘教授任期五年、期满后经教育部提出学术审议委员会通过续聘之、
第六条、部聘教授薪俸、以大学及独立学院教员聘任待遇暂行规程第八条规定之专任教员薪俸教授月薪第三级为最低薪、由教育部拨交指定服务之学校转拨
第七条、部聘教授由教育部于公立及已立案之私立专科以上学校特设讲座、从事讲学及研究、其服务细则另定之、
第八条、部聘教授讲座设置处所、得由教育部根据需要、于学年终了时调动之、
第九条、部聘教授名额、暂定三十人
第十条、本办法自呈准后公布施行、
(出自:申报,1941年7月9日.保障优良教授 教部规定聘办法 名额暂定三十名任期五年分在各大学从事讲学研究.)

MODS到RDF映射建议(Samvera版)

samvera

Samvera原名Hydra,是一个开源的机构库解决方案(由Fedora机构库软件、Solr索引、Blacklight分面搜索浏览定制显示界面和Samvera集成组件4个部分构成)。最初是Hull、Stanford、Virginia三所大学的跨机构项目,现在已形成一个参与广泛的开发社区。
上月Samvera MODS to RDF Working Group发布《MODS到RDF映射建议》1.0版,定位是非官方的应用纲要/应用配置文件(Application Profile)——MODS本身有官方RDF但一直处于草案阶段(参见:MODS到BIBFRAME映射,2019-2-15)。
Kathleen Gerrity在MODS和BIBFRAME邮件组发消息,如此介绍《MODS到RDF映射建议》:
本应用纲要提供对数字对象映射MODS XML元数据到RDF关联数据类和属性,使用广泛采用的RDF命名空间。
十多家学术和公共图书馆成员协作成果,文件包含MODS元素到RDF的综合映射,使用真实世界元数据用例和数百样例。
不同于使用单一词表或新提出正式本体来实施直接的XML到RDF方法,本映射包含来自大量现有词表的属性,为关联数据环境中的记录提供更大价值。提供直接的“直接”映射(不需要为诸如主题、人或地点之类的概念创建本地对象)和更彻底的“铸造对象”(minted object)映射。
尽管工作在Samvera数字机构库框架下实行,本映射与系统无关,希望在广泛环境下可应用。
via [MODS]邮件组: MODS to RDF Mapping Recommendations now available / Kathleen Gerrity (2019-2-12)

本建议重用22个命名空间,包括少数自定义属性采用的不透明命名空间(OpaqueNamespace,开源社区支持的本体框架,提供永久URI)。有些命名空间仅采用一二个属性(如基础的owl, rdf, rdfs, skosxl)。非图书馆领域开发的词表主要用于相关项(mods:relatedItem)。
另外用到多个LC代码表,不是作为取值,而是作为属性,如以关系词代码作为属性,涉及责任者、出版发行项以及馆藏机构——尤其是出版发行机构与地点采用关系词代码,感觉脑洞比较大:
直接映射例2:
<https://example.org/objects/1> relators:pup <http://vocab.getty.edu/tgn/7013445> ;
relators:pbl “published by John P. Soule” ;
bf:editionStatement “3rd edition” ;
dcterms:created “1930?” .

——《MODS到RDF映射建议》摘译——
MODS to RDF Mapping Recommendations (v.1.0) / Samvera MODS to RDF Working Group. January 2019

背景与需求
2015年中,为升级到Fedora 4,必须由基于XML、存储为数据流的元数据,转换到存储为RDF属性的元数据。许多机构大量使用MODS XML,但MODS不易翻译为RDF图模型,除非使用空节点(在Samvera和Fedora中有问题),或为元数据元素(如创作者和主题)铸造对象类(minted object classes)。因此前波士顿公共图书馆的Steven Anderson创建MODS到RDF工作组,提出创建创建一个社区设计的应用纲要,映射MODS描述元数据到RDF。

战略与决定
评估发现MODS RDF本体不合需要:[1]缺少积极维护;[2]实施中过于依赖使用空节点和/或铸造对象;[3]缺乏机构采用。
决定选择使用已在其他关联数据数据集中广泛使用的各种词表,将MODS XML元素映射到RDF。
虽然使用如此多不同的词表[见后]增加了映射指南的复杂性,但这种方法可以比作“不把所有鸡蛋放在一个篮子里”的想法。虽然机构必须准备评估许多词表的当前和未来稳定性,但如果一个词表不再受支持或进行主要版本更改,只需要更新这些映射的一部分,而不是整个文档。
早期考虑采用MODS RDF、BIBFRAME(从v.1到v.2)、都柏林核心元素和都柏林核心术语,但发现不足以表达必要的面向机构库的内容概念,或者与Fedora 4环境中的实现不合。进而研究其他词表如Schema.org、FOAF、SKOS、BIBO和RDA等。

分析过程
参与机构分别对20个MODS顶层元素如何映射逐个进行确认并提供样例等,由小组从以下方面评审,[1]数据保真度、[2]可接受的损失、[3]特定命名空间的相对优点(如采用率、预计未来可行性)、[4]遵守属性的定义域和值域取值的必要性、[5]实现的复杂性,最终达成共识。某些元素有简单和复杂两种选项。
偶而在通用命名空间找不到合适映射,小组建议在不透明命名空间(OpaqueNamespace,http://opaquenamespace.org/开源社区支持的本体框架,提供永久URI)中提出新的谓词,但目前这些谓词[属性]尚未在OpaqueNamespace中注册。

映射建议
映射分为两大类:直接映射(简单选项)和铸造对象映射(复杂选项,限部分元素)。
直接映射(简单选项)提供从MODS XML元素到RDF语句(主体、谓词、客体)的映射,且无需为主题、人物、事件或地点等概念创建或维护本地对象。所有语句都以源自外部词表(例如LCSH)的URI或文字值(文本字符串)结尾。可以使用所描述的数字对象直接存储、维护和更新这些RDF语句。此法简单,但有时会丢失MODS记录的粒度和细节,因为并非每个数据点都可以直接映射到RDF属性。
铸造对象映射(复杂选项)为该MODS元素(题名对象、名称对象等)创建本地概念对象(必须由本地机构库系统维护),以替代使用空白节点。本地对象具有单层RDF语句(主体、谓词、客体),它们提供源自外部词表的URI、本地对象的URI或文字值(文本字符串)。与所描述的数字对象一起存储的RDF语句是指向这些本地概念对象的指针。此选项允许将MODS记录中的所有详细信息序列化为RDF,以用于复杂的MODS元素如名称和主题。
铸造对象增加了数据模型的复杂性,但描述性书目元数据本身就很复杂。【直接映射中客体取文字值的较多,但】书目或文化遗产本体中使用的许多RDF谓词都具有URI或其他RDF对象类型的定义值域(可接受值的类),而不是字符串文字。本文档中的映射力求遵守所有示例中定义的值域,这需要为未由现有URI表示的概念、题名、人员、地点、馆藏或组织创建本地对象。
本映射中,某些情况提供多种方式映射元素或值【元素选择不多,值URI选择较多】。机构应创建并维护本地应用配置文件,以记录最适合其自身数据、应用和用户需求的方法。

使用命名空间
BIBFRAME (v.2) 【LC。用于mods:recordInfo;另外铸造对象的类多采用BF2】
The Bibliographic Ontology (BIBO)【用于mods:relatedItem】
Classification Schemes classSchemes【LC。用于mods:classification】
DBPedia Ontology【用于mods:relatedItem】
Dublin Core Metadata Element Set, Version 1.1
DCMI Metadata Terms
DCMI Type Vocabulary
EBUCore【用于mods:relatedItem】
Europeana Data Model (EDM)
FOAF (Friend of a Friend)【foaf:name;铸造对象的类:foaf:Person,foaf:Organization,foaf:Agent】
GeoJSON-LD【坐标 geojson:bbox,geojson:coordinates,用于mods:subject】
MARC Code List for Relators【LC。大量采用关系词作为属性:各种责任者,出版发行生产制作地、者,收藏机构rps=Repository】
OpaqueNamespace【不透明命名空间】
OWL 2【owl:sameAs】
Portland Common Data Model【用于mods:relatedItem】
RDA Unconstrained
The RDF Concepts Vocabulary (RDF)【rdf:type】
RDF Schema 1.1【rdfs:label,rdfs:seeAlso】
Schema.org
SKOS (Simple Knowledge Organization System)【skos:note;skos:exactMatch,skos:closeMatch,skos:relatedMatch;类:skos:Concept】
SKOS eXtension for Labels【skosxl:prefLabel,用于mods:titleInfo,mods:subject】
Standard Identifiers Scheme【LC。大量采用】

直接映射(简单选项)【仅摘<mods:titleInfo>片断】
dcterms:title 文字
dce:title URI
dcterms:alternative 文字
例1:题名含不排序字符及子题名
<https://example.org/objects/1> dcterms:title “The wintermind : William Bonk and American letters” .
例6:统一题名
<https://example.org/objects/1> dce:title <http://id.loc.gov/authorities/names/n00020514> .

铸造对象映射(复杂选项)【仅摘<mods:titleInfo>片断】
类:bf:Title
dce:title URI
bf:variantType 文字
rdfs:label 文字
skos:note 文字-编目员提供题名
skos:relatedMatch URI-规范题名
skosxl:prefLabel URI-首选题名

例1:题名含不排序字符及子题名
<https://example.org/objects/1> dce:title <https://example.org/titles/1> .
<https://example.org/titles/1> a bf:Title ;
rdfs:label “The wintermind : William Bonk and American letters” .

例6:统一题名
<https://example.org/objects/1> dce:title <https://example.org/titles/1> .
<https://example.org/titles/1> a bf:Title ;
rdfs:label “Bible” ;
skos:relatedMatch <http://id.loc.gov/authorities/names/n00020514> ;
bf:variantType “uniform” .