文化遗产信息交换的CIDOC CRM兼容模型家族

【关于CIDOC CRM

CIDOC(International Council for Documentation 国际文献理事会/国际文献工作委员会)是ICOM(International Council of Museums 国际博物馆理事会/国际博物馆协会) 的一个委员会。CIDOC CRM https://www.cidoc-crm.org/ 是文化遗产领域著名的概念参考模型,也称为形式本体。它定义一套类 [E1……] 和属性 [P1……],用于描述文化遗产文献中使用的概念和关系。

CIDOC CRM自2006年成为ISO国际标准,2014年更新。最新版 ISO 21127:2023 信息与文献——文化遗产信息交换的参考本体Information and documentation — A reference ontology for the interchange of cultural heritage information,Edition 3),相当于其内部版本Version 7.1.3(https://www.cidoc-crm.org/versions-of-the-cidoc-crm)。网站有2010年v5.0.2的简体中文版,吴毅慧翻译、洪政欣教授修订编审、新加坡文物保管中心赞助。

CIDOC CRM兼容模型

多年前,国际图联(IFLA)把《书目记录的功能需求》(FRBR)与之对标,完成FRBRoo(2009年v1.0)。当功能需求家族(FRBR、FRAD、FRSAD)统一为《IFLA图书馆参考模型》(LRM)后,FRBRoo也顺理成章更新为LRMoo(2024年1.0版)。

另外,针对连续出版物,完成PRESSoo(2014年v1.0版,最新2017年v1.3)。

除图书馆界这两个兼容标准外,还有文化遗产相关的多样化且不断增长的兼容模型,目前共11个。其中与图书馆界合作的2个命名方式强调“面向对象”(oo=object-oriented),其他均沿用“概念参考模型”(CRM=Concept Reference Model)。网页中各自的“Resources”链接,提供从草案开始的各种版本:

Compatible models & Collaborations(https://www.cidoc-crm.org/collaborations

  • LRMoo Library Reference Model 图书馆参考模型【2024-8-8 页面链接 https://www.cidoc-crm.org/frbroo/ 未更新、已失效、跳转到主页,当为 https://www.cidoc-crm.org/lrmoo/
  • PRESSoo Model for publishing of periodicals 连续出版物出版模型
  • CRMinf Argumentation model 论证模型
  • CRMarchaeo Excavation Model 考古发掘模型
  • CRMsci Scientific observation model 科学观测模型
  • CRMgeo Spatiotemporal model 地理时空模型
  • CRMdig Model for provenance metadata 来源元数据模型
  • CRMba Model for Archaeological Buildings 考古建筑模型
  • CRMtex Model for the study of ancient texts 古代文本研究模型
  • CRMsoc Model for Social Phenomena 社会现象模型
  • CRMact Model for Activity Plan 活动计划模型

相关博文

2024年IFLA新项目“UNIMARC未来”及新标准LRMoo等

2024年6月《IFLA标准通讯》第2卷第1期发布(IFLA Standards Newsletter. Volume 2, Issue 1. https://repository.ifla.org/handle/123456789/3413)。参见:《IFLA标准通讯》创刊(2023-3-31)

以下为出自第2卷第1期的2024年国际图联(IFLA)标准动态。

一、新项目:UNIMARC未来

2024年初,UNIMARC常设委员会(PUC)启动“UNIMARC未来”项目。信息来源:UNIMARC for Entity-Relationship Cataloguing: Structuring Principles, Current Situation and Key Issues/ Florence Tfibel (Liaison, Permanent UNIMARC Committee)

项目网页:Future of UNIMARC. https://www.ifla.org/g/unimarc-rg/projects/

  • UNIMARC目前提供两种编目选项,也称编目轨道(cataloguing tracks)1)UNIMARC-ER(实体关系编目);2)“传统”UNIMARC编目。
  • UNIMARC的实体和关系:现在几乎涵盖IFLA LRM模型的所有方面

“UNIMARC未来”项目旨在促进交流、分享和产生关于UNIMARC未来的知识,重点是探索 UNIMARC 的使用范围,提高对其实体关系 (ER) 编目轨道的熟悉程度,并收集有关图书馆社区需求的信息。

目前正进行一项全球调查:Landscape of Data Structure and Exchange Standards Survey. https://1ka.arnes.si/unimarcsurvey2024【2024-7-17,8-4访问,页面锁定、内容为空】。

2024年11月12日将在斯洛文尼亚(及在线)召开第6届 UNIMARC 用户会议:6th UNIMARC Users Meeting: Charting the Course: Future-Forward Cataloguing with UNIMARC. https://www.ifla.org/permanent-unimarc-committee-puc/6th-unimarc-users-meeting/

二、新标准。已批准(但截止2024-8-4均未在IFLA网站查到最新的标准文本)

1、《LRMoo:<国际图联图书馆参考模型>的面向对象定义与映射》(LRMOO: object-oriented definition and mapping from the IFLA Library Reference Model)

LRMoo 1.0版于2024年4月获得国际图联专业委员会批准,取代2016年发布的FRBRoo 2.4版(如同LRM取代FRBR、FRAD、FRSAD),与博物馆界的概念参考模型最新版CIDOC CRM 7.1.3版本兼容,在两个社区发布,CIDOC-CRM网站有PDF/DOC版本:https://www.cidoc-crm.org/lrmoo/fm_releases

2、《国际图联ENSULIB绿色可持续图书馆指南》(IFLA ENSULIB Guidelines for Green and Sustainable Libraries)

IFLA网页显示(The IFLA Guidelines for Green and Sustainable Libraries)https://www.ifla.org/the-ifla-guidelines-for-green-and-sustainable-libraries/,目前正寻求建议与期望,要求2024年9月15日前发送案例。

3、《在线环境下的继续专业发展指南》(Guidelines for Continuing Professional Development in the Online Context)

现有文件《国际图联继续专业发展指导方针:原则和最佳实践》(IFLA Guidelines for Continuing Professional Development: Principles and Best Practices (2016))https://www.ifla.org/files/assets/cpdwl/guidelines/ifla-guidelines-for-continuing-professional-development.pdf的进一步发展。

4、《多元文化社区:图书馆服务指南》(第4版)(Multicultural Communities: Guidelines for Library Services (4th edition))

为移民的图书馆服务,更新2009年第3版(https://repository.ifla.org/bitstream/123456789/462/1/multicultural-communities-en.pdf

自动音译工具ScriptShifter

ScriptShifter是美国国会图书馆(LC)于2024年开发的自动音译工具。开源软件。

所谓“音译”,指文本从一种文字到另一种文字的系统转换。将文本音译为拉丁字母,即所谓“罗马化”。比如,为汉字生成汉语拼音。

ScriptShifter就是一款自动罗马化音译工具。LC使用的罗马化标准是:《ALA-LC罗马化表》(ALA-LC Romanization Tables

ScriptShifter目前支持近百种文字(Supported Scripts/Mappings in ScriptShifter),有罗马字母到文字、文字到罗马字母2种转换,部分文字只有单向转换。比如中文汉字,只支持文字到罗马字母(汉字生成拼音),不支持罗马字母到文字(拼音转成汉字)。

有在线版本可以试用:https://bibframe.org/scriptshifter

  • 试汉字。几个多音字组成的词,转换正确。
  • 试日语,有平假名、片假名2种文字,均支持双向转换。支持日文汉字生成罗马字母,或者罗马字母生成假名(但罗马字母不能转成日文汉字)。另外,对多音汉字如人名无法很好处理,也是意料之中(在BIBFRAME更新论坛上提到希望借助AI)。

ScriptShifter是LC为编目非拉丁文字资源而开发的。目前已嵌入开发中的新版BIBFRAME编辑器Marva Quartz,用于实时生成罗马化内容。

由于其灵活的使用方式(见下),显然在回溯处理批量数据时也会有用武之路。

ScriptShifter可在本地运行、本机运行、通过API集成到其他软件中使用:

LC正鼓励参与开发:试用Scriptshifter;尝试安装Scriptshifter或使用API;通过Github或电子邮件报告问题。

Paul Frank and Matt Miller. ScriptShifter: Enhancing Library Metadata and Discovery. https://www.loc.gov/bibframe/news/bibframe-update-jul2024.html

参见:2024夏BIBFRAME更新论坛(2024-7-12)/posts/2024/0712/6271