IFLA在线会议:新视野:21世纪新兴的元数据标准和实践(2021-5-27)

去年初开始的新冠肺炎(COVID-19)大流行,一开始因为措手不及,很多会议取消,后来有改为线上。不少专业线上会议还免费,使得普通从业人员也有机会实时参会,从某种角度上说真是件好事。

国际图联(IFLA)年会去年取消,今年为线上,原来每年8月年会期间举办的元数据报告专场(Metadata Reporting Session)提前到5月,现在已经可以免费注册(ZOOM会议)。

本次在线会议由IFLA书目部、编目部和主题分析与检索部联合举办,针对IFLA元数据部门和标准组的最新动态,从介绍看,会涉及LRM、ISBD、UNIMARC等,以及法国、智利等国的进展。

新视野:21世纪新兴的元数据标准和实践 New horizons: emerging metadata standards and practices in the 21st century

时间:2021年5月27日 北京时间23:00-0:30

会议分3个部分,分别是专题介绍、专家座谈和问答:

(1)30分钟,4个小组/委员会的专题介绍(Metadata lightning talks),:书目概念模型评审组【LRM】、ISBD评审组、关联数据技术分委员会、永久UNIMARC委员会

(2)45分钟,新视野座谈会(New Horizons panel),主持为Athena Salaba(IFLA主题分析和检索部主席、肯特州立大学),专家为:

  • Ángela Quiroz U.(IFLA编目部常务委员会成员,智利国会图书馆信息资源制作部参考资料制作课)
  • Frédérique Joannic-Seta(法国国家图书馆元数据部主任,法国国家项目“书目转换”联合主席)
  • John Horodyski(洞察与分析(SaltFlats)董事总经理,圣何塞州立大学兼职教授)

(3)15分钟,问答环节

MARC21的340字段:RDA插图内容

在图书编目中,插图是载体描述项的重要内容。因为插图是图书的一个重要特征,在西文学术著作的题名页,常可见到标注插图情况。

虽然书目记录中标注有插图,但在书目查询中插图通常没有作为检索条件或筛选条件,因为它只被著录/描述,不被当作检索点。其实在代码字段(如008)中也是有的,但似乎未见利用。

新RDA是要把尽可能多的信息“数据化”的,记录“插图内容”就是一例。

对应RDA更新,MARC21于2020年在340字段(物理媒介)中新增$p(插图内容),MARC21标准网站上的样例:

  • $p – Illustrative content:资源中存在的插图内容的类型的一般和/或特定指示
  • 340##$gcolor$pillustrations
  • 340##$gone color$pmaps

上述两例都与$g(色彩内容,2017年新增)同用,对应于300$b(其他载体细节),比如(对应第1例):

  • 300##$billustrations (some color)

与300$b属于描述字段不同,340$g$p属于代码字段,如采用受控词表,用$2(来源)说明。

编目专家Adam L. Schiff(美国华盛顿大学图书馆)在RDA-L邮件组询问用340字段做插图内容该如何选择。问题的关键是术语的单复数:上术两例都用的复数(与300$b对应),而RDA对于插图内容有一个取值词表(词表编码体系VES),术语均为单数(复数已弃用)。

他指出,LC最近已宣布新增来源代码rdaill(RDA插图内容):TECHNICAL NOTICE (February 26, 2021) 

RSC现任主席Kathryn Glennan(Kathy Glennan,署单位马里兰大学图书馆)回邮说明:RDA VES是受控词表,340字段需原样使用术语(即单数),300$b可使用复数。(RDA持续更新)对于“插图内容”元素中“记录”下的选项,RSC马上会评估哪些会保留在这个位置,哪些移到“非结构化描述”。

换言之,340字段为“结构化描述”,300字段为“非结构化描述”。

另对于色彩,LC有来源代码rdacc(RDA色彩内容)。RDA色彩内容词表仅有两个取值:monochrome(单色)polychrome(多色)。由于$2不可重复,因此如同时描述色彩内容和插图内容,则必须拆分成2个字段,上述样例用RDA VES当为:

  • 340##$gpolychrome$2rdacc
  • 340##$pillustration$2rdaill
  • 340##$gmonochrome$2rdacc
  • 340##$pmap$2rdaill

此为彩色插图和单色地图。如为彩色地图和单色插图,结果也是如此,仅顺序不同,如何区分?

词表注册网站 BARTOC

叙词表、本体和分类法基本注册 BARTOC: Basic Register of Thesauri, Ontologies & Classifications

  • ABOUT
  • BARTOC是知识组织系统(KOS)相关注册表的数据库。
  • BARTOC的主要目标是在一处列出尽可能多的知识组织系统,以实现更高的可见性、突显其功能、使其可搜索和可比较、并促进知识共享。BARTOC包括来自任何主题领域、任何语言、任何发布格式以及任何可访问形式的任何一种KOS。BARTOC的搜索界面支持20种欧洲语言,并提供两种搜索选项:按关键字进行基本搜索和按分类术语进行高级搜索。现已从欧洲各地聚集起一个编辑圈子,并得到国际知识组织学会(ISKO)http://www.isko.org/的认可。
  • BARTOC由Andreas Ledl在瑞士巴塞尔大学图书馆成立,原名:叙词表、本体和分类法的巴塞尔注册。2020年数据库移至德国的Verbundzentrale des GBV(VZG),重命名为BARTOC,并从Drupal移植到新的技术基础架构,该实现完全可以作为开源使用。
  • 更多信息见维基百科:https://en.wikipedia.org/wiki/BARTOC

BARTOC现收录词表3291个,词表注册网站(registry、含资料库repository、服务service)近百个。

  • 收录词表包括以下类型:
  • Gazetteer 地名词典
  • Glossary 词汇表
  • Categorization schema 类别法
  • Classification schema 分类法
  • List 列表
  • Name authority list 名称规范表
  • Ontology 本体
  • Subject heading scheme 主题标目法
  • Semantic network 语义网
  • Synonym ring 同义词环
  • Taxonomy 科学分类
  • Terminology 术语表
  • Thesaurus 叙词表
  • Dictionary 词典
  • BARTOC有3种搜索方法(缺乏自身的术语级搜索):
  • 基本搜索:对词表介绍的全文搜索,按相关性排序
  • 筛选搜索:选择KOS类型、语种、许可、主题及排序方法(主题可选:DDC杜威十进分类法/一级类、EUROVOC欧盟叙词表/大类、ILC综合等级分类/大类)
  • 联合异步搜索工具 BARTOC FAST:访问包含大量词表的23个远程资源,术语级搜索(支持截词和通配府、不支持布尔运算符)