W3C图书馆关联数据孵化小组

W3C图书馆关联数据孵化小组(Library Linked Data Incubator Group)刚刚成立,为期一年,结束日期为2011年5月20日。创始主席:
Tom Baker(DCMI的CIO,一位德国人美国人)
Emmanuelle Bermes(法国国家图书馆)
Antoine Isaac(阿姆斯特丹VU大学计算机系博士后,欧洲数字图书馆计划Europeana科学协调员,W3C的SKOS社区联系人)
创始机构:来自芬兰、爱尔兰、马来西亚、英国、德国、荷兰以及美国,有熟悉的LC、OCLC和Talis……

———-小组章程———-
图书馆关联数据孵化小组的使命,是通过汇集图书馆界内外参与语义网活动(重点在关联数据)的人、基于现有创新举措、确定未来的合作轨迹,帮助提高图书馆数据在万维网上的全球互操作。
小组将探索如何以现有图书馆学的基石如元数据模型、元数据模式、标准与协议,建立互操作及图书馆系统与网络化环境,鼓励图书馆将其内容带向万维网的数据互操作,普遍地重新定位其方法,并达到其他社区。同时也将这些社区视为关联数据网规范数据集(个人、主题……)的潜在主要提供者。由于这些发展要求图书馆界围绕(语义)万维网标准共享标准化工作,小组将提炼所需的知识、表述标准与准则的需求,提出促进图书馆界向未来万维网标准化行动做出贡献的方向。
孵化器小组创始成员来自国家图书馆、大学图书馆及研究单位、图书馆供应商及其他感兴趣的利益相关人。其范围不仅限于图书馆,也有意包括其他文化遗产机构、出版业的合作伙伴及其他相关领域。

———-现有图书馆学的基石———-
对于“现有图书馆学的基石”,在“1、动机”中如此描述:
·元数据模式(MODS、MADS、METS……)
·图书馆元数据模型,现正进化到万维网(FRBR、FRAD、RDA……)
·建立与图书馆领域外互操作的标准与协议(OAI-ORE、SKOS、SRU/CQL……)
·(数字)图书馆系统由集成转向网络环境(European、WorldCat、VIAF项目……)

———-活动范围———-
·收集使用案例与个案研究,证明在图书馆与相关部门中语义网技术的成功实施
·培养有兴趣把文化资产移植到关联数据网的活动者(图书馆、博物馆、档案馆、出版者)之间的协作
·确定相关数据模型、词表和本体,以及建立或改善其互操作的方法
·确定对新标准、准则和最佳实践的细化要求
·确定可由小组所代表社区的专业知识受益的(语义)万维网技术范围
·提出接替小组所实施的开创工作的相关组织及其工作范围

———-成功标志———-
对图书馆领域及相关部门采用关联数据的原则与展望提出现状报告,对应当进一步开发什么标准与准则、为此应当建立什么组织有明确且得到认同的观点。
开发或评价特定的本体或词表不在小组范围之内。

———-成果———-
小组主要责任在于产生一个最终报告,表述在图书馆领域及相关部门中关联数据开发的状况,提出这些社区在未来W3C标准化活动中有效参与的方向。
其他可能包括在最终报告中的内容:
·用户案例文件,描述图书馆界与相关部门的真实使用案例、个案研究、推广与传播行动
·描述相关技术要件的文件,包括词表与本体(如SKOS),目的在于确定延伸或互操作需求,帮助确定可能需要的其他标准。

[update 2010-05-24] Via pinoke在书社会的分享

[update 2012-6-29] 小组最终报告及“数据集、属性值词汇及元数据元素集”和“用例”已由娄秀明译成中文

新国际标准号ISNI及ISTC

Catalogablog前几天通报,MARBI新近推出五个建议或讨论稿[1]。一般来说,讨论稿(Discussion Paper)需上升到建议(Proposal),才能最后经过投票正式纳入MARC 21标准。

德国国家图书馆提出建议2010-07“MARC 21书目格式中ISBD标点”,建议在头标第18位增加代码c,表明在MARC记录中不采用ISBD标识符──德奥二国由MAB改用MARC 21,但打算如UNIMARC那样,不采用ISBD标点。这实在是比较符合计算机处理的明智选择

大英图书馆针对新的国际标准号ISNI与ISTC提出了二个建议,分别是:
建议2010-06: 在MARC 21书目与规范格式中记录国际标准名称标识(ISNI)
讨论稿2010-DP04: 在MARC 21书目与规范格式中记录国际标准文本码(ISTC)

ISNI旨在“标识公开身份,即在创建、生产、管理及内容分发链中,整个媒体内容业所公开使用的身份,提供避免公开身份出现歧义的工具。”ISNI可分配给自然人、法人、虚构人物或其组合(http://www.isni.org),用MARC术语,也就是个人、家族、虚构人物、团体或会议。
ISNI目前还是草案标准(Draft ISO 27729),但建议稿中说在3月举行的投票中已全票通过,6月将签署成立ISNI国际机构的协议,大英图书馆及法国国家图书馆将代表欧洲国家图书馆会议CENL作为图书馆界代表,正式注册机构将于2011年4月建立。
很容易联想到规范记录号。想起来FRAD在研制初称为FRANAR,IFLA打算在研究规范记录功能需求的同时,确立一个编号方式。据称更早在1980年代,就提出过ISADN(国际标准规范数据号),而FRANAR工作组最终考虑到以下二个原因而搁置了规范号:1、国际规范控制的重点,已经从给某实体以单一款目形式,转向依用户需求而采用不同形式;2、重点已经从规范记录的物理共享,转向规范活动智力产品的共享。[2]虚拟国际规范档(VIAF)应当是这一变化的实例,而ISNI或许正是符合发展潮流的编号系统,它针对的是一个实体,而不是一个名称形式。
目前的建议是在书目记录的X00/X10/X11(X=1主要款目、6主题检索、7附加款目、丛编附加款目)中以子字段$0(isni)作为标记;主题规范记录则采用字段024 7# $a $2isni。

ISTC是文本作品的标识系统,“文本作品”包括散文、诗歌、歌词,以及银幕、音频、舞台及其他脚本(包括布道、演讲等)。ISTC意在汇聚同一作品的不同载体表现,其意义在了解FRBR后也就不难理解。ISTC于2009年3月成为正式标准(ISO 21047),并已出版用户手册[3]。
早在2003年MARBI就论及过ISTC,本讨论稿提出了在书目和规范记录中采用024字段的几个选项,只在细节上有所不同。

在这两个国际标准号里,都看到FRBR家族的影子。应该不是“人有亡斧者”吧?

[1] Catalogablog: MARBI Papers for Review
http://catalogablog.blogspot.com/2010/05/marbi-papers-for-review.html

[2] Glenn Patton. FRAR: Extending FRBR Concepts to Authority Data. FRBR in 21st Century Catalogues, May 2005. (PPT, sheet no. 8)
http://www.oclc.org/research/activities/past/orprojects/frbr/frbr-workshop/presentations/patton/patton_franar_frbr_workshop_200505.ppt

[3] International Standard Text Code (ISTC) User manual (version 1.2) (PDF, 191 KB).
http://www.istc-international.org/html/multimedia/pdfs/

ISBD统一版修订草案发布

修订后的ISBD统一版(草案)5月10日发布[1]。302页的篇幅,还是有点长的,幸好有人已经细读了一遍,并发表了他的点评。

J. McRee (Mac) Elrod在RDA-L邮件组中发表了他的观感[2],对ISBD的行文清晰、有大量不同语种相关实例及大部分明智决定大为称赞,认为统一版对编目员友好,并进一步指出,对那些认为RDA太贵或者RDA方向不怎么清晰的人来说,ISBD统一版是图书馆指导创建书目记录的主要候选者。

Mac是加拿大“专业图书馆编目机构”(Special Libraries Cataloguing)负责人,也是多个编目相关论坛的重度参与者。作为一个相当专业的编目员,很多时候看到他钻研那些细节,都会感觉有点晕。这次他首先赞扬的是ISBD保留了拉丁文缩写(自然是对比RDA),称对多语种数据库是有益的,而卷册使用vol.比AACR2的v.和RDA的volume要好。

Mac很细致地看了全文,特别指出以下几点,其对RDA的态度昭然若揭。有时觉得他是不是太落伍了?如此,则一些他所称赞的,或许正是ISBD应该改掉的?当然不是全部。以下以草案页边所标行号为序[方括号中为本人点评]:

第60行:很好地解释了把FRBR结合进ISBD的困难之处
[原文解释为何不采用FRBR第1组的四个实体用语,而使用“资源”一词。似乎在预备版时就如此表述,Mac的强调或许只是表明对RDA此点的不认同]

第210行:导论原来标号0,现改为A,为了给(预备版之后出现的)第0项让路

第300行:对联机或直接访问电子资源间区别的说明简洁易懂
[原文说明电子资源依直接访问还是远程访问采用二种不同方式处理]

第550-560行A.3.2:继续采用. –作为各项间区分是个错误;特殊资料标识(SMD)必备很好,可以省掉核对远程访问电子资源。

第590行A.3.2.7:标点符号其实不用于机器操作,规定遇到二个.时不省略如”3rd ed..”太过时了。

第610行A.3.2.8:考虑到OPAC显示,遇到多个连续的方括号不再合并不错。
[RDA也如此规定,应该不止考虑OPAC显示,也考虑计算机处理]

第910行A.8:拼写错误用“原文如此”[sic]及“即”[i.e. …]指出对用户很好,在检索与机器匹配时,省略方括号中的信息对编程来说很简单。
[如此判断令人无话可说,仍然是设计图书馆专用软件的思路。RDA取消了这种做法]

第1080行0.3:媒介类型用electronic取代RDA的computer非常好,越来越多的电子资源用于计算机以外的设备。

第1140行:没找到交替题名标点符号的实例。希望ISBD把交替题名从正题名中排除出去,如同RDA早期草案那样。
[交替题名作为正题名一部分确乎无理,因为基本上没人会同时用来检索]

第2106行:电影的非投资者最好都放在第7项,而不是分在第1和第7项

第3310行3.3:连续出版物编号置于版次之后似乎更好。

第3550行4.1.1;第3690行4.4.9:在编目国著名的城市,在套录记录的国家未必有名。出版地总是转录或提供管辖地更简单且有利于国际化,而不是只有在觉得需要时提供。可以允许使用缩写,但禁止使用邮政缩写(因为非唯一)

第4310行4.3.8:没有出版年的情况下,仍然推荐如[196-?]这样的形式很好,这是表达估计出版日期的中立且易于理解的语言。
[这种格式很简洁,但出版社的那位编辑似乎就不明白其含意,当然经过解释还是容易理解,不过有人听你解释吗?]

第5项:是否称为Nature and extent of resource(资源性质与范围)而非Physical description(物理描述),特殊资料标识(SMD)必备,但不一定表示一个“物理”资源。最好有远程电子资源的特殊资料标识(SMD)例子,如”website”, “electronic text”, “streaming video”, “computer program”。

[update 2010-05-13] IFLA网站上ISBD评审组的全球评审公告(Worldwide review of ISBD)有对此次修订内容的十点简要说明,征求意见截止日期为7月11日。

注:
[1] International Standard Bibliographic Description (ISBD). Consolidated Edition. draft as of 2010-05-12. 302 p.
http://www.ifla.org/files/cataloguing/isbd/isbd_wwr_20100510_clean.pdf

[2] Consolidated ISBD / by J. McRee Elrod
http://www.mail-archive.com/rda-l@listserv.lac-bac.gc.ca/msg03467.html