图书馆标准巴别塔──Schema.org将图书馆连接到web

这是OCLC技术布道者Richard Wallis的观点。
Richard Wallis因关联技术加盟OCLC。在刚结束的IFLA赫尔辛基年会的关联数据圆桌会议(OCLC Linked Data Round Table)上,他在名为《图书馆关联数据进展》报告中宣布,WorldCat关联数据提供一个子集供下载。
参见:WorldCat关联数据子集批量下载(附OCLC的其他关联数据)(2012年8月21日)

报告前面部分列举IFLA 2010年会到2012年会的两年间,图书馆界发布的众多关联数据(附后,包括韩国国家图书馆),后面部分介绍OCLC发布的各个关联数据项目及ODC-BY许可。连接两者的,就是提出“图书馆标准巴别塔”(p.27),以及“Schema.org将图书馆链接到web”(p.61),说明WorldCat采用Schema.org及图书馆扩展的原因。

最近看了各图书馆发布关联数据所用命名空间,对“图书馆标准巴别塔”之说极为认同。Wallis在页面标出的图书馆标准有12个:Bibo, Dublin Core, EAD, FRAD, FRBR, FRSAR, ISBD, MARC, MARCXML, MODS, Onix, RDA;所列不列颠图书馆数据模型(PDF格式)中所采用的命名空间有14个:blt, rdf, rdfs, owl, xsd, dct, isbd, skos, bibo, bio, foaf, event, org, geo。因之OCLC的选择是放弃图书馆标准,采用搜索引擎的标准schema.org,并辅以OCLC的图书馆扩展(library extension,或也有望被纳入schema.org吧)。
参见:Schema.org的图书馆扩展(2012年6月22日)

Wallis的说法是:共享通往Web的道路(p.64):
Schema.org linking libraries to the web(Schema.org将图书馆链接到web)
no replacement for rich bibliographic metadata(不取代丰富的书目元数据)
easily consumed & merged across domains(易于跨域消费与合并)
a powerful complement to it(指图书馆扩展)

于是想,LC书目框架转换行动,会弄出一个什么样的模型呢?给巴别塔添砖加瓦吗,还是像schema.org那样来个一统图书馆天下?

PPT:Richard Wallis. Library Linked Data Progress. IFLA Helsinki, 13 August 2012(有墙)
OCLC官网消息: OCLC provides downloadable linked data file for the 1 million most widely held works in WorldCat, 14 August 2012
Via Data Liberate: Get Yourself a Linked Data Piece of WorldCat to Play With / By Richard Wallis on August 12, 2012

会议其他报告:IFLA语义网特别兴趣小组(SWSIG)网站消息,Presentations from OCLC Linked Data round table available
(均在目前被墙的slideshare)
– Neil Wilson, British Library – http://www.slideshare.net/nw13/oclc-linked-data-roundtable-event-ifla-2012
– Emmanuelle Bermes, Centre Pompidou – http://www.slideshare.net/Figoblog/ifla-2012-oclc-linked-data-round-table
– Martin Malmsten, National Library of Sweden – http://www.slideshare.net/geckomarma/ifla-2012-oclc-semantic-web-roundtable

———-图书馆关联数据进展———-
Richard Wallis报告中列举的IFLA 2010年会到2012年会间发布的图书馆关联数据:
data.bnf.fr(法国国家图书馆)
datos enlazados en la BNE(西班牙国家图书馆)
Europeana Linked Open Data
Web NDL Authorities(日本国会图书馆)
LC Linked Data Service(美国国会图书馆)
The Open Library(thedatahub.org/dataset/openlibrary)
Zeitschriftendatanbank: Linked Data(德国:期刊资料库)
Linked Data Service of the German National Library(德国国家图书馆)
National Library of Korea: Linked Data(韩国国家图书馆)
VIAF
DDC
FAST Linked Data
British National Bibliography(英国国家书目)
W3C Library Linked Data Incubator Group
LC: Bibliographic Framework Transition Initiative
WorldCat

Schema.org的图书馆扩展

在WorldCat关联数据中看到library:,由Linked data at OCLC得知这是Schema.org的图书馆扩展,由OCLC研究办公室提出。

Experimental “library” extension vocabulary for use with Schema.org

目次
1. Introduction
2. Classes
3. Object Properties
4. Data Properties
5. Named Individuals
6. Annotation Properties
7. Namespace Declarations

其中2-6列举了扩展词汇:
2. 类 Classes(除Carrier载体,其他相当于文献类型)
(has super-classes: schema:CreativeWork)
档案资料 ArchiveMaterial
载体 Carrier(is in range of: has carrierop;has members:Bluray Disk, Cassette Tape, Compact Disk, DVD, Film Reel, LP, Microformni, VHS Tape, Volume, World Wide Web)
计算机文件 Computer File
游戏 Game
图像 Image
交互多媒体 Interactive Multimedia
套件 Kit
乐谱 Musical Score
报纸 Newspaper
期刊 Periodical
学位论文 Thesis(has super-classes: schema:Book)
玩具 Toy
视频 Video
电子游戏 VideoGame(has super-classes: Game)
视觉资料 Visual Material
网站 Web Site

3. 对象特性 Object Properties(用于著录/描述部分)
有载体 has carrier(has domain: schema:CreativeWork;has range: Carrier)
出版地 place of publication(has domain: schema:CreativeWork;has range: schema:Place)

4. 数据特性 Data Properties(专用于联合目录,尤其是WorldCat)
(has domain: schema:CreativeWork;has range: xsd:integer)
馆藏数 holdings count
OCLC控制号 oclcnum

5. 命名个体 Named Individuals(属于图书格式或载体,除了OCLC Research)
(belongs to: schema:BookFormatType或Carrier)
有声书 Audio Book
蓝光碟 Bluray Disk
盲文书 Braille Book
磁带 Cassette Tape
光盘 Compact Disk
持续更新书 Continually Updated Book
DVD
胶片 Film Reel
大字印刷本 Large Print Book
视盘 LP
缩微 Microform
OCLC Research(belongs to: schema:Organization)
VHS Tape
册 Volume(依据RDA?)
World Wide Web

6. 标注特性 Annotation Properties(用于著录/描述部分)
创作者 dc:creator
描述 dc:description
题名 dc:title
语义网词汇状态 vs:term_status

7. 命名空间声明 Namespace Declarations
除默认的http://purl.org/library/外,还用到dc, determs, foaf, owl, rdf, rdfs, schema, vs, xsd(XMLSchema)

附:Schema.org
1、Schema.org的对象(Thing)分为7类
创作作品 CreativeWork
事件 Event
无实体 Intangible(杂项,包括数量、数值、评级、语言等等)
组织 Organization
个人 Person
地点 Place
产品 Product

2、CreativeWork为最通用的创作作品类别,很多“创作作品”是图书馆通常处理不到的。包括:
文章 Article(其下包括:博文、新闻报道、学术论文)
博客 Blog
图书 Book
留言 Comment(在其他项如博文下的评论)
榜单 ItemList
地图 Map
媒介对象 MediaObject(其下包括:声音对象、图片对象、音乐视频对象、视频对象)
电影 Movie
音乐播放列表 MusicPlaylist (其下包括:音乐专辑)
音乐录音 MusicRecording
绘画 Painting
照片 Photograph
Recipe 食谱
述评 Review(独立发布的评论)
雕塑 Sculpture
软件应用 SoftwareApplication(其下包括:移动应用、Web应用)
电视剧集 TVEpisode
电视剧季 TVSeason
电视系列剧 TVSeries
网页 WebPage(其下包括:关于页、结算页、合集页{包括图片库、视频库}、联系页、单项页、个人资料页、检索结果页)
网页元素 WebPageElement(其下包括:网站导航元素、表、网站广告块、页脚、页头、侧栏)

信息与文献的三个新国际标准(2011.8)

NISO Newsline (September 2011),8月份新出版了三个信息与文献的ISO标准。

ISO 25964-1:2011, Information and documentation — Thesauri and interoperability with other vocabularies — Part 1: Thesauri for information retrieval (ISO网站链接)

ISO 25964“叙词表及与其他词表的互操作”(标准网站),修订并取代以下两个标准:
ISO 2788:1986:单语种叙词表建立与开发准则
ISO 5964:1985:多语种叙词表建立与开发准则
除保留并更新上述两个标准外,增加以下三个主题:
1、分面分析、电子功能及显示指引
2、叙词表管理软件的功能规格
3、叙词表数据交换的数据模型及衍生XML模式
标准包括两部分:
第1部分:叙词表与信息检索
第2部分:与其他词表的互操作
第1部分(ISO 25964-1:2011)已于8月正式出版,第2部分草案将于年底公示。

ISO 15511:2011, Information and documentation — International standard identifier for libraries and related organizations (ISIL) (ISO网站链接)

用于图书馆、档案馆、博物馆及相关机构,包括一套唯一识别机构的标准标识。这是第3版,前2版分别为2003年和2009年。本版主要是编辑改动,没有对文档的规范性元素做重大修改。

ISO/TR 23081-3:2011, Information and documentation — Managing metadata for records — Part 3: Self-assessment method(ISO网站链接)

ISO/TR 23081-3:2011管理记录元数据,第3部分:自评估方法。ISO 23081的前两部分分别是:
第1部分:原则:ISO 23081-1:2006,Records management processes — Metadata for records — Part 1: Principles
第2部分:概念与实施问题:ISO 23081-2:2009,Managing metadata for records — Part 2: Conceptual and implementation issues
此份技术报告(TR: technical report)为与创建、抓取与控制记录有关的记录元数据自评估的实施指导,有助于:
1、确定元数据抓取与管理的当前状态
2、确定什么应当优先做、什么时候做
3、确定23081-1:2006和ISO 23081-2:2009的关键需求
4、为实施特定系统与计划而开发元数据框架过程中评估进程
5、当系统中包含记录元数据功能时评估系统与项目是否准备就绪
[看到最后,还不知道记录元数据(records metadata)是啥玩艺儿,或者说records是啥]