Schema.org 3发布(附:书目扩展和旅馆业词表)

Schema.org在2011-6-2首次发布(0.X版),2013-4-5发布1.0a版,2015-5-12发布2.0版,2016-5-4发布3.0版
3.0版包括了正式版(Finalized first release)汽车扩展和书目扩展,这是托管扩展的首次正式发布。对书目扩展来说,这应该是很重要的消息,但其W3C社区wiki上最新信息仍停留在一年前,最相关的是2015年6月24日宣布bib.schema.org。

3.0版同时新增3个扩展:元扩展、待定扩展和健康-生命科学扩展。
– 元扩展(meta.schema.org):用于schema.org本身(2个类:类、属性;5个属性:类别、定义域、值域、反向属性、替代)
– 待定扩展(pending.schema.org):收录未批准术语,其中术语可能被接受、也可能有变化,使用需谨慎。
– 健康-生命科学扩展(health-lifesci.schema.org):这是个庞大的扩展,目前有99个类、179个属性、149个取值词表。
核心词表中医学/健康相关术语移入此扩展。这应该是首次对核心词表做某种程度的瘦身(参见:Schema.org: Web上结构化数据的演变(笔记),发布时297个类、187个关系,四年后增加至638个类、965个关系)。

2016-8-9发布的3.1版对旅馆相关词表(hotel/accomodation vocabulary)做了较多增补。网站上还有一个专门网页(Markup for Hotels),详述住宿行业如何在旅馆、房间、订单三个层次使用schema.org。样例所用描述旅馆的元素基于STI Accommodation Ontology

via schema blog: schema.org update: hotels, datasets, “health-lifesci” and “pending” extensions… (AUGUST 9, 2016)

——— 附:书目扩展与OCLC ———
书目扩展(Finalized first release)
Comics Types (5)
ComicCoverArt, ComicIssue, ComicSeries, ComicStory, CoverArt
Comics Properties (7)
artist, colorist, inker, letterer, penciler, publisherImprint, variantCover
Comics Enumeration values (1)
GraphicNovel

Types (6)
Atlas, Audiobook, Chapter, Collection, Newspaper, Thesis
Properties (11)
abridged, duration, inSupportOf, pageEnd, pageStart, pagination, publishedBy, readBy, translationOfWork, translator, workTranslation

对照书目扩展(Final review),正式版把漫画部分抽出来单列(参见:Schema.org扩展机制(及汽车&书目扩展),2016-2-18)。
与OCLC最初设想的“Schema.org的图书馆扩展”(2012-6-22)相比,现在的版本少了很多内容。部分原因可由“解惑Schema书目扩展”(2014-1-29)得知。
OCLC等不及官方扩展,在Schema.org 2.0版宣布可以有外部扩展前,自己弄了个定制版(参见:OCLC低调注册BiblioGraph.net扩展Schema.org,2014-12-1),目前为BiblioGraph.net Version 1.1(2015-2-16发布)、基于Schema.org Version 1.93(2015-02-04发布),之后未同步更新
经初步比对类,其中包括Schema.org书目扩展中的4个类:Atlas,Chapter,Newspaper,Thesis。

扩展阅读:私人定制版Schema.org(2016-2-18)

2016 ALA年会BIBFRAME更新论坛

今年ALA年会的BIBFRAME更新论坛报告上线:
BIBFRAME Update Forum at ALA -Powerpoints from presentations are now available(June 26, 2016)
4方面6个报告:
一、LC的BF试验:2个报告(第1阶段评估;下阶段试验)
参见:BIBFRAME试验项目培训资料(2016-4-2)
《LC有关BIBFRAME开发立场的声明》及试验进展(2016-4-1)
BIBFRAME试验第1阶段报告(2016-8-27)

二、LD4P:2个报告(1斯坦福的表演音乐;2哈佛的地图和动态图像-LD4L)
参见:重量级图书馆关联数据项目LD4P获得资助(2016-5-10)

三、Zepheira的LibraryLink网络:从2014年Libhub创始项目(libhub.org),到2015年bibfra.me,再到2016年图书馆链接网络(library.link)。目前该网络超过2千图书馆位置(指分馆数吧),1亿单件(典型目录转换一小时以内发布)
参见:BIBFRAME和BIBFRA.ME(就差一个点)(2016-5-10)

四、OCLC近期BIBFRAME相关活动3项:1再利用遗留数据(PCC-URI工作组),2扩展规范控制的范围(康奈尔IMLS项目:共享本地规范的国家战略),3定义创作性作品的新模型(与LC合作:对BF2草案提供专家反馈,书目描述中简化表达“地点”,调和其“作品”标识符)

参见:
ALA 2016仲冬会议的BIBFRAME更新论坛(2016-1-29)
(5个方面7个报告:LC;Casalini libri;LD4P:普林斯顿、哥伦比亚、康奈尔;OCLC;Zepheira)
推动关联数据应用:《数据技术新视界——与汤贝克面对面》参会记录(2015-5-6)
(有关BIBFRAME的4个项目:LC、LD4L、Bibflow、NLM)

——— 报告摘录:下阶段BIBFRAME试验 ———
Next BIBFRAME Pilot: Here is What It Takes (PPT, 313 KB) / Sally McCallum, Chief, Network Development and Standards Office
步骤1、修订词表和模型:2014年起,2016年4月布,更好地适应RDA,构建试验的所有工作的基础
步骤2、MARC到BF转换规范(建设中)
步骤3、MARC到BF转换程序
步骤4、文档准备:分离、合并和匹配
1、MARC题名规范->BF作品
2、MARC书目有统一题名无规范->BF作品使用统一题名信息
3、MARC书目无统一题名->创建BF作品描述
4、由MARC书目合并主题到BF作品描述、强化主题
5、MARC书目->分离为不同载体的BF实例描述),保留新BF作品和实例描述间的所有指针)
步骤5、准备基础架构(与其他任务同时,进行中):
1、使用带4Store三元组库的MarkLogic平台
2、主要移到内部平台到虚拟服务器
3、主要平台版本升级、增加新的三元组语义模块
4、无损移动LC关联数据服务(ID)而不中断ID服务
5、计划新载入BF文档到新语义环境
步骤6、修改BF输入编辑器和BF纲要编辑器(与其他任务同时)
步骤7、审核与增强关联数据服务(LDS)(与其他任务同时) :LDS(ID)是试验的组成部分,LDS向编辑器提供下拉与浏览信息,准备文档过程中为数据提供URI(步骤4),当移到新的MarkLogic版本时重新设计应用,基于试验1经验和2.0需求增强
步骤8,准备文档与保持培训

研究数据管理元数据(附OCLC研究报告《搭积木:为研究数据管理项目奠定基础》)

由于众多研究资助机构要求受助者让数据可公共获取,研究数据管理(RDM,数据监护Data Curation的近义词)在欧美相当受重视,一些图书馆开始主动寻求满足研究者在这方面的需求。OCLC研究部2016年4月13日发布研究报告《搭积木:为研究数据管理项目奠定基础》,为高校启动研究数据管理项目提供指引。从初级的提供信息(第1部分)到实际推出服务(第2部分),报告提供了大量参考资料,包括各机构实施样例与可用资源。

研究数据管理中离不开元数据。“数据只有在可被理解时才是有用的。鼓励研究者提供有关其数据的结构化信息,提供情景与含义,让其他人查找、使用并适当引用数据。至少建议研究者清楚告知他们的故事:如何收集和使用数据、为什么目的。这样的信息最好放在readme.txt文件中,并包含项目信息、项目级元数据,以及有关数据本身的元数据(如文件名、文件格式、所用软件、题名、作者、资助者、版权所有者、描述、关键词、观察单元、数据种类、数据类型和语言)。”(第8页)
对研究者来说,提供元数据可能是个负担,也需要获取帮助——对图书馆来说,就是提供培训;在实施阶段,也包括代研究者做质量控制与清洗。

本报告“元数据”提供的参考资料,包括如何撰写、可用工具、元数据标准清单:
• Cornell University. “Guide to Writing ‘readme’ Style Metadata.” 康奈尔大学(准备元数据文档)
• DMPTool. “Data Management General Guidance: Metadata Data Documentation.” (元数据文档制作工具)
• DCC. “Disciplinary Metadata.”  (英国)数据监护中心:学科元数据一览(生物、地球科学、通用研究数据、物理学、社会与人文科学)
• Research Data Alliance (RDA). “Metadata Directory.” 研究数据联盟:元数据标准目录(艺术与人文科学、工程、生命科学、物理学和数学、社会和行为科学、通用研究数据)

元数据中有“唯一标识符”,包括个人ID、数据集ID及数据集的引用格式,可用于追踪下载、引用及影响测度。数据集有DOI、Handle、ARK(档案资源键),个人有ORCID和ISNI(没提ResearcherID),相关参考资料:
• California Digital Library, University of California Curation Center. “EZID.” 加州数字图书馆、加州大学监护中心:EZID(有偿提供DOI和ARK创建与维护,每年300-2500美元不等)
• International DOI Foundation. “DOI Registration Agencies.”
• ORCID, Inc. “Register for ORCID ID.”  个人ID(开放研究者与贡献者ID)
• ISNI International Agency. “Do you have an ISNI?” 个人ID(国际标准名称标识符)
• DataCite. https://www.datacite.org/

via hangingtogether.org: Metadata for research data management / Karen Smith-Yoshimura (2016-4-18)

——— 搭积木:为研究数据管理项目奠定基础 ———
Erway, Ricky, Laurence Horton, Amy Nurnberger, Reid Otsuji, and Amy Rushing. Building Blocks: Laying the Foundation for a Research Data Management Program. Dublin, Ohio: OCLC Research, 2016.

第1部分:打下基础
需求评估
提供信息(培训,数据管理规划,活动数据管理,元数据,权利与隐私,数据发布、保存与存档)
通告、推广与宣传
第2部分:建立与推出
需求评估(单位、研究者)
定义政策、指南与策略
提供服务(培训,数据管理规划,活动数据管理,元数据,数据发布、保存与存档)
通告、推广与宣传(社区参与与告知,在线呈现,合作发展)

参见荔园图志:OCLC Research发布“建立科研数据管理新基础”的报告 (2016-6-1)