媒体(影音)资源元数据格式大全

Ontology for Media Resources 1.0, W3C Recommendation 09 February 2012
W3C的《媒体资源本体》提供描述媒体资源属性的核心词表,以及核心词表与Web上发布的媒体资源元数据格式的映射,目的在于提供元数据表达,以可互操作的方式描述媒体资源的特征与行为,使不同应用能共享和复用这些元数据。
元数据格式(18种):cableLabs 1.1, DIG35, Dublin Core, EBUCore, EXIF 2.2, ID3, IPTC, LOM 2.1, Media RSS, MPEG-7, OGG, QuickTime, DMS-1, TTML, TV-Anytime, TXFeed, XMP, YouTube Data API Protocol
元数据容器格式(6种):3GP, FLV, QuickTime, MP4, OGG, WebM
描述属性核心集(核心词表,28个属性[红色为dc元素,方括号内为dc标签])
Identification 标识4种identifier, title, language, locator
Creation 创作4种contributor, creator, date, location [coverage]
Content description 内容描述4种description, keyword [subject], genre [type], rating
Rational 关系2种relation, collection [source]
Rights 权利2种copyright, policy
Distribution 发布2种publisher, targetAudience
Fragment 片断2种:fragment, namedFragment
Technical Properties 技术属性8种:frameSize, compression, duration, format, samplingRate, frameRate, everageBitRate, numTracks

附:PBCore 2.1
《媒体资源本体》 号称收录所有在Web公开发布的元数据格式,但PBCore并未包含在内。或许因为是XML格式?
PBCore(维基百科)是声音和动态图像的元数据规范,起源于2001年“公共广播公司”(Public Broadcasting),宣称是基于都柏林核心的扩展(从名称上也可以看出)。2015年8月发布的2.1版定义有80多个元素(Elements),为向下兼容先前格式,仍定义有约50个特性(Attributes),而不是定义为独立的元素。PBCore目前正共同维护《媒体资源本体》中的EBU(欧洲广播联盟元数据规范)。
特别有参考价值的,是2011年PBCore在开放元数据注册网站(OMR)上注册的30个左右取值词表,用于影音资源的描述,相当丰富。
通用的如:创作者职能(21个),贡献者职能(146个),出版者职能(5个),受众层次(15个)
专业的如:载体(269个),代(182个),屏幕长宽比、位深、帧大小、采样率等。

不列颠图书馆之馆藏元数据战略2015-2018

不列颠图书馆(British Library,BL)11月23日发布《解锁价值:不列颠图书馆之馆藏元数据战略 2015-2018》。
Unlocking the Value – The British Library’s Collection Metadata Strategy, 2015-2018

本战略充满企业管理术语:资产、价值、潜在价值,治理、商业利益,投资、投资回报,效率、优先级等(不由得联想到数十年前就经营得相当不错的BL外借部;似乎BL也是最早——如果不是唯一——馆长称Chief Executive的)。
本战略的核心目标:转变馆藏元数据,由被动的副产品主动的使能者,提供更大的效率、互操作性和实用性(enabler“使能者”,据说最近也是相当流行——题外话:即将举行的上海图书馆学会2015年会,标题:图书馆:变革时代的使能者
馆藏元数据的三个优先级,可以抽出三个关键词:效率、投资回报、开放

本战略附《馆藏元数据战略路线图 2015-2018》(Collection Metadata Strategy Roadmap, 2015-2018),初看感觉是把N维化成了平面表,实际上就是年份的二维表,但可视化做得相当好:
9个方面:标准,许可和权利管理,元数据管理,处理效率,沟通,保存、维护和强化,开放元数据,发现和传递,技术基础架构;
4种类别:活动、评估、里程碑、成果,包罗在2015-2018年间要做的数十项工作;
最终在2020年达到2个结果:统一且标准化的元数据管理基础架构,提供综合性开放元数据服务。

前面所引都是关键词。浅显的理解是:馆藏元数据的价值在于广泛取用而非金屋藏娇。为达到此目的,需要从上述各方面开展工作。

———摘要(p.2)———
“我们的愿景是,到2020年,本馆的馆藏元数据资产将是综合、清晰、权威且可持续的,解锁其全部价值,用于改进内容管理、更多协作和馆藏的更广泛使用。”
馆藏元数据是一个涵盖性术语,指元数据,应用于:管理、获取、保存和描述馆藏。本文件联合本馆的馆藏元数据活动的战略讨论,确认必要的基本原则、优先级和治理结构,可以通过改进我们元数据资产的管理,提供更广泛的商业利益,支持传递我们的核心宗旨和方案。
馆藏元数据既是代表数世纪的人年投资的关键资产,也是潜在的当前运作和未来发展的使能者。但是,除了其对众多利益相关者的战略重要性,馆藏元数据对服务改进和强化馆藏管理的潜在价值,仍有待开发。
本馆藏元数据战略确认开始解锁我们馆藏元数据中潜在价值所需的主要优先级。核心目标将是其转变,由被动的副产品到主动的使能者,提供更大的效率、互操作性和实用性。
战略优先级是:
推动在馆藏元数据创建、管理和开发中的效率,以支持传递本馆的的战略优先级和方案
改进本馆在其馆藏元数据资产中的投资回报,通过确保其长期价值为未来活动而维护
开放更多本馆的馆藏元数据,以改进对图书馆内容的访问,促进更广泛的重用
本战略也包括管理本优先级的实施所需的治理与测度,以及在此期间的高层目标。由于快速进化的运作环境,实施细节将由每一财政年的年度计划覆盖,由同期本馆的优先级确定。

via 台湾……编目园地:大英圖書館公布館藏詮釋資料策略(2015-11-25 )
不列颠图书馆新闻:British Library publishes Collection Metadata Strategy (2015-10-23)

BNB用RDF词表《不列颠图书馆术语》

小河尘在书社会中详细介绍英国国家书目关联数据的方方面面([学习笔记]关联书目数据系列之BNB Free Data,2015-1-6),文后参考文献又提供了进一步信息。

博文开首是BNB的数据模型与词汇表。BNB复用了很多已有词表和本体,大致可分为四个方面:
(书目描述)DC、BIBO、ISBD
(名称规范)FOAF、Bio、Org、RDA第2组元素(OMG版)
(主题规范等)SKOS、Event Ontology、WGS84 Geo Positioning
(基础标准)OWL、RDFS
对上述词表没有覆盖的部分,不列颠图书馆发布了自己的“不列颠图书馆术语”(British Library Terms,blt:)。顺博文链接去Schemas at the British Library,把其中的blt:细细看了一篇。

British Library Terms RDF schema v.1.4.1 (2013-10-03)
和其他书目词表/本体不同的是,把出版作为一个事件(类),而不是资源的一个属性。

类(概念、事件、组、词表)
– Concept 概念(分类/主题)
— TopicDDC(DDC号)
— TopicLCSH
— PersonConcept(个人概念)
— FamilyConcept(家族概念)
— OrganizationConcept(机构概念)
— PlaceConcept(地点概念)
– Event 事件(事件本体 event:)
— PublicationEvent(出版)
— PublicationEventEnd
— PublicationEventStart
– Group 组(FOAF)
— Family(家族)
– Vocabulary 词表

对象属性(创作/贡献、出版开始/结束)
– hasContributedTo(反向dct:contributor)
– hasCreated(反向dct:creator)
– publication
— publicationEnd
— publicationStart

数据属性(BNB号)
– identifier(dct:identifier)
— bnb(BNB号)