BIBFRAME早期实验代码公布

上月下旬BIBFRAME模型草案发布,只是一个框架,并没有具体的元数据格式。在邮件组中,发布者曾说会在12月后分享早期实验结果。才过了两个星期,上周五,LC的Kevin Ford在邮件组中提供了从MARC书目记录转换到BIBFRAME的两个程序,分别是LC开发的XQuery版和Zepheira开发的Python版。下载网址:https://github.com/lcnetdev/marc2bibframe
一直以为老外是下班时间不干活的,没想到周末就有不少人把这两个程序装上做试验,从MARCXML转换成分层次的BIBFRAME,还发现了些问题。
不擅长IT的编目员,则关注元数据格式。通过邮件组的讨论,也了解到可以从程序中看到转换规则──并拼出BIBFRAME的元数据格式

python的marc2bibframe https://github.com/lcnetdev/marc2bibframe/blob/master/python/lib/marc.py
XQuery的marc2bibframe
https://github.com/lcnetdev/marc2bibframe/blob/master/xquery/modules/module.MARCXMLBIB-2-BIBFRAME.xqy

Karen Coyle的做了个简单的BIBFRAME实验网页,放一些MARC记录对照的样例:
http://kcoyle.net/bibframe/
周一的时候只有普通图书、地图和CD三个样例。她还在征求记录,今天看增加了文集、缩微品和带头衔的人名。

那是一片丛林

Diane Hillmann前些天忽然吐槽二个月前宣布将要取代MARBI的元数据标准委员会(MSC),以自己在DCMI应用委员会(Usage Board)的经验及参与RDA注册词表的情况,点评MSC的自我定位,称之为“说大话”:
──“领导作用”,对兼职且一年碰头两次的委员会成员何以承担?
──什么是“标准”,是否经NISO或ISO之类的标准机构认可的才是标准?
──标准提交给MSC评审与评估,谁提交?依什么准则评审?用什么机制评估?
我之前曾做过比较,其实MSC基本上沿用了MARBI的职责。或许真是时代不同了,过去的定位不能直接拿来就用。

对我而言,从Diane博文中看到的更重要内容,是对RDA注册词表没有抓住时机的痛惜。三年来,RDA只有少部分词表获批出版,三组元素集至今仍处于“新提出”状态,在目前所见的图书馆书目和规范的关联数据发布实例中,RDA词表在元数据方案中微不足道,甚至在最初为RDA词表而建立的开放元数据注册(OMR)平台上,IFLA后注册的ISBD词表的应用都好于RDA词表,因之不难理解Diane的感受。

博文后半部分翻译如下[本人加粗]:
“RDA的工作是一个典型案例,说明开发标准比一开始看起来要困难得多,而对最终谁将实际使用标准,过程与及时性是何等重要。RDA开发开始得够早,在长长的开发过程中──开始是经典的专家闭门工作──整个世界变了。”
“2007年,作为[开发]过程的一部分,我参与了建立[注册]词表的工作,对RDA用于语义网环境是必需的……工作的完成被拖延(自2009年起由JSC做评审与出版),因为JSC只花有限时间考虑改变准则的建议,近期才完成。在此期间,随着时间流逝,很多曾经等候RDA词表完成的人得出结论,词表可能永远不会完成了,开始到别处找元数据元素集。”
“与此同时,两年前LC自己粗略地开始其书目框架计划。就目前所述,该工作似乎不太可能考虑RDA为其“解决方案”的重要部分。书目数据的其他各类大用户和供应者已开始使用不同的自建方案表达其数据为关联数据,这个(某种程度上的)新的大事。这说明性的表明,他们不倾向于使用RDA属性。”
“曾经MARC统治图书馆世界,在某些角落,仍然在怀念那个有很多确定性、很少选择的世界。那个时代不再回来,无论我们建立多少新委员会,试图控制新的、混乱的书目数据世界。事实是,我们的世界变动太快,而我们焦虑于把事情弄“对”,继续使用不再起作用的复杂过程,建立与维护累赘的“标准”。我们仍然试图坚持,“持续的评审”、“评价”和“推荐”过程有明晰的价值,但现实的看看当前的环境,让我们知道,它们可能已不再有价值,甚至[不再]有可能。”

──换言之,世界已经变了,RDA(或任何其他)并非大家的唯一选择,没有“标准”可以高枕无忧,如不抓紧时机,机会可能永远失去。
Diane的结语是:那是一片丛林(It’s a jungle out there)
参见维基百科

来源:Metadata Matters: Big Words (2012-10-26)

参见:无可奈何花落去:元数据标准委员会将取代MARBI (2012年8月27日)

图书在线发现新时代的关键是什么?元数据!

图书全文搜索时代,元数据还有用吗?在图书设计网站文章上看到如题的结论,还真另有一番感受。应该说,元数据原来就是图书发现的关键,现在仍然如此。
现在个人写书售卖,可以在亚马逊的Kindle平台、苹果商店、谷歌的Play……国内有豆瓣、盛大……,正是所谓的自出版。那篇文章标题是《自出版基础:元数据导论》,以浅显的文字告诉自行出版图书的作者:1、元数据是什么;2、元数据在检索中的作用;3、元数据与关键词合用。编译如下。

Self-Publishing Basics: Introduction to Metadata / by JOEL FRIEDLANDER (MAY 2, 2012)

元数据是关于某物的信息,图书元数据就是关于图书的信息,最常见的有题名、副题名、作者、出版日期等。另外还有类别、描述、读者对象,对图书的可发现性很关键。
元数据用于创建图书信息数据库,搜索图书时,就是查这些数据库中的元数据。如果元数据记录不完整或不准确,图书就不会显示在检索结果中。
关键词是帮助你的图书在搜索结果中排名靠前的秘密武器。发现最佳关键词是第一步,在元数据中使用它们是第二步。使用这些关键词的最佳位置包括如下字段:题名、副题名、类别、描述、目标用户。
五步完成最具优势的元数据
1、总结出最想要的关键词
2、创建元数据主文档
3、填写字段,特别注意题名、副题名、类别、描述、目标用户五个字段。“描述”字段尤为重要,有时被称为“注释”或“关于本书”之类,你可以在其中放入所有关键词,只要读得通顺。
4、每当要填写关于你的图书的表单时,就使用这个元数据主文档。
5、随时根据你的图书所面向的市场优化你的元数据。
更新元数据这样的无聊琐事,却是帮助你的图书在每个月出版的成千上万种图书中脱颖而出的利器。确保你的元数据完整、准确、富含信息,能使你的图书更有机会被目标读者注意到。

via mod librarian: Metadata Monday: Self-Publishing Metadata