日志标签 ‘会议’

图书馆从传统数据观走向关联数据及语义网:五周年

2012年5月16日

上月在不列颠图书馆举办了名为“五年来”的研讨会,纪念为RDA走出20世纪而举办的“数据模型会议”(伦敦会议)五周年。会议网站上的介绍:
Seminar: Five Years On. British Library, April 26-27, 2012

2007年4月在不列颠图书馆举办了“数据模型会议”,与会者关心RDA《资源描述与检索》与其他元数据界(尤其是语义网环境中)所用模型的契合。此次会议通称“伦敦会议”,是图书馆由传统数据观转轨至关联数据及语义网的关键点。今年4月正好五周年。
DCMI英国联合DCMI国际及其他机构,于2012年4月27日主办为期一天的研讨会,描述自2007年来的进展以资纪念并展望未来的进一步协作。
与会者包括2007年与会者,及其他图书馆数据及语义网界的重要人物,论文由DCMI出版并免费在线发布。
伦敦会议极大促进了主要国际书目元数据模型的语义网表达的发展,除RDA本身外,还包括IFLA的功能需求系列和国际标准书目著录(ISBD)以及MARC。现在关注点集中在本活动的管理与可持续性,以及开发支持图书馆应用的高水平语义与数据结构。

———-会议报告———-

会议报告在网站上可以下载PDF版。报告人阵容强大、内容丰富且专深,以至部分超出我的理解能力。每个报告引用或总结一句话,概述我的感受(而非理解)。
√ RDA编制方JSC代表Barbara Tillett:背景与概述
简介2007年会议背景,总结因会议而成为现实的RDA元素词表注册历程
√ RDA词表注册主持人、DCMI/RDA工作组共同主席
1、Diane Hillmann:由建立RDA词表学到的
注册RDA词汇时面临的问题及采取的做法,关于XML和RDF的差别,……(不易理解,待细看)
2、Gordon Dunsire:(泰瑞)龟的梦想
纯漫画界面,梦想用一个三元组统治MARC21/RDA/FRBRer/DCT/ISBD/DCMI?(没有解说不易理解)
√ IFLA代表Pat Riva和Mirna Willer:以RDF表达IFLA的ISBD和FRBR系列概念模型
ISBD和FRBR模型元素集命名域和取值词表已出版,并且由de-referencing服务提供利用。
√ 三个语义网应用实例:
1、剑桥大学:剑桥开放元数据项目(COMET) / by Edmund Chamberlain
印象特别深的一点:在开放自己数据的同时,用外部数据改善、强化自己的数据。[本地系统的MARC数据,不能用编程的方法更新,要改错可真是不容易]
2、不列颠图书馆:从标签到三元组:英国国家书目作为关联开放数据 / by Alan Danskin
报告中的数据与结论:2011年7月上线,每月处理2百万会话,说明权威网站提供有用数据是能得到利用的
3、Europeana数据模型 / by Robina Clayphan
Europeana数据收割自图书馆、博物馆、档案馆及音像库的数据,并用其他外部数据强化。
√ DCMI代表Tom Baker:五年过去了,下一步
展望未来五年,并介绍了前一日成立的二个小组:DCMI词表管理社区和书目元数据工作组──后者原为DCMI/RDA工作组。

———-乱弹———-
会议网站对上述报告均做了简介,除了二位RDA词表注册主持人,是一段相同的带小八卦的工作介绍:2007年会议第一天二人在不列颠图书馆的帕尼兹屋首遇,由于已消失在时间迷雾中的原因(For reasons lost in the mists of time),他们被指定为DCMI/RDA工作组共同主席,负责开发RDA词表等工作(JSC致力于条款文本)。由此工作组着手在开放元数据注册(OMR)中建立这些词表。Gordon继续以类似方式帮助建立IFLA标准词表[IFLA命名域],并与OMR团队合作把RDF版本MARC21加入OMR。──之前在自己的PPT中曾多次引用Gordon的内容,这下总算对他有了更多了解。

会议报告虽然看得懵懵懂懂,但有一个感觉应该不会错,即与会者均认为XML已经过时,RDF才是方向。现在已经有了不少实实在在的应用。

最后,剑桥PPT的总结发人深省:如果我们不能学会分享,没人再会跟我们玩了
No-one will want to play with us if we cannot learn to share (p.30)

via Metadata Matters: Using the sub-property ladder / by Gordon Dunsire (May 13, 2012)
该博客由Diane Hillmann和Gordon Dunsire等合写,后者近段日子连发语义网相关博文,很难看懂

伦敦会议网站:Data Model Meeting. British Library, London 30 April – 1 May 2007

IFLA语义网兴趣小组:Semantic Web Special Interest Group
属于信息技术部,2012年1月建立?

文献著录ISBD统一版专家研讨会

2012年3月30日

昨日在北京参加文标会举办的“文献著录ISBD统一版专家研讨会”。会议主要目的是在2011年ISBD统一版出版、RDA经测试得到认可的背景下,确定GB3792“文献著录”系列国家标准的走向。
会议由国家科学图书馆宋文主持,文标委主任曾建勋在会议开始时对标准总结的三句话是:“跟国际接轨,结合中国现实,推进实施和使用”。虽是听得耳熟能详,但最后一句还是很有现实意义的。
与会者普遍认为RDA如作为标准在我国还不成熟,赞同以统一版代替原来的系列标准。
从结果看,没有什么亮点。但上午的两个报告很有内容。只是回过头来看自己所作记录,都是选择性的、零散的,毫无系统性,可能对没听过报告的人意义不大。[同样方括号内是我加的说明]

———-顾犇:ISBD统一版:历史和现状———-
说明:顾主任2008年翻译了2007年的ISBD统一版(预备版),今年又翻译了2011年的统一版(正式版)。两个版本都是英语外的第一个翻译版,其工作效率之高,令人敬佩。由于2008年的中译本直接用了“统一版”,本次中译本被称为“2011年统一版”。
中译本要4月才能正式出版,为给每个与会者看到2011年统一版,顾主任请出版社先制作了没有ISBN的快印本,在会上散发。

·统一版历史
1998年FRBR出版后,重启ISBD各册的修订。但当古籍修订完成时,已经在做统一版,所以ISBD(A)修订版没有出版。

·本人的工作 [仅记录了部分]
2005年加入编目组常设委员会
2009年在ISBD和ISSN的会议上重点协调非拼音文字连续出版物题名变化问题 [参与国际标准的制订,提出我们的特殊情况,作为标准的可选做法,而不是自己关起门来强调自己的特色──这是多年来我们最缺乏的]

·2011统一版变化 [也未记全]
加第0项,去第1项的GMD
单行资源(“专著”易误解)
去除了古籍著录的特殊规定──原来每个涉及部分下面都给出一般情况和古籍的情况

·译名变化
monography/monographic:专著,改译:单行[这个更确切]
section:分辑,改译:分部(栏目)
舆图,改译:地图
tete-beche:前后颠倒,改译:双向倒转

下午讨论中涉及统一版的看法:
1、南京政治学院上海分院王松林教授认为译作“合并版”更合适。
2、有几位针对译文用语,提出“不要把晦涩语言放到标准中”。我理解中译本的目的是准确反映原有含义,有时不免拗口。真正制订我们的标准,完全可以改用通俗易懂的语言。但如果一开始就意译,再据之制订标准,或许会离愿意太远。

———-沈正华:RDA简介———-
说明:沈老师通读了目前正在改写RDA的Chris Oliver的首部RDA专著:Introducing RDA: A Guide to the Basics。
此报告有一个半小时,很全面,标题可说名不符实。由于前一日自己做了RDA的讲座,所以特别关注可以从沈老师报告中吸取哪些养份。

·RDA的主题部分将依据FRSAD,完成后将成为集著录、规范、主题标引为一体的编目规则。
·关系[的作用]:说明语可用以限定如只要某人翻译的,等
·元素:针对ISBD和AACR2同一著录单元或子字段中容纳不同数据元素的问题
·被设计成一个标准的web工具
·实体关系图:可视化概览
·流程,放本地化规定(可选)
·适用范围:档,博,数字存储机构

·国际化
基于FR,反映ICP
不同国家参与草案反馈
语言文字、计数体系、纪年方式
AACR2被译成25种文字,编制国:英、美、加三国+澳大利亚
注册词表,可用其他语言表达
国际化应用前景 [我自己的“国际化”部分基本局限于此]
原用AACR2的,或会改用

·与原有编目规则的关系
AACR2:解构,但继承与兼容
若干术语对照,如“标目”改“检索点”
原有记录的软件升级

·与ISBD的关系
ISBD只涉及著录部分
统一的前置标识符,克服语言障碍 [下午讨论时论及太陈旧了,我也曾写博质疑过:ISBD著录用标识符有何用?(2008年10月2日),当时顾犇主任还特意询问了ISBD修订组主要成员,并得到了汇总的答复:关于ISBD著录用标识符答编目精灵问 (2008-10-25) ]

·基础与……(FR及ICP)
以聚焦用户为目标(引用RDA条款说明)
描述所有资源类型的可扩展框架(内容,媒介,载体,举例音乐CD)
以数据元素为对象进行描述(其他物理细节,如放映速度……)
不定义著录级别、必备性,只有核心,省略核心会损害用户任务的实现
336-338,用术语和代码 [代码应该是MARC格式的规定,与RDA无关]
发行方式
按所见信息著录:客观转录,为日后电子转录打下基础(缩写基于卡片)
3的规则,可选的例子(and three others)
强调关系

·单靠RDA不能显示效果,还需软件系统改进 [鸡和蛋的关系,光有软件没数据也不行,比如需要大量数据转换增加336-338,才能分层显示、限定检索的效果;当然还有更麻烦的关系揭示,怕还很难批量转换]

会议季·RDA(附上图年会日志集锦)

2011年12月21日

从上周五开始,连着参加了三个会议,今天上海市图书馆学会年会是最后一个。深深体会到边上网边开会,不用笔作记录,是参会大忌。前两天深圳会议还记下一些,今天边参会边看直播、间或发条微博,根本没带笔,结果很没有吸收,连以往会议一直有的感想都写不出来了,能做的只有把自己的《RDA和MARC的未来》发出。已发到SlideShare上,格式和内容都略有缺失,不过基本内容还能看出。

今年自己在多个会议上讲到了RDA。第一次是6月25日上海市图书馆学会的“2011年图书馆前沿技术论坛:移动的未来”会议上的一个科普,PPT已挂在会议网站上。后来的几次都没有把PPT放出来,因为其中都大段引用了英国元数据专家Gordon Dunsire关于图书馆目录演变的精彩内容,尽管注明出处的,但公开发布恐有侵权。今天讲的不含此内容,可以放心发布。昨天下午ILS会议结束后,在深圳大学图书馆的讲座也讲了这个内容,附加Dunsire的目录演变示意图等。以前给出过Gordon Dunsire所有报告的链接,再给一次:

http://www.gordondunsire.com/presentations.htm

多个PPT中有类似演示,其中之一:A short history of the evolution of the catalogue record
书目记录演变为RDF三元组的PPT包含在:
Bibliographic data in the Semantic Web – what issues do we face in getting it there? Presented to the ALCTS Cataloging and Classification Section Executive Committee Forum, 24 Jun 2011.

[update]上海市图书馆学会年会相关日志集锦
说明:自己没写,汇集一下其他人所写(访问“书社会”日志需注册);会议PPT陆续上线中……

Keven的日志图书馆信息技术应用面临新变革 (2011-12-20 22:01)(会议报告的引言部分)

jji_jiuming的日志写论文 (2011-12-21 20:09)(两行字,盛赞王宗义主编报告)

安琪的图林生活(新浪博客):上海市图书馆学会2011年年会旁听小结(2011-12-21 22:05:05)(很学术的笔记)

老槐的日志
年会发言稿 (2011-12-21 23:03)(闭幕式发言,本届学会四年总结)
本届学会的年会 (2011-12-22 10:01)(有八卦)
上图年会发言稿(2011-12-26)(身份证前3位是310的“资深新上海人”的《新世纪上海图书馆学》)

DemiHuang的日志
参加上海年会札记(一) (2011-12-22 10:59)(老槐学生,总结最近十年人生,尚未进入正题)
札记(二)(2011-12-26)(大学老师膜拜篇、同窗同门情意篇、牛人科普篇)
札记(三)(上午主旨报告、下午图书馆理论/图书馆管理委员会报告专场点评)

huizixr的日志学术嘉年华——2011年上海学术年会成功举办 (2011-12-22 21:20)(高质量照片+感想,交大Galvin直播设备曝光:5台电脑+1台摄像机+1个网络摄像头+1个Pad+1个iPhone+1个三脚架+1堆充电器)

图林老姜的日志旁观学术年会 (2011-12-23)(一如暨往地爆料)

rainzen的日志当然,这是一个迟到的祝贺(2011-12-26)(围绕“上海学派”)

———-个人今年与RDA有关会议的分割线———-
“2011年图书馆前沿技术论坛:移动的未来”参见:关联数据和移动的未来(2011年6月26日,PDF)
9月9日上海图书馆讲座参见:建中读书:关注RDA(2011年9月9日)
上海市文献联合编目中心第十届年会(12月16日,标题《RDA进展》)
“2011高校图书馆集成系统发展研讨会”(12月19-20日,CALIS管理中心)参见:ILS与发现系统:开源、RDA及其他(2011年12月19日)(PPT链接已加)
上海市图书馆学会年会(12月21日,标题《RDA和MARC的未来》)

ILS与发现系统:开源、RDA及其他

2011年12月19日

月前收到深圳大学陈大庆馆长邮件,邀请参加CALIS管理中心在深圳大学图书馆举办的2011高校图书馆集成系统发展研讨会。了解了CALIS王文清老师关于内容尽可能有对下一代LAS或ILS的考虑/探索/建议/展望,以及会议意在听取对下一代ILS的意见和看法之后,准备命题作文“开源图书馆集成系统及其发展(含RDA介绍)",我用的标题是"ILS与发现系统:开源、RDA及其他",最后给出了三点建议。

从王文清老师在会议开始全面介绍CALIS四期LAS构想中,可以听出他们已经考虑过很多意见。会上各位也给出了各种很有见地的建议,有些对本馆系统的改进也很有启发,受益匪浅。而我,大概是会上唯一不加掩饰地直接对现在开发ILS唱反调、泼冷水的。

尽管前一天就到了,却是在会场上才和王老师打了照面。今天上午讲完,后来见到王老师几次,没直接交流,我觉得他看我的眼神充满着好奇••••••嗯,我没丢斧子。

会议PPT估计会上网,如果没有,回家再上传。

[update 2011-12-21]PPT已上传Slideshare

斯坦福关联数据研讨会报告

2011年10月29日

斯坦福关联数据研讨会于2011.6.27-7.1召开,会议主办者为图书馆信息资源委员会(Council on Library and Information Resources, CLIR)与斯坦福大学图书馆与学术信息资源中心(Stanford University Libraries and Academic Information Resources, SULAIR)。不禁联想到当年MARC开发也有CLIR(当时称CLR)的很大功劳。
会议报告于日前发布(报告下载),长达80页,有点不可思议,这是真正有所行动的会议。

———-引言(p.5-6)———-
概述会议背景及本报告内容:
·详述会议成果
·列出下步活动,包括为关联数据原型环境提出建议
·与会者小传
·概述会议期间的活动与讨论

———-W3C图书馆关联数据孵化小组最终报告(p.7-17)———-
引用W3C图书馆关联数据孵化小组最终报告,虽称引用的是草案,但网址是正式报告的。或许本报告的发布也是在等孵化小组最终报告正式发布吧(10月25日)。
据说孵化小组报告马上会有中文翻译([update 2011-11-14]图林中文译站:图书馆关联数据孵化小组最终报告/2011年10月25日W3C孵化小组起草;译者:娄秀明),此处略去,仅取一个定义:
· 图书馆数据:指图书馆生产或保管的、任何描述资源或助其被发现的数字信息。图书馆隐私政策范围内的数据通常不在此列。本报告基于其典型使用,划分作三类:数据集、元素集和取值词表。

———-经典MARC数据与关联数据方法比较(p.18-19)———-
详细介绍Tim Hodson的“大英图书馆数据模型”(British Library Data Model: Overview, 2011-7-22)(PDF版模型图),称其对现实关联数据模型的处理在图书馆环境中扩展了W3C关联数据的文本定义。

———-研讨会成果(p.20-42)———-
· 价值声明:为什么关联数据方法是有价值的原型/模型

· 关联图书馆(及博物馆、档案馆……)宣言(manifesto)
1. 为发现与使用而非暗中保存而在网上发布数据,不可及的档案通常是私有的或利益驱动的。
2. 持续改进数据与关联数据,而非等待发布“完美”数据
3. 以语义结构化数据,而不预备扁平的非结构化数据
4. 协作而不单干
5. 采用Web标准,而非领域独有的标准
6. 使用开放、广为所知的协议,而非封闭/本地协议

· 为图书馆催生关联数据环境 [实践]
1. 构建使用案例
2. 摄入数据(由开放存储中使用结构化数据,构建或转码关联数据,同时实施质量控制)
3. 发布数据,假定为开放的以让其他人可用
4. 提供基于使用案例的结构化数据的服务
5. 重复步骤1-5[4?],增加或更新使用案例,得到新的相关数据,改善数据、改进服务
6. 教育元数据生产者(如出版者、馆员、学术项目领导者),向最终用户推广服务

· 已知问题优先清单
问题涉及四个类别:出处、可用性、保存、标准
1. 跨格式参照、同指与一致(referencing, co-referencing, reconciliation)(标准)
[owl:sameAs;词表alignment]
2. 使用图书馆规范档-名称、主题等(标准、可用性)
3. 杀手级应用(可用性)
MIT、BBC野生动物网站、Talis的LinkSailor及Civil War 150网站
4. 归属、来源及授权(出处)
5. 培训创建、衍生与发布URI,以及在发现环境中做链接、用链接(可用性)
6. 数据可用性(可用性)
7. 质量控制(可用性)
8. URI标准(标准)
9. 数据保管(保存)
10. 责任分担(可用性)
a. 数据保存(即9)
b. 反馈、报告、奖励制度、计量、贡献关联数据/URI的激励
c. 博弈与竞争(即11)
11. 营销/拓展(可用性)
12. 流程(可用性)
13. 可扩展性
14. 索引
15. 本体使用(标准)
16. 许可(标准)
17. 注释(出处)
18. 身份管理
19. 与e-学术(尤其是e-科学)及e-学习的关系
20. 文化多样性(可用性)
21. 搜索引擎优化(标准)
微数据,Google的schema.org [仅仅是搜索引擎优化,没有竞争关系?]
22. 社会媒体:Facebook及类似应用
Facebook的开放图形协议

———-布署关联数据(见附录A)———-

———-搜索杀手级应用(p.43-44)———-

———-下一步及潜在计划(p.45-48)———-
· 下一步
斯坦福团队将在其他参与者帮助下,生成一个建立在关联开放数据上的多国、多机构发现环境模型,向最终用户、研究界证明关联数据方法的价值。该模型必然会的基本功能包括生成、收割、URI调和[reconcile?],以及改编或有必要建立一个或多个“杀手级应用”,组装/要求支持流程的必要步骤,以及学术信息资源的操作环境。该模型将与本次与会者及其他共享。

· 明确的建议
∠ URI创建
由学术期刊文章元数据创建结构化数据URI,斯坦福HighWire出版社与大英图书馆(BL)潜在联合计划。目标元数据来自:HighWire服务器的文章(6.7M)、Medline/PubMed的元数据(>21M引文)、大英图书馆得到许可使用的2万种期刊的文章。
∠ MARC记录
斯坦福团队将与与会的国家图书馆(LC、BL、BnF、DNB)等一同工作。受2011年9月欧洲国家图书馆会议(CENL)大胆声明、投票支持将其元数据开放为关联开放数据的鼓舞,我们将追随BL协同Talis所做优良工作──设计一个丰富的、理解网络的图书馆关联数据的数据模型,通过由MARC记录出取适当事实构建其关联数据,将数据发布为开放数据而不限制其使用。
我们的计划也包括关注支撑当今图书馆元数据的不同类型的规范记录。
∠ 开放VIAF
高度期望创建一个“开放的”VIAF,或者要求OCLC以开放关联数据服务提供VIAF。
∠ 手稿互操作
斯坦福将以URI收集手稿描述(著录)。随后可由斯坦福或其他机构连接展示不同中世界手稿集的个别应用。
∠ 关联开放数据工具套件
已知工具太一般不适合图书馆需要,出版者则需要另外的工具。
目标不是罗列所有已有工具,而是引进经试用与测试的工具与方法,向没有关联数据经验的机构提供。
∠ MARC交换所
应当由URI建立MARC交换所(数据存储),应当包括资源的FRBR第一组实体关系即WEMI。

· 其他潜在计划
特定领域计划
关联数据能力构造

———-读物与报告———-

———-相关工具(p.49-50)———-
· eXtensible Catalog
· BnF发布了其关联开放数据计划的初版http://data.bnf.fr。该计划应用FRBR原则,包括主要法语作家与作品的简单Web页,其HTML完全开放给Web。
实例 [虽不懂法语,但也看得出相当好]
· LUCERO Project
· Talis的LOD Around The Clock (LATC)

———-结论(p.50-51)———-

———-附录———-
· 附录A:RDF三元组创建与迭代和解(?Iterative Reconciliation)的样本流程(p.52-55)
[原则] 1. 早发布,常发布;2. 完美URI (Mint URIs);3. 链接留到以后
· 附录B:文化遗产机构相关的关联与开放数据(p.56-60)
[目前提供关联或开放数据的机构,长长的清单,可供按图索骥]
· 附录C:参与者(p.61-73)
[国际会议──看到德国、法国、芬兰、日本……,也有图书馆界外如Google参与。部分人未实际与会]
· 附录D:研讨会日程概要(p.74-80)

via Local Weather: Report of the Stanford Linked Data Workshop, 27 June – 1 July 2011 (published October 2011)(梯子自备)