“RDA理论与实践培训”参加记

2012年7月9-11日,国图请来顶级专家、RDA编辑指导委员会现任主席Barbara Tillett女士做为期二天半的RDA理论与实践培训,并全文翻译了培训的PPT,作为会议资料提供。培训班费用之低,也是多年来罕见的,还给每人发了一个中图学会的证书,有芭芭拉签名──二百多张证书,也真够她签的。

培训中,大家充分感受到芭芭拉推广RDA的不遗余力,一再欢迎用中文就RDA给她(btil#loc.gov)或者LChelp4rda # loc.gov发邮件。最后的未来展望模块(Looking to the future with RDA),有7页PPT的心愿单(Wish List),为RDA描述了一幅完整而美好的应用前景,真是令人向往(链接见后)。猜想会有人用来写论文,各位期刊编辑请认明原始出处
跟国图MM聊到年近古稀的芭芭拉精力充沛、真正喜欢自己所做的事。忽然悟到,我们通常更强调应该如何,或者说责任感,其实恰恰暗示是一种外界的强加、而非出自内心的愿望(这个扯远了)。又跟其他专家聊,我开玩笑说芭芭拉像是在传教。后来在微博上看到中图学会秘书长称之为布道──现在来说,一些机构还真有Evangelist这样职位。

会议全程英语。虽然自己听力烂,但因为相同的培训,芭芭拉已经在世界各地做了很多次,官方PPT早已在网上看过,加之对RDA及相关内容的原文比较熟悉,所以在现场听解释时基本没有障碍,并且通过自己和他人提问得到解惑,还是有不少收获。
当然自己更烂的是口语,不过提问好歹还是做到了让芭芭拉明白的程度,或者多少也是因为她懂七种语言、对语言领悟力强的缘故吧──第三天下午研讨会上,国图MM就没听懂。

PPT的内容还是有更新的,不少模块都有一年多来RDA的更新及进展,还包括全新的Bibliographic Framework Initial模块,现在官方PPT中仍没看到。不过因为建立模型的工作正式启动不久(芭芭拉说才三周,或指ALA年会中的更新会),所以并没有更多细节可以透露,据说要到9月才会有初步供讨论的报告。又是一个必须关注的内容。

培训中特别注意到自己在FRBR方面的一个认识错误,即内容表达实体的元素中没有题名,只是在作品题名后附加属性(或者说翻译题名并非内容表达的题名,而是载体表现的题名)。
另外一个消息是IFLA正在讨论,考虑在第3组实体中增加Time(年代、朝代等)。

———-培训视频及原文PPT———-
未能与会而又有兴趣的,可以看Barbara Tillett 3月21-23日在台湾“RDA讲习会”上的视频,内容应该是一样的。数位影音服务系统,快速查询 Tillett 即可。PPT原文在官网的Presentations on RDA部分,用原名在台湾网站上也能搜到(以下标注了国图相应报告的日期,以及PPT原文对应的Module号,目前最新的是2011年8月)

台湾“RDA讲习会”(2012年3月21-23日)
2012/03/21
RDA未來展望 (国图2012/7/11上午,PPT1:Looking to the future with RDA“:PPT2:Building Blocks for the Future : Making Controlled Vocabularies Available for the Semantic Web[update 2012-7-14])
2012/03/22
RDA講習會 (一) FRBR Review: Background and structure of RDA(国图2012/7/09上午;Module 1)
RDA講習會 (二) Identifying manifestations/items: Exercise(国图2012/7/09下午;Module 2)
2012/03/23
RDA講習會 (三) Identifying works / expressions: Exercise(国图2012/7/09下午;Module 3)
RDA講習會 (四) Identifying persons/ families/ corporate bodies: Identifying relationships(国图2012/7/10上午;Module 4 & 5)
RDA講習會 (五) Name authority record examples: Reminders–RDA “Top Twelve”(国图2012/7/10上午;Module 8)
RDA講習會 (六) RDA Toolkit walkthrough: Review of bibliographic examples(国图2012/7/10下午;Module 7)
RDA講習會 (七) US RDA Test and Bibliographic Framework Initiative: Preparing for RDA whether you implement or not(国图2012/7/10下午;Module 6,RDA测试为另一PPT,书目框架PPT尚无)

———-参见———-
RDA官方PPT(2011上半年)(2011年8月8日)
RDA最要记住的12件事(TOP 12)(2011年8月7日)
LC正式启动以关联数据取代MARC(2012年5月26日)
ALA 2012年会之RDA指南(2012年6月13日)

———-会议照片———-
ben的个人相册:RDA培训照片(相册)

书蠹精:
RDA培训中的自恋照 (2012-07-10 21:48:04)
[update 2012-7-13]
《资源描述与检索》(RDA)理论与实践培训开始 (2012-07-09 16:11:37)
“RDA在中国的实施和挑战”研讨会圆满结束(2012-07-11 21:47:29):第一张为颁证后合影
芭芭拉百态图(2012-07-12 22:52:00):讲课时生动的表情与手势

[update 2012-7-14]RDA会议总结 (2012-07-14 18:26:35):主办者的艰辛……

证书封面

证书内页

民国期刊全文数据库四种

民国期刊全文数据库,以前一直用国图和CADAL的。
最赞的是国图,完全公开访问。据河边前辈称国图的来自当年从全国征集的缩微期刊,因而只要有的品种,卷期都比较全。惜乎这事后来没有持续下去,所以国图民国期刊品种不算多,目前网站上提供4351种期刊。
相比之下,CADAL的民国期刊更为逊色。据2006年9月的检索结果,当时有民国期刊3802种,且卷期极为不全。看CADAL二期计划新增14万期(CADAL资源介绍),或可有所改善。

检索方面,国图目前优于CADAL的是提供目录(也就是篇名)检索,但检索结果到刊而非到期,因而这种“目录”检索基本上是无用的功能。试想如果该刊有30期,除了一期期看过来,没有办法知道想要看的到底是哪期,更不会说是哪篇(具体页码),还有多大的意义?
作为全文库,国图和CADAL的民国期刊库存在一个致命缺陷──没有篇作者信息。由于不是基于篇名做索引,而是以期为单位做目次,既没有给篇作者定义元数据,做目次时也没有录入作者信息,导致以现有信息根本没有办法查到篇作者。未来如果不辅以强大的技术手段提升其功能(OCR识别全文并定位作者),无法改变现状。
简言之,国图和CADAL民国期刊库的最大问题在于它们作为检索工具,只是目录而非索引。期刊目录基本上只适合查找从其他来源已知的文献,根据已知的刊名、卷期找到所需文章。期刊索引才能发现文献,对旧刊来说,特别有用的是查找某位作者有哪些文章,发表在什么期刊、何卷、何期。

去年底《大成老旧刊全文数据库》在本馆试用,这是个基于篇的期刊索引库,据称有6千余种刊、12万多期、150万余篇文章。当时用一位民国作者查了一下,可以查到一些,但由于没有比对,不清楚覆盖范围。
前不久微博得知《复印报刊资料》《全国报刊索引》也有《民国期刊全文数据库》,然后在本馆网站上发现3月下旬曾有短暂试用。现在虽然已经结束试用,或许因为在继续试用它家的《民国时期期刊篇名数据库》的缘故,全文库仍可以查(不能下载全文),于是用同一位作者查了一下,命中结果是大成的近十倍!不过并没有涵盖所有大成的期刊(但其篇名库有)。看介绍目前收录5千多种4百万篇(比大成品种少、但篇数多,可见卷期较全),最终会达到2万多种,如此,恐怕无敌了。
有点奇怪的是,篇名库与全文库并不对应,还有全文库有、篇名库却没有的情况。

———-民国期刊全文库四种———-
国家图书馆:民国中文期刊
来自缩微胶片的数字扫描工作,预计将在三年内完成近600万拍缩微胶片的数字转换。现提供4351种期刊电子影像的全文浏览。资源库遵循边建设边服务的原则,将不断追加更新资源库内容。
访问网址:http://res4.nlc.gov.cn/home/index.trs?channelid=6(公开访问、全文浏览)

CADAL(高等学校中英文图书数字化国际合作计划)
已建资源:236,594册民国书刊(未区分书刊);在建资源:民国文献20万册(期),包括:民国图书4万册,民国期刊14万期,民国报纸2万期。
访问网址:http://www.cadal.cn/(公开查询、注册后全文浏览──特定IP范围?)

《大成老旧刊全文数据库》
收录清末自有期刊以来到1949年以前(1840-1949),中国出版的6000余种期刊,共12万多期,150万余篇文章。
访问网址:www.dachengdata.com
提供公开检索,检索途径:题名(篇名)、作者、内容提要、刊名。检索一览显示:题名、作者、刊名、年卷期。──即使没有买该库,作为查找工具也不错。

《民国时期期刊全文数据库(1911~1949)》(《全国报刊索引》)
计划收录民国时期(1911~1949)出版的两万余种期刊,一千五百余万篇文献。
分辑出版(每辑250GB),目前的数量:
第一辑 1142种 31533期 811044篇
第二辑 1245种 28263期 830326篇
第三辑 1145种 31382期 794213篇
第四辑 2098种 30856期 804569篇
第五辑 (种、期不详)769345篇
《全国报刊索引》以索引起家、目前仍在销售篇名库,因之该库不登录不能查,对未订购者,这访问网址也没啥意思了:www.cnbksy.cn

P.S. 一直很奇怪,民国元年明明是1912年,为啥我们的民国文献都是从1911年开始算的呢?

———-分割线———-

《晚清期刊全文库(1833-1910)》试用记 (2010年11月29日)

电子版民国图书和期刊 (2006年9月27日)

国家图书馆民国期刊全文下载方法 (2007年10月18日)──方法已失效

国家图书馆民国电子书 (2007年6月26日)

开放中的中国国家图书馆

    以前,感觉中国国家图书馆的定位就是北京市的公共图书馆。为满足北京市民进阅览室读报看书自修而弄得焦头烂额,为业界及广大学界服务的主业似乎变成了陪衬。这几年,通过网站上提供的种种资源与服务,这种情况改变了很多,京外人士也能享受到国图的服务了。总的感觉是越来越象国家图书馆了。

    前些日子在第三届上海地区图书馆2.0会讲“建设开放的图书馆”,前一半时间是在称赞国图(其博客不在称赞之列)。虽然如手机服务不是开展最早的,但很有要做就做到最好的气势。内容整合与开放,也对大型图书馆具有示范作用。

    国图网站是个富矿,注意去挖掘,会发现很多有价值的内容。自己一直在向读者推荐国图的民国资源,尤其是其中的民国期刊,是国内开放最完整的。昨天遇一古籍部同事,讲到国图的碑帖(金石拓片),也很是称赞。据她说,原来很多图书馆的碑帖著录就像图书一样,信息过于简单。国图开放了数万件碑帖的图片与元数据,很具示范作用,现在大家都跟着国家图书馆,逐渐学会怎么揭示碑帖元数据。

    忘了在哪次会上,听国图数字化工作介绍,依稀记得是说目前放在网上的资源只是已经完成数字化的十分之一。新网站上特色资源的介绍是:
    “国家图书馆自2000年开始进行馆藏资源的数字化加工工作,目前自建数字资源内容涉及中文电子图书博士论文民国文献在线讲座在线展览甲骨实物与甲骨拓片敦煌文献金石拓片地方志西夏文献年画音像资源等,包括文本、图像、音频、视频等多种类型,资源总量达130TB,其中全文数据内容已达到1.2亿页。
    本特色资源库,以国家图书馆自建特色数字资源为主,实现网络发布资源总量已达4.01TB。本库文献涵盖了中文图书、博士论文、民国文献(图书、期刊和法律)、音视频、数字方志、甲骨实物与甲骨拓片、金石拓片、西夏文献、年画、中国学数据库等。为了方便读者使用,系统通过整合各种资源库,实现了对多种类型资源的跨库检索。读者可以在线或到馆检索、浏览、阅读这些资源。”
    原来开放的只是个小零头──自然盼望着可以在国图网站看到更多的资源。民国图书方面,目前CADAL有走向封闭的迹象,未来或许只能寄希望于国图了。

    当然,如果以美国国会图书馆(LC)为标杆,国图还有更多可向业界开放的内容。
    以自己比较熟悉的编目领域为例:LC的MARC标准网站,从很久以来的简明版到目前的简明版、完整版并置,还提供众多相关内容,以至论坛(邮件讨论组)供大家讨论;LCSH开始了面向机器同样也面向人的试验服务lcsh.info;书目记录更是一惯提供开放的Z39.50服务,受益全世界。
    前一阵子,青树教育基金会想为贫困地区学校图书馆做自动化管理系统,向我了解国内的Z39.50服务器信息。以往知道的的那些服务器,现在是连简编记录都关闭了。后来一网友在某处留言,告知辽宁图书馆是开放的,试了一下,虽然只是简编记录,也聊胜于无了。
    因此,很期待国图有朝一日也能如LC那样,开放分类主题词表,使《中图法》也能在网络资源组织中取得一定的位置;开放CNMARC,让国内外都能了解我们的MARC标准;开放Z39.50服务,让所有图书馆都能方便地使用国图的书目记录建立自己的目录,尤其是那些贫困地区、刚开始建图书馆、建自动化管理系统的小馆。

参见:
大旗底下:国图博客,赞一个先!(2008/09/07)
国家数字图书馆标准规范建设 (2008-09-26)
上海地区第三届图书馆2.0会议点滴·附科文杯情报搜索大赛广告 (2008-10-09)
           [PS:请抓紧搜索大赛的答题,马上就要截止了,据说目前奖品仍然多多]
广告:Koha开源社区·中学图书馆志愿者 (2008-09-06)