北卡州立大学图书馆RDA测试资料

2011年8月20日 由 catwizard 没有评论 »

北卡州立大学(NCSU)图书馆元数据与编目部的“RDA测试”网站,大部分可公开访问,包括详细的NCSU RDA测试资料,有其对RDA选项的选择,有些与LC测试选择不同。还有其他外部资料,相当完备。

目次
RDA Toolkit
NCSU RDA Test Wrap-up(测试统计)
NCSU Local RDA Test Participant Information(测试情况)
NCSU Local Policy & Procedures(本地政策)
Questions, Clarifications, and Curiosities(本地政策问答)
NCSU RDA Test Workflows(不同类型资源的工作流程)
NCSU RDA Test Workforms(不同类型资源的工作单,有对各字段的说明)
NCSU RDA Test Practice Record Electronic Surrogates & RDA MARC 21 Test Record Examples(含LC及芝加歌大学测试记录例子)
NCSU RDA Training Documentation(1+3天培训,第1天为“FRBR和FRAD导论”)
NCSU RDA Presentations(Erin Stalberg等在不同会议的报告)
External Documentation(内容丰富,包括芝加哥大学明尼苏达大学的RDA测试网站)

———-测试记录统计[常见文献为主]———-
合计462条,其中原编为主390、套录62、MODS记录10;
以电子学位论文为主223,其后依次为图书90、电子书64、印刷连续出版物31、电子期刊20、非MARC 10,零星的有DVD、网站、音频CD、计算机文件、数据库、流媒体、电子游戏、学位论文、CD-ROM、录像带。

———-测试情况———-
LC提供测试共同集的代理(Surrogates),为待编文献相关信息(如封面、书脊、目次,光盘、封套等信息源,以及无法实际量的尺寸)的PDF扫描件或联机资源的网页。
1、原编共同集25条(记录代号A-Y),由不同编目员分别按RDA和AACR2编目,不做分类、主题。其中单独15、连续/集成10:印刷专著6,印刷多部分专著1,电子专著3,影音5(电影DVD、流媒体视频、录音CD、有声书、海报)、印刷连续出版物2、电子连续出版物3、集成性资源5(印刷活页1、电子资源4)。
2、套录共同集5条(记录代号AA-EE),印刷连续出版物1、PDF单个文本1、图书3。按RDA更新记录,不做分类、主题。在题名前给套录代号。
3、测试附加集的产生:日常工作中用RDA原编,如遇符合升级政策的记录则套录修改。
4、另外测试了非MARC格式(MODS)。
以上各项完成后均填写美国测试调查和本馆测试工作单。

———-NCSU本地政策———-
一、336-338字段
1、使用33X字段
2、同时采用术语|a和代码|b
3、同一33X字段可重复,子字段不重复 [有助于处理]
4、使用“OCLC增加33X宏”生成主记录中的33X字段 [见后]

二、3的规则
不采用省略3个以上责任者的规则(RDA 2.4.1.4 or 2.4.1.5)
两个以上创作者,主要或第一责任者入1XX字段,其余入7XX字段。

三、关系指示词[责任方式]
1、对所有资源使用100-111及700-711字段的|e或|j子字段。子字段可重复,如:
700 1# |a Hecht, Ben, |d 1893-1964, |e screenwriter, |e director, |e producer.
2、关系指示词术语取自RDA附件I、J和K
3、RDA附件I、J和K中的术语是开放词汇,但NCSU的政策是将其视为封闭词汇,不自行创建术语 [关系指示词应当有规范控制]

四、关系指示词[相关文献]
1、对所有资源在700-730字段中使用关系指示词术语
2、关系指示词采用|i子字段,为首个子字段。如:
700 12 |i paraphrase of (work) |a Tippett, Michael, |d 1905-1998. |t Mask of time.
3、关系指示词术语取自RDA附件J

五、单部分专著的出版日期
出版日期为必备,有版权日期必录(无出版日期推测用方括号)
如书上标版权日期:©2010
例A: 260 ## $a Hoboken, N.J. : $b Wiley, $c [2010], ©2010.
例B: 260 ## $a Hoboken, N.J. : $b Wiley, $c [date of publication not identified], ©2010.
例A、例B均可,NCSU选择例A,因为其所用Sirsi系统按008第1日期做索引与排序。
DtSt = t
Date 1 = date of publication
Date 2 = copyright date

六、未完成连续出版物的300字段

https://staff.lib.ncsu.edu/confluence/pages/viewpage.action?pageId=17602010

不同与LC决定在此情况下不用300字段,NCSU只是不用|a,但用|b和|c,如:
300 ## $b illustrations ; $c 28cm

———-其他资料———-
一、OCLC宏:OCLC Macros for Creating 33X fields in RDA Records
OCLC为其联合编目客户端Connexion做了一个宏,用于为RDA新增的336-338字段,估计是根据记录头标06代码提供下拉菜单,选择所用术语|a和MARC代码|b(无需手工输入)。取值表见“二”。

二、LC代码与控制词表取值表(Value Lists for Codes and Controlled Vocabularies)
Term and Code List for RDA Content Types (336)
Term and Code List for RDA Media Types (337)
Term and Code List for RDA Carrier Types (338)

三、查找LC目录中RDA记录的方法
J. McRee (Mac) Elrod于2010-10-20在RDA-L邮件组中提供:
1、在目录首页选择Basic Search
2、搜索框中输入:040e rda,检索类型单击Expert Search,开始检索
可在此基础上限定不同的文献类型。
今天(2011-8-20)共检出4795条,记录一下。

参见:RDA书目记录样例及芝大测试主页 (2010年8月6日)

大学图书馆编目实践调查2011-2012

2011年8月19日 由 catwizard 1条评论 »

远洋师在书社会介绍《大学图书馆编目实践调查》(2011-2012年版)。这又是一份价格不菲的报告,公开访问的介绍文字及摘要,可了解部分内容。
The Survey of Academic Library Cataloging Practices, 2011-12 Edition
Print:$89.50
PDF:$89.50
Multi-SiteLicense:$199.00

———目次———
1. 人员问题
2. 工资问题
3. 工作量补偿
4. 技术
5. 外包
6. 图书馆学院编目教育状况

———-介绍文字翻译[解读]——–

本研究密切关注大学图书馆如何配置编目人员、如何使用馆员,如何使用编目技术员,管理者回答如下问题:不同类型或组织中,哪种工作由馆员和准专业人员执行?外包多少?如何处理特藏?编目人员在增长或萎缩?管理方如何评价工作质量?什么被认为是合理的测试或优秀的?电子书或音像资料编目在什么程度上外包,与其他类型资料相比如何?

160页报告的一些发现
• 81.43%图书馆中日常由准专业人员做套录,58.57%中由专业馆员做 [多数馆都有专业馆员做套录,是因为需要原编的越来越少了?]
• 30%图书馆中由准专业支持员工做OCLC主书目记录强化工作,75.71%中由专业馆员做 [准专业人员更新OCLC主书目记录的比例也不低了]
• 做编目工作的专业馆员中,各馆平均50%在未来5年中将退休,社区学院最少,中位数10% [编目员青黄不接]
• 28.57%私立学院和17.95%公立学院认为以上架时间作为编目工作质量指标十分有用,包括33.33%的社区学院和25%四年制大学 [详见后面图表]
• 45.71%大学图书馆,以获得新或更新规范记录方式外包规范控制工作。私立学院和高等级大学最常外包,按卡内基等级1和2的研究性大学,73.33%外包此项工作 [规范记录更需要高素质馆员,但外包比例相当大,是因为与图书上架关系较远?]

数据按大学图书馆的类型和规模分别统计[总样本、按学生数分类、按学院类型分类、按公立私立分类],调查参加馆约75所。

———-Excerpt:编目工作质量指标(表3.1-3.18)———-
表3.1 是否跟踪从采访验收到编目到上架流通时间Entire Sample
Yes 25.00%
No 71.67%
Don’t Know 3.33%
[结论:3/4不关心此项。社区学院100%不关心(表3.3)]

表3.5 对使用编目工作质量指标的态度──工作量
Entire Sample
Very Useful 非常有用 6.15%
Somewhat Useful 有点用 29.23%
Not Useful 无用 20.00%
Misleading 误导 24.62%
Detracts from Quality 有损于质量 20.00%

[结论:近2/3对工作量持负面态度(后三项合计)。学生规模大于10000的相对支持工作量,合计超过1/2(表3.6)]

表3.9 对使用编目工作质量指标的态度──从验收到上架时间
Entire Sample
Very Useful 22.39%
Somewhat Useful 55.22%
Not Useful 7.46%
Misleading 8.96%
Detracts from Quality 5.97%

[结论:超过3/4认为上架时间有用(与表3.1矛盾?)。学生规模大于10000的尤其如此,前二项合计超过90%(表3.10);4年制大学合计超过80%(表3.11)]

表3.13 对使用编目工作质量指标的态度──书目记录错误率
Entire Sample
Very Useful 25.37%
Somewhat Useful 56.72%
Not Useful 11.94%
Misleading 5.97%
Detracts from Quality 0.00%

[结论:超过4/5认为书目记录错误率有用,没有认为误导的。硕士或博士级学校前二项合计更是超90%(表3.15)]

表3.17 对使用编目工作质量指标的态度──书目记录完整性
Entire Sample
Very Useful 47.76%
Somewhat Useful 37.31%
Not Useful 13.43%
Misleading 0.00%
Detracts from Quality 1.49%
[结论:超过85%的认为书目记录完整性有用,但也有近1.5%认为误导。基本上是学生规模大于10000的如此认为(表3.18,4.76%)]

RDA官方PPT(2011上半年)

2011年8月8日 由 catwizard 1条评论 »

JSC网站发布近期RDA相关会议PPT(Presentations on RDA),说明是JSC成员、RDA延伸组成员及其他RDA开发相关人员所作报告,可视为官方PPT。

2011年上半年基本上是Barbara B. Tillett和Judith A. Kuhagen二人在不同会议上的报告。除美国各地图书馆协会或专业协会的会议外,Barbara于6月8日在德国国家图书馆介绍了RDA美国测试,5月30到6月1日在意大利佛罗伦萨大学讲了三天──记得去年“RDA在欧洲”会议时,意大利刚出版了新的编目条例,几乎是欧洲的国家图书馆中唯一对RDA不感兴趣的。

从标题与PPT内容看,二人所讲互有重复(采用相同底本),部分PPT有详尽备注,不至让人光看幻灯片而不知所云。几个会议的特点:
意大利的“RDA研讨会”三天中的内容比较完整;
德州图书馆协会“RDA会前会”(4月12日)有两个关联数据与语义网内容(VIAF占主要部分,也有RDA注册)。
美国专业图书馆协会“RDA概述”会议(6月14日)的“内容标准、RDA测试、你的准备”(The Content Standard, US RDA Test, Your preparations)则几乎综合了各种内容(130页)。

大致看过,延伸备忘若干:
1、RDA工作文档Working Documents
6JSC起首的为RDA发布后提出的修改与建议
2、参考资料Webliography
3、RDA测试记录下载RDA Test Record Downloads
4、Gordon Dunsire的PPT
Gordon Dunsire为IFLA分类索引部、FRBR评审组、ISBD/XML研究组成员,命名域工作组主席;大英图书馆/CILIP之RDA委员会、RDA延伸组成员,DCMI/RDA工作组共同主席;MODS编委会成员。
其PPT多涉及语义网/关联数据。上述RDA报告中对现有书目记录到FRBR记录演变的动态演示基于其PPT(多个PPT中有)。

RDA最要记住的12件事(TOP 12)

2011年8月7日 由 catwizard 没有评论 »

RDA声称其基础有二,一是FRBR/FRAD,一是ICP。RDA在结构上基于FR模型,FR的影响显而易见。相较而言,ICP的影响就不那么明显直接。这几天正在想这个问题,看6月1日Judith A. Kuhagen在NASIG(北美连续出版物兴趣组)会前会上的“最要记住的12件事”,略有所得(5月30日到6月1日Barbara B. Tillett在意大利佛罗伦萨大学“RDA研讨会”、5月4日两人在马里兰图书馆协会会前会“RDA来了、你准备好了吗”上有相同内容)。见:Presentations on RDA (2011)

“Top Twelve” things to remember [ppt]

#1 用户需求/用户任务:查找、识别、选择、获取
说明:源自ICP(国际编目原则声明)总原则一“用户的便利性”(在对著录以及用以检索的名称的受控形式作出抉择时应该考虑到用户)。需要编目员判断,在核心元素之外,是否还需要其他数据以满足用户任务。

#2 “用所见形式”(表达性原则)
说明:ICP总原则三(著录以及名称的受控形式应按实体描述其本身的方式来确定)。

#3 基于元素的描述:方便重用元数据、元素集及控制词汇的注册、更多采用已有数据(如ONIX)
说明:当指不是基于“记录”

#4 作品、内容表达、载体表现、单件(WEMI)
说明:FRBR第一组实体,所描述资源的方面

#5 “核心”与“如果……核心”元素:可增加(与#1相关)

#6 替代、可选省略、可选增加(与#1相关)
说明:由各单位自己选择决定。未来数月将分析LC为RDA测试所作的初步决定以决定未来的实践[LCPS吧]。

#7 更少缩写(与#1和#2有关)
说明:更方便用户理解

#8 关系、关系、关系(多超出核心元素)
说明:指明关系以在书目系统中更好导航[ICP目录功能,在4个FRBR用户任务上增加:查找、识别、选择、获取及导航。RDA未采用“导航”。]

#9 内容、媒介、载体类型
说明:取代GMD(一般资料标识)。希望未来的系统能够用于显示相应图标、作为其他可视显示的依据,过滤或限定检索,对资源分组。

#10 取消“3的规则”──由编目员判断
说明:“3的规则”成为替代做法

#11 信息源扩大
说明:一般而言,任何来源均可用于识别数据。对某些元素,给出优先顺序的信息源

#12 识别特征(元素及关系)作为未来系统的基础:与厂商讨论新系统需求
说明:留待系统开发商使用RDA元素集与控制词表的结构与关系,为用户及方便编目员而建立更复杂的系统。

“MARC21作为数据初步”读后感

2011年8月6日 由 catwizard 2 条评论 »
MARC21 as a Data: A Start / By Karen Coyle. Code4Lib Journal, Issue 14, 2011-07-25. ISSN 1940-5758
一、子字段关系类型
以前看远洋师解说词汇间关系,老觉得自己脑子不够用。本文“Finding Patterns”部分对MARC21的子字段与同一字段其他子字段及资源(当指字段)关系的明确划分,也是需要类似的清晰头脑才能分析出来的。

Figure 1.Types of Relationships Between MARC Subfields

二、控制字段00X
从计算机处理角度,控制字段(主要是006、007、008定长字段)虽显复杂但含义明确,可以直接使用“00X+文献类型+位置”生成标识,如:
007microform05 表示缩微品的压缩比
008map22-23 表示地图的投影
推理:再配以取值词汇表,可以很方便地变成“数据”。
三、字段指示符
MARC21的字段指示符使用非常广泛,这使得同一字段可表达更多的不同含义。0XX数字与代码字段从定义上只能容纳不足100种含义,但由于字段指示符的使用而有很大的扩展余地(如024第1指示符=7标准号类型在$2说明,使包含的标准号类型可任意扩充)。但如此增加了将MARC21记录处理为“数据”的复杂性。
字段指示符还有完全不同的用法:“是或否”──当指050第2指示符LC馆藏;单个值或多个值,如034第1指示符比例尺是单个还是范围,这个被指完全没有必要。
四、被取消的标准号(024字段)
文中对于024中其他子字段与$a依存关系的认识或有不足:
$c获得条件与标准号的依存,是因为在同一条记录中,会有多个号码,不同号码有各自的获得方式(如标价)──即使不同载体如纸本与电子版做多条记录仍是如此,最常见的有精平装、不同卷册,除非一号一记录。由于美国出版物上标价的不多,所以现有记录中少见$c,或许因之Karen不明如此设计的理由?
$z取消号的情况同样如此。所以文中表格的下面部分或许应当更改:
ISRC Cancelled     024 0  $a024$z
UPC Cancelled     024 1  $a024$z
ISMN Cancelled     024 2  $a024$z
EAN Cancelled     024 3  $a024$z
SICI Cancelled     024 4  $a024$z
UNKnown Number Cancelled     024 8  $a024$z
Other number cancelled     024 7  $a024$z 024$2
五、特例(XXX描述字段)
本文更多关注特例字段,或许因为这些字段特别需要花精力分析,只是不免显得MARC21似一无是处了。

1、功能而非语义的240字段

对编目员而言,选择240还是130是考试点;机器则无法理解文中后两例(作品集统一题名)。MARC21其实定义了243字段作品集统一题名,可惜实际应用中多采用240字段,用243的极少。
2、冗余字段的存在是为了提供关联,76X-78X连接款目字段就更是如此。
但在MARC21实践中,如773这类字段实际使用不多,这种形式间有差异的情况,对关联记录是负面的。
六、UNIMARC更胜一筹?
比较而言,UNIMARC字段指示符多为缺省值,其1XX代码字段基本一字段一含义,或许比MARC21语义更清晰些。
由于采用嵌套方式(后来增加的子字段可选方式也一样),连接字段形式不一致问题在UNIMARC中应该不存在。