若有所思 – 第 270 页

简化MARC21

刚过去的十月，LC的MARC标准主页上的MARC论坛讨论热烈，最热的话题就是减少MARC字段数（Reducing number of MARC fields?）和简化MARC21（About simplifying MARC）。

    事情由九月末论坛中的活跃人物J. McRee (Mac) Elrod (Special Libraries Cataloguing Inc.)介绍一项MARC内容标识符使用研究而起（The MARC Content Designation Utilization Study）而起。他介绍说，对40万MARC记录的分析，在MARC21近2000个字段及子字段中，小于50%的仅出现一次；36个字段与子字段覆盖所有使用的80%。他认为这些发现会支持简化MARC21。
    实施此项研究的北德州大学图情学院助理教授Shawne D. Miksa博士立刻说明，目前只是一个测试，未来将分析OCLC的WorldCat中5600万条记录。
    尽管他说明研究目的不是对MARC使用作出任何判断以至于减化MARC，只不过是为未来对MARC的决策提供经验数据。但仍激起了最热烈的讨论。
    编目员一讨论起“字段”，就没完没了。众说纷纭，我一见就头痛不已，只略看了几篇。

以前就想过UNIMARC是如何炼成的，与LCMARC有那么多的不同。应该不是横空出世，是不是设计LCMARC时建议未被接受，失意之余重起炉灶，弄得现在两种MARC格式差异如此之大？
在UNIMARC建立之后，好象根据LCMARC/USMARC/MARC21改了一些。比如跟着增加856字段，比如4XX连接字段由$1嵌套方式，改为可选择采用$a$t等子字段方式。早知今日，何必当初？

    不过，三十年河东、三十年河西，大概到了UNIMARC咸鱼翻身的日子了。
    在这次讨论中，UNIMARC的东西就被翻出来不少，希望MARC21能依此改变。比如不著录ISBD的标识符（字段结束是不是要加点自然也不是问题了），比如ISBN字段后面用子字段标明装帧方式（而不是直接用括号），比如题名与责任方式增加一些子字段以明确说明各著录单元。
    前面两项我赞成，一个是简化著录，一个是简化索引；后一项那就是自找麻烦了，纯著录用，又不提供检索，为什么要增加子字段？真没想到，简化MARC的讨论，复杂化竟然也堂而皇之登场。

用得最多的33个USMARC字段

用得最多的39个CNMARC字段

飞云的博客：MARC数据中的字段数统计

字幕、字幕语种以及编目规则

前几天，看MARBI的修订041$b建议（Proposal No. 2005-07: Revision of subfield $b in field 041 (Language Code)）。$b原来的定义是：
文摘/字幕的语言代码（Language code of summary or abstract/overprinted title or subtitle）

由于视听资料编目员方面（Online Audiovisual Catalogers，OLAC）的提议，目前$b作了三个修改：

对于视听资料，取消原来$b必须与$a不同的限制
取消过时的术语“overprinted titles”，简单地表述为“Language code of summary or abstract/subtitle”
使用范围与定义扩大到为听力障碍者提供的说明字幕（captions）（自注：不仅仅指对白字幕）

虽然建议正文对修改理由有详细的解释，说明修改确实很有必要，但看到这个建议仍觉得有点小题大作。看上去并没多大改动，需要又是提议、又是修正、再作批准，折腾几个月这么兴师动众吗？
不过，如果大家做事都想当然，那规则就无法完善。结果是，规则成为随意涂抹、任意解释、谁也不把它当回事的玩意儿……

编目源/记录来源与编目传统

Catalogablog的David刚由AUTOCAT邮件组意外得知，040字段（编目源）中$a可选，而$c反而是必备的。他说LC的做法是，如果没有$c的话，就把$a复制过去。

040（编目源）的定义是$a原编机构$c转录机构。事实上，现在都直接采用计算机编目，并没有不同于原编机构的转录机构。而在一些图书馆系统的编目模块中，除了极少特例，没有$a字段的记录是系统不可接受的。结果就象LC的做法那样，差不多所有记录中这两个机构代码都是相同的。

刚好前几天，在MARC邮件组中，从事编目外包的J. McRee (Mac) Elrod在抱怨040$c必备的做法。因为新客户提出的错误报告中，很大一部分是缺少这个必备的040$c。而“原编机构”与“转录机构”根本就是误导。Mac说，难道现在我们大多数不是联机编目、而是在纸上编目然后转录？难道LC仍然在纸上编目，让另外的人输入？为了减少错误报告，他们不得不重复输入二次机构代码――正象我们现在原编时所做的那样。

有时，传统是可怕的负担。
同样是记录来源，没有足够历史渊源的CNMARC就显得比较合理。记录中基本上只看到801#0（原始编目机构）和801#2（修改机构），而很少看到801#1（转录机构）。