简化MARC21

    刚过去的十月,LC的MARC标准主页上的MARC论坛讨论热烈,最热的话题就是减少MARC字段数(Reducing number of MARC fields?)和简化MARC21(About simplifying MARC)。

    事情由九月末论坛中的活跃人物J. McRee (Mac) Elrod (Special Libraries Cataloguing Inc.)介绍一项MARC内容标识符使用研究而起(The MARC Content Designation Utilization Study)而起。他介绍说,对40万MARC记录的分析,在MARC21近2000个字段及子字段中,小于50%的仅出现一次;36个字段与子字段覆盖所有使用的80%。他认为这些发现会支持简化MARC21。
    实施此项研究的北德州大学图情学院助理教授Shawne D. Miksa博士立刻说明,目前只是一个测试,未来将分析OCLC的WorldCat中5600万条记录。
    尽管他说明研究目的不是对MARC使用作出任何判断以至于减化MARC,只不过是为未来对MARC的决策提供经验数据。但仍激起了最热烈的讨论。
    编目员一讨论起“字段”,就没完没了。众说纷纭,我一见就头痛不已,只略看了几篇。

    以前就想过UNIMARC是如何炼成的,与LCMARC有那么多的不同。应该不是横空出世,是不是设计LCMARC时建议未被接受,失意之余重起炉灶,弄得现在两种MARC格式差异如此之大?
    在UNIMARC建立之后,好象根据LCMARC/USMARC/MARC21改了一些。比如跟着增加856字段,比如4XX连接字段由$1嵌套方式,改为可选择采用$a$t等子字段方式。早知今日,何必当初?

    不过,三十年河东、三十年河西,大概到了UNIMARC咸鱼翻身的日子了。
    在这次讨论中,UNIMARC的东西就被翻出来不少,希望MARC21能依此改变。比如不著录ISBD的标识符(字段结束是不是要加点自然也不是问题了),比如ISBN字段后面用子字段标明装帧方式(而不是直接用括号),比如题名与责任方式增加一些子字段以明确说明各著录单元。
    前面两项我赞成,一个是简化著录,一个是简化索引;后一项那就是自找麻烦了,纯著录用,又不提供检索,为什么要增加子字段?真没想到,简化MARC的讨论,复杂化竟然也堂而皇之登场。

相关链接:
The MARC Content Designation Utilization Study 

用得最多的33个USMARC字段

用得最多的39个CNMARC字段 

飞云的博客:MARC数据中的字段数统计

 

字幕、字幕语种以及编目规则

    前几天,看MARBI的修订041$b建议(Proposal No. 2005-07: Revision of subfield $b in field 041 (Language Code))。$b原来的定义是:
    文摘/字幕的语言代码(Language code of summary or abstract/overprinted title or subtitle)

    由于视听资料编目员方面(Online Audiovisual Catalogers,OLAC)的提议,目前$b作了三个修改:

  • 对于视听资料,取消原来$b必须与$a不同的限制
  • 取消过时的术语“overprinted titles”,简单地表述为“Language code of summary or abstract/subtitle”
  • 使用范围与定义扩大到为听力障碍者提供的说明字幕(captions)(自注:不仅仅指对白字幕)

    虽然建议正文对修改理由有详细的解释,说明修改确实很有必要,但看到这个建议仍觉得有点小题大作。看上去并没多大改动,需要又是提议、又是修正、再作批准,折腾几个月这么兴师动众吗?
    不过,如果大家做事都想当然,那规则就无法完善。结果是,规则成为随意涂抹、任意解释、谁也不把它当回事的玩意儿……

 

编目源/记录来源与编目传统

    Catalogablog的David刚由AUTOCAT邮件组意外得知,040字段(编目源)中$a可选,而$c反而是必备的。他说LC的做法是,如果没有$c的话,就把$a复制过去。

    040(编目源)的定义是$a原编机构$c转录机构。事实上,现在都直接采用计算机编目,并没有不同于原编机构的转录机构。而在一些图书馆系统的编目模块中,除了极少特例,没有$a字段的记录是系统不可接受的。结果就象LC的做法那样,差不多所有记录中这两个机构代码都是相同的。

    刚好前几天,在MARC邮件组中,从事编目外包的J. McRee (Mac)  Elrod在抱怨040$c必备的做法。因为新客户提出的错误报告中,很大一部分是缺少这个必备的040$c。而“原编机构”与“转录机构”根本就是误导。Mac说,难道现在我们大多数不是联机编目、而是在纸上编目然后转录?难道LC仍然在纸上编目,让另外的人输入?为了减少错误报告,他们不得不重复输入二次机构代码――正象我们现在原编时所做的那样。

    有时,传统是可怕的负担。
    同样是记录来源,没有足够历史渊源的CNMARC就显得比较合理。记录中基本上只看到801#0(原始编目机构)和801#2(修改机构),而很少看到801#1(转录机构)。