由亚马逊及IMDB数据获取MARC记录

2011年3月26日 由 catwizard 4 条评论 »
曾介绍过一个由亚马逊数据直接获取MARC记录 (2006年8月22日)的工具:
———- Amazon to MARC Converter ———-
这个工具另有一个网址,增强了不少功能:
1、检索:除ISBN,还支持关键词检索,可以限定检索图书、DVD、VHS、音乐等。可惜亚马逊的关键词检索向来并不好用,检出结果的相关性不高,但对于没有ISBN时多了个可用的途径。
2、导出:可逐个保存,再批量导出,对做编目的无疑相当方便。
3、人名规范:那次指出的缺点是责任者名称未经规范,现在有了“验证名称”(Verify Names)功能,可以提供名称的规范形式(详见下说明)。不知道查询的是哪个规范库。
显然,对于编目员很看重的主题,作者还没有找到适当的解决方法。
———- Internet Movie Database to MARC Converter ———-
该网站还有另一个工具,把IMDB信息转换为MARC记录
IMDB是全球最权威的电影评分网站(需翻墙),汇集了丰富的电影信息。输入IMDB号或影片名称(关键词),Go即出现经转换的MARC记录,可编辑,可输出为2709格式,可链接到IMDB的相应条目。
这个转换程序的专业性,体现在屏幕右侧的“验证名称”(Verify Names),列出了MARC记录中做检索点的人名,点击后弹出窗口显示规范形式,可复制规范名称,用以替换MARC记录中相应的人名形式。方法:在Replace中粘贴规范形式,然后在Find中复制粘贴记录中已有的IMDB形式,Go即可。
———- 关于作者Charles Ledvina ———-
网站首页很有特点的MARC格式自我介绍,非编目员恐怕看不懂:
在原网站首页chopac.org,还有更多工具可以探索。
(貌似也需翻墙──从今天开始,在本博标记需翻墙网址)

OPAC、电子阅读、图书馆2.0、套录

2011年3月19日 由 catwizard 没有评论 »
OPAC、电子阅读、图书馆2.0、套录四个词,相互间没什么关系。因为Roy Tennant博文“弃用七词”(7 Words or Phrases to Never Say or Write Again, Mar 17, 2011)中,对这四个词我比较有兴趣,因之以为标题。Tennant在文中用语夸张地表示了对7个词的反感甚至厌恶,在他看来,在数字图书馆时代这几个词早就失去其使用价值,却至今无法摆脱,因此在文后郑重其事地“立誓”弃用。
OPAC 联机公共目录
主要针对其中的Public Access部分──确是历史陈迹了。
Webmaster 网管
这个是对Master(主人)不爽──中文译成网管(网站管理员),还是很贴切的。
E-Reading 电子阅读
中心意思是阅读与设备无关。
Bibliographic Instruction 书目指导
“在这星球上谁会冲过去参加书目指导?”“别在人前说出来,免受鄙视。”
Library 2.0 图书馆2.0
提名放到“历史的垃圾桶”里。他承认该词“是指以不同的方式做事”。并说,虽然“图书馆2.0”从未这样说,但他感觉(用这个词就)好象“图书馆2.0”人群到来之前,图书馆是个不变的机构。──不能说他太敏感,只能说这个词容易让人有这种联想,因此打击面太大了。
Copy cataloging 套录编目
没有直接说出来的话是:有OCLC的网络级系统,还要本地系统干吗?皮之不存、毛将焉附。
Cybrarian 网络馆员
其实已经是个过气的词了,不提也罢。
上述七词完全是通过Twitter杂凑的,因而会从过气的Cybrarian到正火的E-reading。
所谓“无用”却无法摆脱,也从某种角度说明现实。
有些词本是约定俗成,可以转义的,在语言发展史上也不少见。如OPAC,完全可以改为小写,指图书馆的联机目录。当前的图书馆目录固然可以直接用Online Catalog,以Tennant的观点,大概Online也没有意义,直接用Catalog就行,但Catalog含义广泛,要解释是图书馆的目录,又得加上很多修饰──不过,对于服务于OCLC的Tennant来说,图书馆目录本身也是没有意义的,只要OCLC的网络级目录就行了。
Tennant一方面自言参与了图书馆35年的变化,看到他所谓的“少壮派”用“图书馆2.0”反抗现状很是不爽,另一方面却又对图书馆界沿用旧词不思改变愤得很。矛盾吗?
立场啊,立场,无人能免俗。比如我,觉得以上7词中,“书目指导”最该放入“历史的垃圾桶”……

用相机代替扫描仪

2011年3月17日 由 catwizard 没有评论 »
曾经在本馆看到过同事用相机代替扫描仪,给古籍拍照做数字化。依稀记得是在两侧用台灯打光,上部固定一架相机,古籍平放在台面上。
前两天,在图书扫描DIY网站(diybookscanner.org),看到了更多用相机代替扫描仪,将图书数字化的设计。一些看上去相当简陋,但感觉效果不见得比普通扫描仪差。因为大部分都设计了一个V形的支架,使被扫描图书翻成一定夹角而非平放──这样的扫描仪我只在网上看到过,用于大规模数字化项目。V形支架的好处在于,被扫描图书处于比较自然的翻开状态,不但有利于保护图书,还能避免中缝受压导致字体变形,有利于成像效果。常安排左右两台相机,以便处理相对的两页。
象上面这个设计,图书翻页后可以比较方便地放下压书页的玻璃,保证页面平整。
下面这个设计十分简单,可以保证页面平整,但翻页速度怕难以保证:
特别欣赏下面这个设计,完美的零边距扫描,尤其适合中缝留白较少的文献:
DIY Book Scanners是一个社区,分享使用普通数码相机、免费软件制作电子书的经验。在相机拍摄图像后,使用免费软件做图像处理,再生成PDF或DJVU文档即可。社区原来使用的图像处理软件是Scan Tailor(扫描裁缝),最近又有了一个新的软件Book Scan Wizard(图书扫描精灵),可以直接把制作好的图书上传到互联网档案。
另外有个问题,用多少像素的相机拍摄,才能保证有一般扫描仪的扫描精度?查到“数码相机之照片像素与打印像素(DPI)”:
“一部有效像素900万的数码相机拍的照片,如果以300DPI的精度打印出来,这张照片的尺寸就应该是900万除以300再除以300,即100平方英寸。……再比如:一张3488X2616的数码照片(长宽之比为4:3),如果以300DPI的精度打印,那么其长度应该为3488除以300等于11.6英寸,宽度应该为2616除以300等于8.7英寸,大约为101平方英寸的照片。”
1英寸=2.54cm,这个尺寸大致为29.5cm*22cm,差不多是A4/16开幅面。也就是说,900万像素的数码相机,可以让A4幅面达到300dpi?如要600dpi,就要4倍即3600万像素?
———-免费扫描图像处理软件———-
Scan Tailor:分页、去污、增/除边
Book Scan Wizard:自动裁剪、旋转、固定失真校正、固定DPI,输出成Tiff文件
参见:
图书扫描机器人 (2008年8月11日)

各国行业分类标准

2011年3月14日 由 catwizard 2 条评论 »
因为回一封邮件,查了一圈各国的行业分类标准或标准行业分类法(Industry Classification),整理如下。
———-联合国 ISIC Rev.4———-
《所有经济活动之国际标准行业分类》(修订4版)
一级A-U共21类,二级2位数字。见:维基百科
———-中国国家统计局:行业分类标准———-
国民经济行业分类与代码 (GB/T 4754-2002)
这里这里这里都有(都是政府网站)
一级A-T共20类,共4级(4位数字)
———-美国 SIC———-
《标准行业分类》(1937)
一级A-J共10类,共4级(4位数字)。维基百科上有4位数字代码表,并称虽然SIC基本上被NAICS取代,但一些政府部门与机构如美国证券交易委员会(SEC)仍在使用。
———-北美 NAICS———-
《北美行业分类法》(2007版)
北美(美国、加拿大、墨西哥)现在使用的标准,维基百科上有一级2位数字共20类。1997年初版,最新版2007。
———-英国 UK SIC(92)———-
《英国经济活动标准行业分类》(2003最新修订)
一级A-Q共17类,最小5级(如01.42/9)
———-道琼斯和富时 ICB———-
《行业分类基准》
Industry Classification Benchmark
维基百科有4级分类表
———-日本標準産業分類(平成19年11月改定)———-
在首页选择:分類検索システム(分类检索系统)
可选择以下几项逐级浏览(也可检索):
日本標準産業分類(一级A-T共20类,到4级4位数字)
日本標準商品分類(一级10类)
経済センサス産業分類(一级A-R共18类)
———-小结———-
1、行业分类,大同小异。
2、形式上:基本都采用数字。即使字母作为一级类,二级以下类也只用数字,而不是字母+数字形式。与《中国图书馆分类法》或《美国国会图书馆分类法》LCC不同。以中国标准为例:
一级:A农、林、牧、渔业
二级:01农业
英国UK SIC是唯一采用十进制形式的,从第三级开始加小数点,第5级加/(如01.42/9),与《杜威十进分类法》DDC三位数后加点也不同。

国际空间站休闲图书馆藏书

2011年3月13日 由 catwizard 没有评论 »
几位编目者给国际空间站(International Space Station, ISS)的休闲图书馆制作了一个联机目录,主要依据NASA于2008年提供的官方清单(只有题名与作者)。原始清单除图书外,还有电影/电视节目和音乐,特别说明图书是供不工作时消遣用的。制作者还很有心地按New Scientist博客的一篇文章,添加了5种由宇航员带到ISS上的图书。
放在Librarything (LT)上的这个联机目录IntlSpaceStation,主页集中了国际空间站相关信息,在侧栏可以看到LT成员拥有ISS休闲图书情况。最多的两位都拥有44种(44%),按比例最高的在收藏的164种书中有24种与IIS馆藏相同(15%)。作为LT用户,附加了解些这样的信息也挺有意思的。
从标签看,100种图书中以科幻小说最多共43种,大概在太空中看科幻小说更有体会。
· 最流行的6种(LT收藏成员过万),前2种都是丹·布朗的,另有俄国的2种:
《达·芬奇密码》The Da Vinci Code
《天使与恶魔》Angels & Demons
《双城记》A tale of two cities
《卡拉玛佐夫兄弟》The Brothers Karamzov
《战争与和平》War and peace
《飘》Gone with the wind
· 由宇航员带去的5种书,依流行程度(LT成员收藏数):
《战争与和平》
《飘》
《最后的莫希干人》Last of the Mohicans
《严厉的月亮》The moon is a harsh mistress
《浮士德》Faust
· 在ISS照片中出现过的2种
《俄-英词典》
《最后的莫希干人》
· 入选最多的3位作者,均美国现代幻想小说作家:
戴维·韦伯 David Weber(13种)(未发现中译本?)
洛伊斯·麦克马斯特·比约德 Lois McMaster Bujold(10种)
特里·布鲁克斯 Terry Brooks(5种)
via The LibraryThing Blog: Books in Space! (MARCH 10TH, 2011)
———-国际空间站消遣图书/电影/电视/音乐清单———-
发布网站www.governmentattic.org号称是在政府的阁楼上翻箱倒柜(Rummaging in the government’s attic),专门提供依据信息自由法案(Freedom of Information Act, FOIA)获取的“有趣的”联邦政府文件。本文件10-April-2007提出要求,23-April-2008才得到,讨了一年,美国政府部门的效率也够可以。