利用Google突破限制看E线数据库全文

    雷速公司的E线图情全文数据库有点象大杂烩,主要包含动态、期刊论文和研究报告等。要看全文,需要提供密码,如果没有图书馆代您付了费,自己又没有阅读卡,就看不成。
    其实,E线中的动态部分一般列出的就是全文,但期刊论文和研究报告就只能看文摘或前面的一小部分内容了。期刊论文收录原则不明,由于不注明出处,写作时如需引用其实并不方便――并且这些论文大抵期刊网或维普也都收录了,不看也罢。而研究报告中有些似乎在网络其他地方检索不到,也有值得一读的。想看却看不到,不免有点遗憾。
    某日在他处看到雷速公司董事长刘锦山的报告,发现文中链接点击进去看到的居然是E线的全文,并未要求提供密码。经分析这些全文的URL为”www.chinalibs.net/quanwen.asp?titleid=…”,于是,试用GOOGLE的”inurl:”句法一查,果然突破了密码限制。如在E线全文库中搜索含”参考资源”的内容,在Google搜索框中输入:
“参考资源” inurl:www.chinalibs.net/quanwen
点击”Google搜索”后,显示2个结果,单击搜索结果最后的”将省略的结果纳入搜索范围后再重新搜索”链接,得到全部9个搜索结果。单击搜索结果,即可看到全文。

 

 

维基百科搞笑词条

      无论中外,对维基百科Wikipedia的准确性、权威性一直存在质疑。昨天在Easy Librarian上看到,为应对质疑,国外有人对维基百科作了一项测试:作者对维基百科网站作了13处修改,结果是几个小时内这些”有意为之”的”错误”均被修正。

      看上去结果很不错。问题是,对于不那么受关注的中文维基百科,是不是不会有那么多人随时修改其中的”错误”呢?更大的问题还不是”错误”,而是词条中一些令人哭笑不得的内容,与工具书形象相去甚远。

      以前曾有人质疑中文维基的”无神论”词条,因为”佛教从某种程度上也属于无神教”。现在经修改,将此论点放到了无神论”历史”的小标题下,改为”佛教在早期从某种程度上也属于无神教”――这样就可归入学术观点上的差异了。

 

    再看一个中文维基百科的搞笑词条”稻米”及其演变。从建立至今已240天,虽有几次修改,大概因其搞笑术语实在太精彩,故而仍全被保留下来。

    2004/3/13(新建)
稻米是一种可食用的谷物,煮熟后称米饭。
现在常用电饭煲煮饭,煮之前要淘洗,但也有免淘洗米。
如果煮的时候多放点水,煮熟后称稀饭,也叫粥;但水放得太多,煮熟后称撩命汤。如果煮的时候水放的比较少,煮熟后称干饭;只加一点水的煮后叫夹生饭,不加水的叫爆米花。用油炸的叫锅巴。煮成的饭有的生、有的熟、有的焦的叫三层楼。饭煮好后加水的叫泡饭。

    2004/3/27 (2周后)
修改了2处:
1、第1段后一句改为:煮熟后称米饭(北方讲法)或白饭(南方讲法)。
2、在第1段之后设立了一个子标题”稻米的烹调法”。

    2004/4/2 (3周后)
在词条最后增加:”也可以把煮好的饭和蔬菜,肉,海鲜等一块翻炒,这种做法叫炒饭。著名的有扬州炒饭。”

    2004/11/7(240天后)
稻米是一种可食用的谷物,煮熟后称米饭(北方讲法)或白饭(南方讲法)。
现在常用电饭煲煮饭,煮之前要淘洗,但也有免淘洗米。

稻米的烹调法
如果煮的时候多放点水,煮熟后称稀饭,也叫粥;但水放得太多,煮熟后称撩命汤。如果煮的时候水放的比较少,煮熟后称干饭;只加一点水的煮后叫夹生饭,不加水的叫爆米花。用油炸的叫锅巴。煮成的饭有的生、有的熟、有的焦的叫三层楼。饭煮好后加水的叫泡饭。也可以把煮好的饭和蔬菜,肉,海鲜等一块翻炒,这种做法叫炒饭。著名的有扬州炒饭。

 

都柏林核心走向死亡?

      上月中旬,DC-2004在上海图书馆召开,会议主题是”跨语言与文化的元数据”,会议发表的报告内容已经不限于都柏林核心元数据,而是广义的元数据了。今天又在Library Hi Tech News最新一期的目次上,见到一文题为:Dublin Core: An Obituary(都柏林核心讣告),真有点语不惊人势不休的意味。文章批评DC元数据缺乏专指性、没有标准的数据元素、互操作性差,进而断言DC将很快被”元数据对象描述框架”(MODS)所取代。

      实际上,从1995年的DC-1开始,DC发展至今已有近10年,从崇尚简洁一路走来,在语法上先是增加修饰词、后又允许自定义修饰词、进而允许自定义新元素,在语义上引入各种规范、还推荐自建词表,与简洁的初衷渐行渐远,其复杂程度已不下于MARC。与MARC相比,DC有不依赖特制程序阅读的优点,只是本来网络上采用DC的网页就不多,当搜索引擎不利用元数据建立其索引之后,其优点就不再突出了――毕竟元数据主要不是让”人”来阅读的,实际上还是要编制特定程序加以处理,与MARC的可读性相去并不太远。

 

    反观MARC,经过多年发展,已形成不同载体文献一体化格式,并有著录规则(如AARC2、ISBD等)、名称规范库、主题词表等相配套。MARC对普通人的障碍一是其定义的字段、子字段代号不直观,非专业人士无从理解其意;二是其2709格式无法阅读。这二点通过应用程序的转换,在图书馆联机公共目录显示格式中其实已经得到解决。 对图书馆界来说,与其开发、维护一个新的元数据,还不如改造已经成熟的MARC。

    美国国会图书馆的“元数据对象描述框架”MODS就是直接利用MARC的一个范例。MODS包含MARC 21的一个子集,以英语单词或短语代替MARC的字段和子字段,提供HTML/XML格式。从2002年6月公告试用1.2版以来,到2003年底已经发展到了3.0版。在2年多的发展中,已被一些数字图书馆项目建设所采用。或许真是元数据的明日之星?

    国内最关注DC的机构当属上海图书馆,在他们的主页上即有DC元数据中文网,收录了有关DC的各种有价值的内容。同时,他们也关注其他元数据的发展。MODS公开不久,他们的”数字图书馆研究资源门户”中就加入了其资源描述。同时,他们制定的多个元数据方案,都参考了MODS的标准。