珀尔修斯数字图书馆(从人类可读信息到机器生成知识)

珀尔修斯数字图书馆项目(Perseus Digital Library Project)始于1985年,专注古希腊及古罗马的历史、文学与文化,是一个由领域专家主持的数字化项目。主编Gregory R. Crane是塔夫茨大学教授,一位数字人文的早期实践者。
项目于今年5月发布了珀尔修斯目录(The Perseus Catalog) ,目标是包括所有主要的古希腊和古罗马作者、每人至少收录一部联机版作品。发布当时包括3,679部作品,以及1.1万余全文链接(其中谷歌图书6,419部、互联网档案5,098部、HathiTrust为593部)。
目录细览页有全文时,按行分页显示,左栏为文字导航、上面为条形导航。点击全文中任意词,会跳转到该词的分析页,包括词典解释、出现统计等。如埃斯库罗斯的希腊文版《阿伽门农》

该目录采用了图情与IT领域的不少通用技术,有不少可圈可点之处:
元数据格式:通用的采用LC的MODS和MADS,专业方面采用Homer Multitext Project开发的Canonical Text Services及CTS-URN protocols(应该是做某些强化)
软件界面:采用开源的Blacklight及Solr
输出格式:目前为HTML和ATOM,但对所有文本组、作品、版本及译本提供稳定、可链接的标准URI后续版本将提供RDF三元组(语义网与关联数据世界又将多一个数据来源)
目前该项目已把MADS格式的作者规范数据贡献给了虚拟国际规范档(VIAF),未来也将在目录中提供到VIAF的链接。

项目网站的Research部分谈到其使命,最后说明其关注三个方面,并有详细解释:
– 人类可读信息
– 机器可操作知识
– 机器生成知识
从前面部分行文看,似乎写于2008-2009年,尽管没有出现语义网或关联数据字样,但后两个方面应该正是抓住了这一趋势。

参见:珀尔修斯数字图书馆目录项目的博客:The Perseus Catalog Blog
Announcing The Perseus Catalog, release 1.0 / by LISA M. CERRATO (2013-5-10)
Contribution to the Virtual International Authority File / by ANNA KROHN (2013-11-25)

Library Hi Tech专辑:新一代OPAC

Library Hi Tech, Volume 27, Issue 1
Special Issue: Next generation OPACs

    《图书馆高技术》本专辑包括“新一代OPAC”文章12篇,实际因篇幅关系,其中4篇将在下期刊发。同时该刊正为同一主题的下一个专辑征稿,内容是新一代OPAC的实施与实验。看来“新一代OPAC”还真是热闹非凡。

    专辑编辑Bradford Lee Eden在引论(Introduction) 中对专辑文章做了介绍:
    很多图书馆已经用Web2.0技术对笨重的厂商OPAC进行改头换面或重组,或者通过面貌一新的前端应用,或者集成FRBR功能的后端软件,或者通过整合用户熟知的社会网络工具。新一代OPAC解决方案结合有私有或开源软件,基于OPAC中原有结构化元数据,形成多重浏览、更多社会网络选择及更多Web2.0工具如二维及三维信息可视化。某些馆结合新的开源或免费OPAC如LibraryThing,或者实施编程脚本、重新设计提问,达到更方便简易的访问与检索。

The VuFind implementation at Villanova University / John Houser (pp. 93-105)
Implementing VuFind as an alternative to Voyager’s WebVoyage interface: One library’s experience / Birong Ho, Keith Kelley, Scott Garrison (pp. 82-92)
    VuFind被称为目前最令人感兴趣的开源发现工具之一。前文介绍VuFind在维拉诺瓦大学的实施,特别强调图书馆上层管理者支持的重要性。后文则调查了西密歇根大学实施VuFind的情况,介绍用开源软件代替原目录界面的经验。

Project Blacklight: a next generation library catalog at a first generation university / Elizabeth (Bess) Sadler (pp. 57-67)
    介绍佛吉尼亚大学的黑光计划,是使用Web2.0的又一个开源OPAC技术实例,黑光计划在某种方面对开发VuFind软件有所帮助。

The new cooperative cataloging / Tom Steele (pp. 68-77)
    讨论标签或大众分类法,考察了LibraryThingPennTags

Subjecting the catalog to tagging / Luiz H. Mendes, Jennie Qui?onez-Skinner, Danielle Skaggs (pp. 30-41)
LibraryThing for libraries at Claremont / Jezmynne Westcott, Alexandra Chappell, Candace Lebel (pp. 78-81)
    前文结合学术图书馆中实施LibraryThing for Libraries (LTFL),考察社会标签,分析了加州大学北岭分校的Oviatt图书馆OPAC中的使用数据。
    后文则描述了克莱蒙大学图书馆实施LTFL的情况。

Making the new OPAC seamless: dealing with the transition from “finding” to “getting” /
Carmel Denholm, Leto Kauler, Jan Lavelle, Lloyd Sokvitne (pp. 13-29)
    澳大利亚的塔斯马尼亚州立图书馆实施TALISPlus新一代OPAC的情况。

Accessing information in a parliamentary environment: is the OPAC dead? / Roxanne Missingham, Rina Brettell, Shirley White, Sarah Miskin (pp. 42-56)
    讨论新检索系统ParlInfo的数据及用户分析,这是为澳大利亚议会开发的,2008年9月发布。

未发的4篇是:
墨西哥的蒙特雷伊科技大学图书馆在其OPAC中实施Drupal及其他用户工具。
休斯顿医学科学院德州医学中心(HAM-TMC)图书馆讨论创建与实施新一代工具与服务。
改进LC的Z39.50服务器功能,安装YAZ代理以过滤并解决有问题的Z39.50请求,支持检索XML记录。
解释基于语义的提问重写,以及FRBR作品实体组成,如何改善中介元搜索环境的行为。并讨论了一些开源工具,如meta-Composer,Semantic Access Point Network (SAPN)技术,及pazpar.

参见:
开源OPAC发布:VuFind (2007-07-23)
SEOmoz的Web2.0奖 & 我用的获奖网站 (2008-08-18)
再看国外流行的开源软件──第三届梅隆技术协作奖 (2008-12-11)
耶鲁大学的VuFind使用调查 (2008-12-15)

Blacklight:佛吉尼亚大学的开源OPAC (2008-03-03)

在OPAC中嵌入LibraryThing提供的相关链接 (2007-04-10)
把图书馆2.0带入你的目录:LibraryThing for Libraries有了第一个用户 (2007-5-15)