LD4P2走向实施之路:目标与工作(附LD4系列)

LD4P2是Andrew W. Mellon基金会资助的LD4系列的第4个2年期项目(2018-2020),成员为康奈尔大学、哈佛大学、美国国会图书馆?、斯坦福大学和爱荷华大学。本期项目的终级目标是实施,即以关联数据来描述图书馆资源。特别值得注意的是与合作编目项目(PCC)和Wikidata的合作。
先前曾关注项目的7个目标(见下参见),现在已看到2个有所进展,因此再重复记录如下;项目维基网站还有6个工作包,在此一并记录:
Linked Data for Production: Pathway to Implementation (LD4P2)

7个目标:
[1] 由一个学术图书馆的核心小组,创建以BIBFRAME表示的关联数据的连续馈送池
[2] 开发基于云的沙箱编辑环境,以支持扩展的图书馆合伙人创建和重用关联数据【2018.11.1宣布已招募到17家学术图书馆承担子项目:Stanford Libraries announces Linked Data for Production (LD4P) cohort members and subgrant recipients;先前已召开合伙人会议,定下2019.4开始生成数据的目标】
[3] 开发用于使用标识符自动增强MARC数据的策略、技术和工作流程,以便尽可能干净地转换为关联数据
[4] 开发用于创建和重用关联数据及其支持标识符作为图书馆核心元数据的策略、技术和工作流程
[5] 通过与Wikidata的协作,更好地将图书馆元数据和标识符与Web集成【2018.8.27 斯坦福大学为此公开招聘一位驻留维基媒体人:Wikimedian-in-Residence position at Stanford University
[6] 使用基于关联数据的发现技术增强广泛采用的图书馆发现环境(Blacklight)
[7] 通过开发一个名为LD4的组织框架来协调持续的社区协作,确保在分布式发展社区中不断交流思想和技术。

6个工作包:
WP1:Sinopia:基于云的合作编目环境/原编元数据创建环境
WP2:元数据重用(MARC-to-BIBFRAME转换管道+直接使用原生RDF描述)
WP3:链接到外部规范和Web语境数据(标识符URI+Wikidata发布、链接和丰富)
WP4:发现(Blacklight+知识面板+语义搜索+浏览+可视化+微数据)
WP5:原生关联数据描述生产流程(特藏=电影+地图+音乐+唱片:与数字化配套、与Wikimedia链接)
WP6:社区协作(建立LD4社区+2次国际会议)

——— 附:LD4L: Linked Data for Libraries (The Gateway) ———
LD4L 2014 (2014-2016):“创建一个模型,既可以在各机构内部又可以通过一个协调可扩展的关联开放数据网络运作”(100万美元;斯坦福、康奈尔、哈佛)
LD4L Labs (2016-2018):“帮助图书馆使用关联数据来改善对学术资源信息的交流和理解”(150万美元;康奈尔、哈佛、爱荷华、斯坦福)
LD4P (2016-2018):“转变技术服务生产工作流程”(150万美元;斯坦福、哥伦比亚、康奈尔、哈佛、普林斯顿、美国国会图书馆)
参见:重量级图书馆关联数据项目LD4P获得资助(2016-5-10)
LD4P2 (2018-2020):“为编目社区建立一条途径,开始转向关联数据来描述图书馆资源”(400万美元;斯坦福、康奈尔、哈佛、爱荷华)
参见:BIBFRMAE应用进展:LD4P实施之路(2018-7-8)

珀尔修斯数字图书馆(从人类可读信息到机器生成知识)

珀尔修斯数字图书馆项目(Perseus Digital Library Project)始于1985年,专注古希腊及古罗马的历史、文学与文化,是一个由领域专家主持的数字化项目。主编Gregory R. Crane是塔夫茨大学教授,一位数字人文的早期实践者。
项目于今年5月发布了珀尔修斯目录(The Perseus Catalog) ,目标是包括所有主要的古希腊和古罗马作者、每人至少收录一部联机版作品。发布当时包括3,679部作品,以及1.1万余全文链接(其中谷歌图书6,419部、互联网档案5,098部、HathiTrust为593部)。
目录细览页有全文时,按行分页显示,左栏为文字导航、上面为条形导航。点击全文中任意词,会跳转到该词的分析页,包括词典解释、出现统计等。如埃斯库罗斯的希腊文版《阿伽门农》

该目录采用了图情与IT领域的不少通用技术,有不少可圈可点之处:
元数据格式:通用的采用LC的MODS和MADS,专业方面采用Homer Multitext Project开发的Canonical Text Services及CTS-URN protocols(应该是做某些强化)
软件界面:采用开源的Blacklight及Solr
输出格式:目前为HTML和ATOM,但对所有文本组、作品、版本及译本提供稳定、可链接的标准URI后续版本将提供RDF三元组(语义网与关联数据世界又将多一个数据来源)
目前该项目已把MADS格式的作者规范数据贡献给了虚拟国际规范档(VIAF),未来也将在目录中提供到VIAF的链接。

项目网站的Research部分谈到其使命,最后说明其关注三个方面,并有详细解释:
– 人类可读信息
– 机器可操作知识
– 机器生成知识
从前面部分行文看,似乎写于2008-2009年,尽管没有出现语义网或关联数据字样,但后两个方面应该正是抓住了这一趋势。

参见:珀尔修斯数字图书馆目录项目的博客:The Perseus Catalog Blog
Announcing The Perseus Catalog, release 1.0 / by LISA M. CERRATO (2013-5-10)
Contribution to the Virtual International Authority File / by ANNA KROHN (2013-11-25)

Library Hi Tech专辑:新一代OPAC

Library Hi Tech, Volume 27, Issue 1
Special Issue: Next generation OPACs

    《图书馆高技术》本专辑包括“新一代OPAC”文章12篇,实际因篇幅关系,其中4篇将在下期刊发。同时该刊正为同一主题的下一个专辑征稿,内容是新一代OPAC的实施与实验。看来“新一代OPAC”还真是热闹非凡。

    专辑编辑Bradford Lee Eden在引论(Introduction) 中对专辑文章做了介绍:
    很多图书馆已经用Web2.0技术对笨重的厂商OPAC进行改头换面或重组,或者通过面貌一新的前端应用,或者集成FRBR功能的后端软件,或者通过整合用户熟知的社会网络工具。新一代OPAC解决方案结合有私有或开源软件,基于OPAC中原有结构化元数据,形成多重浏览、更多社会网络选择及更多Web2.0工具如二维及三维信息可视化。某些馆结合新的开源或免费OPAC如LibraryThing,或者实施编程脚本、重新设计提问,达到更方便简易的访问与检索。

The VuFind implementation at Villanova University / John Houser (pp. 93-105)
Implementing VuFind as an alternative to Voyager’s WebVoyage interface: One library’s experience / Birong Ho, Keith Kelley, Scott Garrison (pp. 82-92)
    VuFind被称为目前最令人感兴趣的开源发现工具之一。前文介绍VuFind在维拉诺瓦大学的实施,特别强调图书馆上层管理者支持的重要性。后文则调查了西密歇根大学实施VuFind的情况,介绍用开源软件代替原目录界面的经验。

Project Blacklight: a next generation library catalog at a first generation university / Elizabeth (Bess) Sadler (pp. 57-67)
    介绍佛吉尼亚大学的黑光计划,是使用Web2.0的又一个开源OPAC技术实例,黑光计划在某种方面对开发VuFind软件有所帮助。

The new cooperative cataloging / Tom Steele (pp. 68-77)
    讨论标签或大众分类法,考察了LibraryThingPennTags

Subjecting the catalog to tagging / Luiz H. Mendes, Jennie Qui?onez-Skinner, Danielle Skaggs (pp. 30-41)
LibraryThing for libraries at Claremont / Jezmynne Westcott, Alexandra Chappell, Candace Lebel (pp. 78-81)
    前文结合学术图书馆中实施LibraryThing for Libraries (LTFL),考察社会标签,分析了加州大学北岭分校的Oviatt图书馆OPAC中的使用数据。
    后文则描述了克莱蒙大学图书馆实施LTFL的情况。

Making the new OPAC seamless: dealing with the transition from “finding” to “getting” /
Carmel Denholm, Leto Kauler, Jan Lavelle, Lloyd Sokvitne (pp. 13-29)
    澳大利亚的塔斯马尼亚州立图书馆实施TALISPlus新一代OPAC的情况。

Accessing information in a parliamentary environment: is the OPAC dead? / Roxanne Missingham, Rina Brettell, Shirley White, Sarah Miskin (pp. 42-56)
    讨论新检索系统ParlInfo的数据及用户分析,这是为澳大利亚议会开发的,2008年9月发布。

未发的4篇是:
墨西哥的蒙特雷伊科技大学图书馆在其OPAC中实施Drupal及其他用户工具。
休斯顿医学科学院德州医学中心(HAM-TMC)图书馆讨论创建与实施新一代工具与服务。
改进LC的Z39.50服务器功能,安装YAZ代理以过滤并解决有问题的Z39.50请求,支持检索XML记录。
解释基于语义的提问重写,以及FRBR作品实体组成,如何改善中介元搜索环境的行为。并讨论了一些开源工具,如meta-Composer,Semantic Access Point Network (SAPN)技术,及pazpar.

参见:
开源OPAC发布:VuFind (2007-07-23)
SEOmoz的Web2.0奖 & 我用的获奖网站 (2008-08-18)
再看国外流行的开源软件──第三届梅隆技术协作奖 (2008-12-11)
耶鲁大学的VuFind使用调查 (2008-12-15)

Blacklight:佛吉尼亚大学的开源OPAC (2008-03-03)

在OPAC中嵌入LibraryThing提供的相关链接 (2007-04-10)
把图书馆2.0带入你的目录:LibraryThing for Libraries有了第一个用户 (2007-5-15)