图书馆自动化系统的预约功能

近年一直在做Folio系统的界面汉译,最近又刚译完了Folio术语表,觉得涉及的图书馆自动化系统(ILS或LAS)的功能挺复杂的。这篇谈谈预约功能。

图书馆首先需要确定预约政策。比如什么文献可以预约、哪类读者可以预约,等等。再比如,如果有读者预约,是否要缩短在借读者的借期?有人觉得在借读者会觉得不公平:凭什么自己被缩短借期,后借者倒可能有正常借期?

其实借阅政策由很多因素组合设置。就预约而言,如果借期本就不长,缩短正被预约图书的借期确实不尽合理;但如果借期足够长、提前归还不一定影响读者使用;尤其是当图书馆对某类读者(比如教师)不设定借期(可长期借阅),则在有预约时要求尽早归还更是十分必要。另一方面,读者预约自然是需要借,但有时也并不需要立时三刻到手,只要在被归还后能借到就可以——这也是大部分“预约”实现的功能。

预约需要或者不需要在借读者提前归还,在ILS中有不同的处理方法。folio中对应2种请求(request),即召回(Recall)和预约/等候(Hold)。相信对于未设借期的图书资料(Item),会自动实施“召回”请求。如果有多人预约,则按先后排队(request queue),但召回请求优先。

除以上两种,还有一种情况也被归入“预约”,即闭架书库或异地馆藏中的在架书,需要由馆员处理取书。在folio中称为传呼(Page)【想起手机之前的BP机——寻呼机】。

总结Folio中的三种请求(预约)及ILS可能需要的处理:

一、预约(Hold)

Item归还(如果超期、可能罚款)——(如果读者选定取书地与归还地不同、需要先转运)——放到预约架(hold shelf / on hold)——给请求者发预约在架通知、等候借出

二、召回(Recall)

根据借期政策、修改item到期时间——给借阅者发催还通知(Reminder )——Item归还(如果超期、可能有更高罚款)……【同Hold】

三、传呼(Page)

馆员根据索书号到书库/书架取书 ……【同Hold】

接下来,请求(预约)可能进行中(Open)、也可能已结束(Closed),其状态分别是:

  • 未结请求(open request):尚未满足(Not yet filled),转运中(In transit),等候取件(Awaiting pickup)
  • 已结请求(closed request):已满足(Filled),取消(Cancelled),取件过期(Pickup expired),未满足/无法满足(Unfilled)

说明:request未译“预约”,是因为还有 purchase request(购买请求/荐购)

开源学术交流工具集锦:学术交流技术目录

开放获取机构库联合会(COAR,Confederation of Open Access Repositories)委托咨询机构Antleaf制作“学术交流技术目录”(SComCat),作为其下一代图书馆出版(Next Generation Libraries Publishing)项目的一部分,以CC 4.0许可发布。
Scholarly Communication Technology Catalogue

包括学术交流开放技术的目录(知识库),其中“技术”指软件及某些基本运行服务。目录概述每种技术的的功能、组织模型、依赖关系、标准使用以及采用水平,意在帮助潜在用户选择决定采用的技术。收录范围包括可以本地采用的工具、平台和标准,支持学术交流生命周期中的一项或多项功能,包括:创建、评估、出版/发布、传播、保存和重用。

本目录现列有81项开源技术或服务,包括如发现平台Blacklight,机构库DSpace、Fedora,电子资源使用标准Counter,研究数据管理应用Dataverse等。

选择选项(分面)包括:

  • 类别(应用、软件组件、软件框架、软件包、标准)
  • 馆藏(机构库相关)
  • 功能(如写作、数据挖掘、计量等)
  • 治理(如社区、非营利组织等)
  • 运营形式(如商业提供者、财政资助、志愿社区等)
  • 采用水平(普及、重要、有限、单个、未分类)
  • 可用水平(TR3/总体方案评审、TR9、未分类)
  • 状态(活跃维护、最低维护、已不支持)

详细信息包括(以Blacklight为例):

  • 最近更新 Last updated: 2021-01-27 12:33 UTC
  • 简介 Description: Blacklight is an open source Solr user interface discovery platform. You can use Blacklight to enable searching and browsing of your collections. Blacklight uses the Apache Solr search engine to search full text and/or metadata. Blacklight has a highly configurable Ruby on Rails front-end. Blacklight was originally developed at the University of Virginia Library and is made public under an Apache 2.0 license.
  • 主页 Homepage: http://projectblacklight.org/
  • 代码 Codebase: https://github.com/projectblacklight/blacklight
  • 路线图 Roadmap:
  • 托管 Hosting:
  • 许可证 Licensing: http://www.apache.org/licenses/LICENSE-2.0
  • 价格 Pricing: free to use
  • 采用水平 Adoption level: Significant
  • 可用水平 Readiness level: TR9
  • 治理 Governance: Community (ad-hoc)
  • 运营形式 Business Form: Not Classified
  • 状态 Status: Actively Maintained
  • 类别 Categories: Software Component
  • 功能 Functions: Discovery
  • 馆藏 Collections: 
  • 通用标签 General Tags:

另外,侧栏还提示相关技术

  • Is depended on by * Samvera
  • Depends on * Solr
  • Base technologies * ruby

法国国家图书馆开放数据:data.bnf.fr

法国国家图书馆(BnF)开放数据包括该馆主目录、档案和手稿、以及Gallica的数百万份数字馆藏等。data.bnf.fr项目致力于使法国国家图书馆制作的数据在网络上更有用。data.bnf.fr和Gallica在2013年获斯坦福研究图书馆创新奖(SPIRL)。

数据共享采用“法国开放协议”(法国版CC-by),RDF数据可供营利或非营利免费重复使用和复制,但必须标注引用来源。BnF参与开放数据运动的“主要目的是民主和经济,换句话说,使公共行动更加透明和有效;通过广播和收集数据使公共数据的创建合理化,另一方面,通过为商业或非商业用途提供可重用和有用的信息来促进经济活动”(https://data.bnf.fr/en/about)。——以前自己更多地关注开放数据的“民主”方面,不怎么注意“经济”,真是很大的偏视。

数据模型https://data.bnf.fr/en/abouthttp://data.bnf.fr/images/modele_donnees_2018_02.pdf

模型基于FRBR,除FRBR的3大类实体:作者Auteur、作品OEuvre、概念/主题Theme,还单列了另3个 【亮点】:地点Lieu、日期Date、场景Spectacle。

在数据汇集页面,作者、作品、主题的内容来自BnF的相应规范记录。而地点、日期、场景则是传统书目数据未加汇集的信息,来自不同元数据元素:

日期(通常是年份):日期相关主题,当年出生或死亡作者,当年创建或活跃期终结的机构,当年创作或完成的作品、表演的演出和出版的文献。

地点:出生或死于此地的作者,创建于此的机构,出版于此的期刊和文献、表演于此、录制于此、战争或签署于此的条约。

场景:体现了对“事件”的重视。数据汇集中目前有“演出”,在项目介绍的各页面未见涉及,当为场景/事件的体现,日期与地点中也有表演相关信息。

RDF词表和取值词表https://data.bnf.fr/en/opendata

*BnF本体:bnf-onto(网页显示仅11个元素,本体文件http://data.bnf.fr/ontology/bnf-onto/中有35个元素)
*复用词表:rdf, rdfs, skos, dcterms, foaf, RDAgroup2elements, rdvocab【2个非官方的RDA词表】
*BnF取值词表(网页仅列3个,取值词表http://data.bnf.fr/vocabulary-en页面多2种)
*Intermarc与RDF语言映射

原始数据格式:Intermarc用于印刷书籍目录,XML-EAD用于档案库存,Dublin Core用于数字图书馆。

为搜索引擎和社会网络嵌入数据https://data.bnf.fr/en/opendata)【亮点,社会网络用OG是我首次见到】

为方便搜索引擎索引,对“作者”“作品”和“主题”页面,以微数据格式嵌入Schema.org元素,内容包括个人、图书、机构,特别是机构子类演出团体、舞蹈团体、戏剧团体、音乐团体(与“演出”事件配套)

为方便页面在社会网络(脸书)中呈现,以RDFa元数据编码嵌入开放图谱协议Opengraph Protocol(OG),内容包括标题、描述、类型、URL、图像、作者。

消费外部资源https://data.bnf.fr/en/semanticweb

匹配外部取值词表:id.loc.gov用于语言和国籍,dewey.info用于主题,DCMI类型用于文档类型;

匹配外部数据集:DBpedia,VIAF。

法国国家图书馆的RAMEAU主题标目的页面与其他叙词表相匹配:来自图书馆(美国LCSH,德国DnB,西班牙BNE)或更专业(Agrovoc 联合国粮农组织词表,Geonames 地理名称数据库,Thesaurus W 法国国家档案馆叙词表)。

依作品校准和聚类https://data.bnf.fr/en/opendata

【“作品”识别是FRBR模型(或LRM)应用的一大挑战,在没有题名规范控制(如统一题名)时尤其如此。同时,大多数作品只有一个载体表现,没有对应的作品规范记录——不需要“汇集”,但也应该有其作品页面】

对于有名称规范和题名规范的记录,汇集作品很方便。
如果有名称规范但没有题名规范,BnF采用简单校准方法:载体表现与作品的题名相同时校准。

要更全面解决需要2种方法:

1、Alignment 校准/对齐:(在作者相同的前提下,对载体表现题名)使用前方一致、完全匹配、相距N个词、Levenstein距离、匹配算法,确定是否对应于相同的作品。

2、Clustering 聚类:新文献没有题名规范记录时,汇集载体表现。

概况与进展

data.bnf.fr网站2011年7月上线,定期更新,最近一次更新数据是2018-1-24。目前包括(https://data.bnf.fr/ontology/):作者225.5万,作品27.9万,论题/主题19万,地点11.8万,日期2618,演出5.9万,期刊34.2万。

虽然数据最后更新已有一年多,但网站的不同页面分别有2018年新完成任务和2019年计划,显示项目仍在持续中:

2018年对URI后缀作了修改(https://data.bnf.fr/en/opendata):原来实体本身无后缀、实体的描述#about、描述的描述#recrod,修改后,实体本身和实体的描述#about,描述的描述不带后缀——怎么感觉还是原来的更合理?

2019年有4个任务的路线图(https://data.bnf.fr/en/about):

1、改善数据的传播,通过更新定期更新来增强数据的新鲜度和完整性,通过发布Gallica数字文档的整个参考,并整合来自Web法定呈缴的信息等新资源。

2、校准BnF参考文献与来自Web可信运营商的其他参考资源,并加强data.bnf.fr作为法国在线文化数据中心的角色。

3、支持开放数据重用和测试创新的可视化,提出探索、分析和显示数据和馆藏的新方法,如“研讨会”页面已经做的那样。【新的事件类型?】

4、扩展数据处理,特别是在作品和文档之间建立链接,记住在我们的目录中实施FRBR模型。计算从书目记录到文本或音乐作品的规范记录的附加链接是一个问题,并且从长远来看,通过聚类作品的版本(载体表现)来创建作品的规范记录,即使它们尚不存在。【对有多个版本的作品创建规范记录】