元数据评估工具库

DLF Metadata Assessment Working Group — Tools

元数据评估工具库,收录元数据相关工具的信息,包括工具的使用和功能、支持的元数据标准以及工具本身的文档链接。

本工具库将收录的元数据工具分为7个类别:[1]创建、[2]编辑、[3]验证、[4]转换、[5]抽取/嵌入、[6]检索、[7]分析。类别起到过滤器的作用,方便使用者筛选有助于特定工作类别的工具。具有多种功能的工具入多个类别;同时也支持搜索查找。

从类别可知,并非限于“评估”本身。实际上要评估元数据,必然要对元数据进行各种预处理,因此“通常借助于脚本和其他自动化工具”以“更聪明地工作,而不是更努力地工作”。

本工具库由美国数字图书馆联盟(Digital Library Federation,DLF)之评估兴趣组(Assessment Interest Group,AIG) 之元数据工作组(Metadata Working Group,MWG)之元数据评估工具小组(Metadata Assessment Tools subgroup)制作。

项目始于2016年,当时收录21种工具。“在创建工具库的早期,每个工具都经过了严格的测试,以确定是否将其包含在存储库中。这意味着每个工具都有很多信息,但这对包含的工具数量有很大限制。为了包含更多的工具并使存储库成为更有用的资源,小组不再测试每个工具,现在依赖于每个工具的文档和社区知识”。尽管如此,此次更新,工具总数仍不到30种。页面上有链接供提交新工具、更正错误。“我们积极欢迎社区的意见,帮助我们提供有关所列工具的更准确和完整的信息!”

看工具库,既有专业编目软件如MarcEdit,也有通用数据处理插件如Open Refine,甚至还包括更通用的统计分析软件如R

这些工具支持的标准包括:

  • MARC, MODS, EAD, Dublin Core, BIBFRAME
  • IPTC Photo Metadata
  • PBCore, EBUCore
  • Framework for Interoperable Media Services (FIMS)
  • Exif, IPTC (IIM), GPS, TIFF
  • VRA Core
  • RDF

其中支持MARC的工具有:

  • MarcEdit(编辑/转换/验证/检索/分析;同时支持标准:MODS/EAD/Dublin Core)
  • K-Romanizer(韩语罗马化/转换)
  • LibreCat/Catmandu(创建/编辑/转换;同时支持标准:MODS/Dublin Core/RDF)
  • ruby-marc(创建/编辑/转换)
  • MatchMARC(检索)
  • MetadataMaker(创建;同时支持标准MODS/BIBFRAME)

原博文:

权威工具书《图书馆·情报与文献学名词》

昨日某名词审定委员会委员收到赠送给作者的《图书馆·情报与文献学名词》:

图书馆·情报与文献学名词 2019 / 图书馆·情报与文献学名词审定委员会. 科学出版社, 2019.8

本书大有来头,只看题上项:全国科学技术名词审定委员会公布。其权威性不言而喻。

收录图情名词3436条,含中英文对照及定义,分类编排,附英汉、汉英索引。前言说明了名词选择和撰写原则:重要概念不遗漏,重要解释无失误,外文翻译须确切,体例风格须统一

  • 分类借鉴《中图法》第5版图情一体化模式,分8个一级类目
  • 01 图书馆学情报学基础
  • 02 图书情报工作管理
  • 03 信息资源建设
  • 04 信息组织
  • 05 信息检索
  • 06 情报分析与研究
  • 07 信息服务与用户研究
  • 08 文献学

本书首先是一部可供引用的权威辞书。专业写作常常需要概念的精准翻译、准确定义,而当下专业工具书难觅,新名词似乎只能引用网络百科。本书编制始于2010年,2015年9月讨论通过。虽然内容更新截止2015年,已经相当难能可贵——如果有可与网络百科PK的电子版自然更好!(且听下回分解)

其次本书是一部很好的图情百科学习手册。分类编排,在前述一级类目下,再细分二级类目,可供全面了解图情某一领域的基本概念、基础知识,及时发现知识缺失、弥补短板——强烈推荐初入行者使用

—— 使用初体验 ——

  • 【一】拿到书,首先想到查一下“approval plan”,看推荐的翻译是什么。按“编排说明”,异名中的“简称”“全称”“又称”“俗称”可以继续使用(“曾称”则淘汰不用),文后索引中汉字条目前标星号(*)的就是异名(没有找到*说明、是推测的)。
  • 先查“英汉索引”
  • approval plan 送审订购,* 纲目订购,* 阅选订购 03.364
  • 再根据“03.364”看正文词条
  • 03.364 送审订购 on-approval order,approval plan
  • 又称“纲目订购”“阅选订购”。图书馆的一种文献采购方式。图书馆将其文献收集的计划范围(一般包括学科、文种、类型、地区、专业化程度、价格等)交给书商,书商按要求配送书,再由图书馆审核认可。多适用于规模较大、资金有保证并系统完备地收集某方面文献的机构。
  • 【二】看本体(ontology)相关词条,查索引是不是有倒排关键词,没有:
  • 在“04 信息组织”之“04.01一般概念”下,列有:本体(04.106),知识本体、语义本体、知识表示本体、顶级本体、通用本体、领域本体、任务本体、应用本体、领域-任务本体、方法本体、元本体,以及本体构建、本体学习、本体映射、网络本体语言等16个名词。
  • 在英汉、汉英索引中,“ontology”或“本体”下都只有本身及以其开头共4个。
  • 电子时代,只要有关键词/全文检索,倒排索引并非必须。当然前提是有电子版……(且听下回分解)
  • 【三】一贯手黑,随便浏览就发现了一处错误:
  • 04.648 FRAR 规范记录的功能需求 Functional Requirement for Authority Records
  • 应该是:FRAD 规范数据的功能需求 Functional Requirement for Authority Data
  • 非常理解失误难以避免,尤其对我这种最怕写词条这样严谨活计的人,绝不会以此低看全书的价值。

开源学术交流工具集锦:学术交流技术目录

开放获取机构库联合会(COAR,Confederation of Open Access Repositories)委托咨询机构Antleaf制作“学术交流技术目录”(SComCat),作为其下一代图书馆出版(Next Generation Libraries Publishing)项目的一部分,以CC 4.0许可发布。
Scholarly Communication Technology Catalogue

包括学术交流开放技术的目录(知识库),其中“技术”指软件及某些基本运行服务。目录概述每种技术的的功能、组织模型、依赖关系、标准使用以及采用水平,意在帮助潜在用户选择决定采用的技术。收录范围包括可以本地采用的工具、平台和标准,支持学术交流生命周期中的一项或多项功能,包括:创建、评估、出版/发布、传播、保存和重用。

本目录现列有81项开源技术或服务,包括如发现平台Blacklight,机构库DSpace、Fedora,电子资源使用标准Counter,研究数据管理应用Dataverse等。

选择选项(分面)包括:

  • 类别(应用、软件组件、软件框架、软件包、标准)
  • 馆藏(机构库相关)
  • 功能(如写作、数据挖掘、计量等)
  • 治理(如社区、非营利组织等)
  • 运营形式(如商业提供者、财政资助、志愿社区等)
  • 采用水平(普及、重要、有限、单个、未分类)
  • 可用水平(TR3/总体方案评审、TR9、未分类)
  • 状态(活跃维护、最低维护、已不支持)

详细信息包括(以Blacklight为例):

  • 最近更新 Last updated: 2021-01-27 12:33 UTC
  • 简介 Description: Blacklight is an open source Solr user interface discovery platform. You can use Blacklight to enable searching and browsing of your collections. Blacklight uses the Apache Solr search engine to search full text and/or metadata. Blacklight has a highly configurable Ruby on Rails front-end. Blacklight was originally developed at the University of Virginia Library and is made public under an Apache 2.0 license.
  • 主页 Homepage: http://projectblacklight.org/
  • 代码 Codebase: https://github.com/projectblacklight/blacklight
  • 路线图 Roadmap:
  • 托管 Hosting:
  • 许可证 Licensing: http://www.apache.org/licenses/LICENSE-2.0
  • 价格 Pricing: free to use
  • 采用水平 Adoption level: Significant
  • 可用水平 Readiness level: TR9
  • 治理 Governance: Community (ad-hoc)
  • 运营形式 Business Form: Not Classified
  • 状态 Status: Actively Maintained
  • 类别 Categories: Software Component
  • 功能 Functions: Discovery
  • 馆藏 Collections: 
  • 通用标签 General Tags:

另外,侧栏还提示相关技术

  • Is depended on by * Samvera
  • Depends on * Solr
  • Base technologies * ruby