为网站编目:《描述存档版网站的元数据应用纲要》

纽约艺术资源联盟(NYARC) 有一个网站存档项目 Archive-it ,目前有10个艺术资源存档集(1个始于2010、9个始于2014),共收录3千多个网站,存档网站包含视频等。存档集和网站均进行编目。
NYARC上月发布《描述存档版网站的元数据应用纲要》(第2版),基于NYARC使用MARC+RDA的编目实践,意在为图书馆和档案社群对网站编目(描述/著录)提供参考。文件存放于GitHub网站,由咨询师Rebecca Guenther制订,初版发布于2015年6月,此次修订发布于2018年8月,已应用于NYARC的10个存档集。内容包括概要及数据字典,MARC记录编码附注,记录样本。此外,数据字典款目包括其他元数据标准元素的映射,包括BIBFRAME、EAD、schema.org和OCLC的Web存档描述元数据指南等,方便相互间转换。
本文件的目的是为NYARC存档网站编目提供指引,但也适用于普通网站编目。大致看了一下,编目元素仅27个,大多数元素有可选值或固定值,需要完全填写的元素仅10个(其中5个可选),可称简洁实用。

via [BIBFRAME] Announcing Version 2.0 of NYARC Metadata Application Profile for Description of Websites with Archived Versions / Deborah Kempe (2018-8-31)

———NYARC《描述存档版网站的元数据应用纲要》笔记———
Metadata Application Profile for Description of Websites with Archived Versions, Version 2 (August 2018)
描述存档版网站的元数据应用纲要,第2版(2018年8月)
目次:
1. MARC/RDA环境中描述存档版网站的数据元素概要
2. 描述存档版网站的元素的数据字典
3. MARC记录编码附注
4. OCLC网络存档元数据(WAM)指南与NYARC【目次未列出】
5. 记录样例【目次标号为4】

1. MARC/RDA环境中描述存档版网站的数据元素概要【编目模板】
元素共27个(需要完全填写的仅10个,其中5个可选),四栏表格:
(1)元素(通用名);(2)对应MARC(字段/子字段);(3)强制性(M必备、M/A有则必备、O可选);(4)提供(可由工具获得,如抓取工具、固定值:8个*取固定值,2个-不采用,其他7个提供部分内容)
27个元素:1题名 2交替题名 3施事者名 4施事者职能 5*收集者(施事者+职能) 6体裁或作品类型 7*资源类型 8*形式 9发行方式 10发行地 11发行者 12发行日期 13抓取日期 14语言 15数量 16*附注(存档) 17摘要 18主题 19实际电子位置 20存档电子位置 21-收藏名 22-收藏URL 23*权利说明 24著录来源(根据模板填日期) 25*保存行动 26*责任者 27*机构代码

2. 描述存档版网站的元素的数据字典【MARC元素+与其他元数据标准的映射】
表格:
(1)元素名,MARC字段(子字段),定义,期望值(数据类型、受控词表、URI、字符串),重复性,强制性,MARC创建/维护附注,MARC使用附注
(2)映射(属性/元素名,映射附注):DC属性,MODS元素,BIBFRAME属性(类、属性),EAD元素,OCLC元素,Schema.org属性

3. MARC记录编码附注【主要是0XX字段的说明】

4. OCLC网络存档元数据(WAM)指南与NYARC【元素对照,目次未列出,估计WAM指南2018.2发布后添加】
三栏表格:(1)OCLC WAM元素;(2)NYARC AP元素(对应MARC);(3)附注
OCLC WAM元素(14项):
1收集者 2贡献者 3创建者 4日期(网站上线日期,种子URL抓取日期,网站查看日期) 5描述(传记和历史信息,收集理由,范围与内容,摘要,档案检索工具) 6数量 7体裁/形式 8语言 9关系(单个网站到收藏) 10权利(使用限制、访问限制) 11著录来源 12主题 13题名 14URL

5. 记录样例【编号有误】
4.1 艺术家网站
1.2 归还失落或被掠夺的艺术品
4.3 画册目录(Catalogue raisonné)
4.4 艺术资源
4.5 美术馆
4.6 存档集

网站可用性测试

2008年参加中美数字图书馆高级研讨班,有一门课“人机交互与数字图书馆”,涉及网站的可用性测试。当时我用本馆学位论文系统,出了一题请四位同班同学测试,发现不少问题(参见:用户界面可用性测试, 2008-6-14)。
这种测试方法很简单,不过功课做完就忘记了。图书馆网站改版时,也没想到要做测试,真是太不专业。今天看到ALA技术源发布的“可用性测试样例”,再记录下,强化记忆──其实想做测试,什么时候都行的,网站总是不断完善中的。

ALA TechSource Workshops: Usability Test Examples(有墙)
文档举了(针对某个图书馆网站的)6个问题及成功回答的步骤:
问题1:你想要借《哈利波特和密室》,该怎么做?(目录)
问题2:你在工作,想问个问题。有网但不能使用电话,到哪里在线提问?(在线咨询)
问题3:想读昨天朋友提到的一篇有趣的杂志文章。你知道图书馆可以访问杂志联机版,如何找到杂志数据库列表?(测试数据库导航) [电子期刊导航]
问题4:今天汽车图书馆会不会停在……? [某项图书馆服务]
问题5:你的朋友想在图书馆工作,能不能为她找到当前开放申请清单
问题6:你想给图书馆打电话,能不能找到电话号码?(联系我们)

例子自然有借鉴作用,不过例子最后的提示更重要(方括号后照例为本人联想):
– 提8-12个问题
– 每题不超过2-3分钟 [大致每个人半小时以内完成吧]
– 问约5个人后,修正发现问题,然后重复测试
– “正确答案”会不止一个──用户具有创造性!
– 提一个问题,然后记下一切──被测者鼠标点击什么、移过什么,如果点击后又退回,他们怎么说,等等
告诉被测者,你不是在评估他们──你是在评估网站,他们不会答错问题。[这个应当在测试一开始就明确告知]

——–“十步成就用户友好的图书馆网站”研讨班资料———-
不知道上述可用性测试题是不是年初“十步成就用户友好的图书馆网站”的配套资料,研讨班信息备记于此:
10 Steps to a User-Friendly Library Website / 主讲:Aaron Schmidt 和 Amanda Etches-Johnson (2012-1-25)
阅读资料:Continuing the Conversation: 10 Steps to a User-Friendly Library Website
参见:给网站“减肥”,以及用户体验设计 (2011年3月28日)

阅读资料页面嵌有研讨班PPT(175页)
10 Steps to a User-Friendly Library Website
第1步:Reduce your website 给网站减肥
网站金字塔,从下到上依次为:
* 基本:必需信息、相关功能、无主要可用性问题
* 目的地:馆员创建内容、基本互动
* 参与分享:严肃的用户生成内容、读者创建文化
* 社区门户:图书馆网站作为社区平台、网站成为社区知识库
第2步:Mobile first 移动优先
第3步:Conduct usability tests 实施可用性测试
五个词 Watch People Use Your Website 看人用网站(非图书馆员)
第4步:Mind your navigation 设计导航
第5步:Write for the web 页面布局/遣词造句
第6步:Content audit 内容审核
第7步:Content strategy 内容策略/工作流程
创建、传递、管控:有用、可用、令人满意的内容
第8步:Use graphic design 图形设计/美工
第9步:User research 用户研究
第10步:Create personas 分配角色/任务

学网站制作,上W3学校

远洋师在书社会推荐W3Schools,说XML很容易学。不意在家访问w3school.com这个纯IT学习网站竟然要翻墙,架上梯子看一眼,加入收藏的一瞬,想到自己很久没有正儿八经地学新东西了,下次再打开这个网站又不知何时。那天正是周五晚,周末后还有中秋假,于是下决心在接下来的三天中学会XML。
说干就干,马上开始学。开篇说很容易学,翻到下一页,说学前要先了解HTML和Javascript。HTML略有所知,于是转到JavaScript去看个究竟。也说很容易学,翻到下一页,说要先了解HTML和CSS。于是转到CSS页面去看,翻到下一页,说需要先了解HTML/XHTML。前期知识一串串的,崩溃。
虽然书社会多位网友都说不必学那些前期知识的,但因为自己并没有系统学过HTML,也没有制作过什么网页,绝大多数HTML知识是通过看页面原代码得来的,因此决定从头学一遍。当晚从HTML/XHTML开始,接着是CSS(部分)、JavaScript,整整两天完成准备知识(其中外出FB一次)。第3天晚上开始学XML,到第4天下午完成,说出的大话终于不用收回。晚上外出散步,走着走着,满天厚厚的云层突然一扫而光,中秋日皓月当空。

不得不说,W3学校真是很棒的学习网站:
√ 每页一个知识点,只提供最基础的信息,让初学者不至于陷入过多新知而失去学习的信心。完整的参考附在最后,可供扩展学习。
√ 可以边学边看到实例及实现效果,还可以自己编辑例子后看显示结果,互动感很强。
√ 告知标准的最新进展,免得用过时内容(比如<font>标签到HTML4不推荐,Frames框架未来将不支持)。
√ 课程开始前告知准备知识,学完课程后告知接下来还可以学什么,让人目标清晰而不至迷失(五方面课程:HTML/CSS,XML语言,浏览器脚本、服务器脚本、多媒体)。
√ 课程结束后有一个自测,20道题、满分100,答题不限时,会让学习者特有成就感。
──如此速成,学完后自然不可能马上做出好网站,但看网页眼光会毒不少,也知道某些功能可以如何实现了。
[update 2011-10-15:
1、目前已不用架梯可访问;
2、网站的中文站目前有HTML部分]

附记:关于XML学习
XML课程中提到要更深入地了解某些方面,分别需要学习DTD、XML Schema、XSLT和XML DOM,准备留着今后哪天再下决心。远洋师认为可以直接去看MARCXML的schema或者VRA Core 4来学XML Schema。MARCXML的schema是看过的,当时没啥感觉──这次学完XML也还没啥感觉,准备学完XML Schema再去看那两个Schema实例。我想对菜鸟来说,还是从基础知识学起比较好。
接受远洋师建议,未来准备跳过DTD和XML DOM,但XSLT还是想学一下。自当年在数图研讨班(JASDL)上听秦健老师讲样式表的那些很酷的应用实例,一直念念不望的──念了这么些年还没有些许行动,对自己也无语了。