存档在 ‘乱花迷眼’ 分类

台湾机构典藏(TAIR)

2008年7月25日

    台湾机构典藏(TAIR),采用DSpace建设,由各大学分散建立、并有统一检索平台。

发展
· 2004年起,世界各国大学已开始陆续建置机构典藏
· 2005年5月[台湾]教育部委托台湾大学图书馆进行“建置《台湾学术研究资源中心》运作架构、机制与执行策略计划”,该计划经教育部评估后,认为建置台湾机构典藏,为政府当局刻不容缓之重要工作。
· 2006年6月开始,[台湾]教育部继续委托台大图书馆执行“建置机构学术成果典藏计划”,以台湾大学为机构典藏的营运范例,开发机构典藏软体与完备相关行政作业流程文件与标准规范,作为全台湾各大学院校建置机构典藏的参考。
· “分散建置、集中呈现”的发展模式:截至2008/7/14,有64家高校采用台大研发的系统建立本校机构典藏,其中30家“种子学校”已经上线(被称为IR30)。除各校自已的系统外,以台湾机构典藏(TAIR)入口网站作为整体学术研究成果的累积、展示与利用窗口。
    目前台湾机构典藏显示总记录数为30566,其中全文13759,少于台大机构典藏的数量(见后)。因此“在台湾机构典藏(TAIR)系统中,将可以同步检索到存放在台大机构典藏系统(NTUR)之所有学术资源”之设想,看来尚未实现。

系统架构:采用DSpace 1.4 Beta1作基础,配合台湾之学术环境,依据中文语言特性及使用需求,客制化系统介面与系统功能。

作为模板的台大机构典藏·文件提交方式
    上传文件前,需同意“台湾大学著作典藏同意书”。授权用户(同时也是著作人)本人上传,上传前在线点击“我同意条款”即可;如委托学科馆员或助教上传,需先下载委托书,打印签名交被委托人存档。
    台大机构典藏目前已有记录54814条记录,其中全文27920条。从数量上看,用户参与度还是很高的。只不清楚这么多记录中,多少比例是由作者本人或助教提交、多少比例是由图书馆学科馆员代为提交的?

资料来源:
台湾机构典藏(TAIR) http://tair.lib.ntu.edu.tw/
台大机构典藏(NTUR) http://ntur.lib.ntu.edu.tw/
机构典藏计划网站(NTUR Wiki) http://ir.org.tw/
  其中“参与机构清单”有各机构库链接

相关会议:
台湾机构典藏学术研讨会 (2007/8/31)
台湾机构典藏实务研讨会 (2008/6/13)
机构典藏系统操作与管理教育训练 (2008/7/9)

via EVAN: 西文电子资源的视界
2008臺灣機構典藏實務研討會 (七月 23, 2008)
2008「機構典藏系統操作與管理教育訓練」(七月 23, 2008) 

用户界面可用性测试

2008年6月14日

    前晚在电脑桌面上看到一个名为“用户界面可用性测试”的PPT,觉得有些好奇。打开一看,原来是上个月中美数图研讨班人机交互课时,我们组的一个作业──以用户测试方法,对本馆学位论文数据库做人机界面可用性测试,测试专题是有关苏州的民俗。当时上台演示就是用的这个PPT,还想着回馆后据此改进,重新发布一下检索界面。不料课程结束后就忘得一干二净,甚至见到文件名,不打开居然就不记得还曾有过这件事。唉,廉颇老矣!

    规则是:测试者只做客观的观察与记录,可以询问被测试者做某项操作的原因,但不能向被测试者做演示说明、不能指点被测试者如何“正确”操作。
    先后有四位同学做白老鼠。这次测试给我最大的冲击就是,原来不同用户使用系统的习惯还真是差别巨大,四个人竟然就没有相同的,几乎可以说完全不同。这真是个简单而又强大的方法!因为从中发现了用户界面的很多问题。

    第一位典型的Google风格,直接在检索词框输入检索词“苏州”,然后打回车。在Google的熏陶下,相信大多数用户都是这样的习惯。很遗憾的是,出现了“请选择检索范围”的提示──本馆用的是TPI系统,由于采用了“导航”功能,必须先选择范围,才能有检索结果(这点似乎不是我能够改进的)。
    于是,选择检索范围,再检索,系统显示“对不起,没有找到相关记录!”想想不大可能啊,又不是什么很偏的内容。仔细看检索词,发现上面的检索字段是“姓名”。(大家的意见是,最好像Google一样,默认为所有检索字段,只是TPI并不支持。不过,使用学位论文系统的人,以作者姓名检索的肯定是少数,用中文关键词、中文摘要甚至中文题名做为默认检索字段,都比姓名好得多)
    再于是,选择检索字段,下拉框里出现了几十个选项,连学号、联系电话、EMAIL地址等等都是,看得人眼花缭乱。(很明显,无用的检索字段除了干扰使用外,没有任何益处,应当去掉)
    终于出现了检索结果。再使用二次检索,用“民俗”做限定……

    第二位很细心,一开始就看到有选择检索范围的,很仔细地挑选……

    第三位是最专业的,选择检索范围、字段,输入检索词“苏州”,回车,看到只命中二十多条,决定逐条查看筛选,因为“或许有些相关内容,没有用民俗这样的字眼”。这时发现检索结果一览显示的是:姓名、学号、学院、系所、学科、专业。要想筛选,得逐条点击看详细记录。(测试到这里,本人已经觉得无地自容,不知道我们的用户界面什么时候变成这副不堪的样子了)

    第四位迷信高级检索,同样受到众多无用的干扰字段,结果只在一个输入框中输入“苏州民俗”就开始检索了。很幸运有一条命中的,但面对结果,却不知道如何才能看到详细信息。(TPI比较奇怪,需要点击姓名看详细信息,这点我无能为力)
 
    昨天抽空对本馆学位论文系统重新做发布,没有看到发布过的痕迹,大概是什么时候系统重装、缺省发布,所以才会有那么奇怪的检索界面。测试中发现的问题,有些不是我能改变的,有些错误我不会犯,但如果没有做过这次测试,我肯定想不到改变系统的缺省检索字段。
    教训:如同编目员需要关注OPAC界面,自建数据库也必须关注用户界面。除了一开始应该做可用性测试外,正式运行以后,也该想着经常去看看,有没有什么问题?

参见:
中美数图研讨班2008·人机交互与数字化图书馆 (2008-05-24)

密歇根大学MBooks提供OAI接口

2008年6月2日

    看到密歇根大学图书馆开了一个技术博客,订上后觉得每篇博文都值得加星。想像中如果能在这样的图书馆工作,一定会很有成就感。

    作为Google创始人的母校,密歇根大学参与的Google图书馆计划特别引人注目。开博不足一月,已有多篇述及被称为MBooks的这项合作。比如对于受版权保护图书的电子版,通过多重认证方式依法向视觉障碍学生提供(What to do with books in copyright);再如对于公共领域图书的电子版,在OPAC检索结果中提供全文搜索框,并链接到全文(Full-Text MBook Searches from the Library Catalog)(全文访问速度很慢,永远是“正在载入”)。

    感触最深的则是MBooks对全部公共领域图书的记录(目前已超过121,000种),提供OAI收割(University of Chicago integrating MBooks in catalog using OAI),目前芝加哥大学已经把收割的记录集成到自己的OPAC中(那个基于AquaBrowser的新一代目录LENS)。据称下图中第二条记录提供的就是到MBooks全文的链接(实际链接似乎是指向Google图书)。如果哪个图书馆也想像芝加哥大学那样利用MBooks,可以访问:MBooks – Michigan Digitization Project – OAI Harvesting

    之所以感触良多,是因为我们的数字化项目大多养在深闺不愿示人。最近还听说CADAL似乎也有限制访问计划(未经确认),真的感到很悲哀。

推荐:
密歇根大学图书馆技术博客:[BLT] Blog for Library Technology
密歇根大学图书馆实验室:MLibrary Labs

参见:
芝加哥大学图书馆的LENS:高校馆也用AquaBrowser (2008-01-05)
Google合作馆如何处理他们的数字化图书 (2007-04-04)
MLibrary 2.0 塑造图书馆员2.0 (2007-06-10)

中美数图研讨班2008·结业

2008年5月30日

    今天结业式时,同样参加了二期研讨班的牛排问我,如果以后再办这样的课程是否参加?我的回答是否定的。事实上,此次报名前就很是犹豫。并不是因为自己已经到了不能学吹打的年龄,而是觉得思想负担太重──因为除了老外上课,还要完成一个项目报告并汇报。

    研讨班采用分组学习形式,不幸做了组长,压力太大。项目本是子虚乌有的东西,但完全凭空设想从无开始设计自己感觉过于困难,所以总是希望从现实中找原型。项目由小组成员协作完成,因而需要考虑各人情况确定主题,尽可能使大家都能有所贡献、有所收获。要在三门课程逐次进行中设想好如何结合课程内容(包括还没有上的内容),在课程进行到一半时提交项目计划,在课程全部完成的当晚完成项目汇报Poster,最后完成项目报告(去年要求10-12页纸,今年是12-15页),作为课业评估的依据──凡此种种,让自己觉得完成项目报告及汇报是课程中最重要的部分,课程内容反在其次了。如果是一个学期,这种注重参与、合作、实践的教学方法很有吸引力,可是现在是要求10天内完成(项目报告略迟)!

    好在小组成员同心协力,在课程进行过程中开始准备。一方面,根据秦老师的“数字图书馆项目报告写作要点”,以项目计划为纲,在Google Docs上协作撰写项目报告;另一方面,本组的技术帅哥根据设计计划PS图若干,为项目汇报Poster做了一些准备。前天小组各位做了一下午的Poster,赶在傍晚完成。昨晚22:33,经过一整天的埋头苦干,自己终于整合完成了13页的项目报告(初稿),长舒一口气。结果已经不重要了,完成就好。

    牛排对这样的学习与交流机会很是欣赏,我也觉得很有收获。只是,实在太累了!

推荐:
图情随笔:数字图书馆项目报告写作要点 (2008-5-23 17:28,显然是美国时间!)
    秦健老师对项目最终报告的说明。秦老师很辛苦,23日晚刚到就给大家讲如何做最后的Poster。各组提交的项目简介也是那时才拿到手,24日一早对11个组项目的评语就已经摆在大家的桌上了,还有针对性地写了这个“要点”。

Beefsteak is thinking:第四期中美数字图书馆高级研讨班感受(一)(2008-05-29)
牛排英语一级棒,对数字图书馆的认识又远在本人之上,他的感受更值得一读。期待新的博文出现。

附:第三期研讨班曾有一个博客,现在居然不能访问了,可恶的Donews!

    本次班长在Chinaren上建了一个校友录,挂在中科院研究生院名下。
    比较有意思的是Chinaren的注册过程。看校友录的先决条件是注册(应该有搜狐通行证也行),一串空格让填,其中有一项身份证号,看着很不爽,决定如果一定要,就不注册了,所以留空──结果很顺利地注册完成。同组一位注册时杜撰了一个身份证号,居然说号码不对不让注册,只好填了真实的身份证号。

参见:
中美数图研讨班2008·实用分类系统的编制与应用 (2008-5-30)
中美数图研讨班2008·数字资源长期保存 (2008-05-24)
中美数图研讨班2008·人机交互与数字化图书馆 (2008-05-24)

[update]

图林茶: 静等Poster出场 (2008-5-29) [忙着写报告、写博,还没来得及看RSS]
图情随笔:挂图展:第四期中美数字图书馆研习班学习汇报 (2008-5-31)
Beefsteak is thinking: 第四期中美数字图书馆高级研讨班感受(二)(2008-06-02)
Beefsteak is thinking: 第四期中美数字图书馆高级研讨班感受(三)(2008-06-03)
Beefsteak is thinking: 第四期中美数字图书馆高级研讨班的朋友 (2008-06-03)
Sunfire: 上海行杂记 (2008/6/5)
Beefsteak is thinking: 乌托邦项目的臆想 (2008-6-5)

 

中美数图研讨班2008·实用分类系统的编制与应用

2008年5月30日

    开班前看到远洋过客的“正确认识本体的功能和局限”系列博文及首篇下热闹的评论,完全不知所云。上完第三门课“实用分类系统的编制与应用”,在秦健老师的指导下用Protege试做了一个最简单的ontology,对第二篇有了点感觉。不过,短短二天半的课程,对ontology只能说连一知半解的程度都没有达到。

什么是ontology?
    就像什么是Web 2.0,什么是图书馆2.0,定义五花八门,可谓众说纷纭。
    秦老师在课上不同部分举了很多种说法;迷图在前述博文下的评论:“可以查查Google的definition,看看ontology有多少说法。”

ontology可以做什么?
    这是最令人困惑的。
    为了“学以致用”,在最后报告中用上ontology,看了一堆期刊文章。结果很失望,因为看到的那些概念结构图都是一维树状或带少许网状的,而我想要做的是一个依时间变化的二维交叉结构。那些概念结构图,在我想来用不用ontology这个概念都无所谓的。
    所幸查到肖怀志的博士论文,让我觉得ontology真的可以做些事。《基于本体的历史年代知识元应用研究》通过建立三国时期的历史年代本体,由计算机抽取《三国志》中的历史年代,实现相关历史年代信息的检索和聚集。

如何建立ontology?
    看了肖博士的学位论文,才让我知道建本体原来超级烦人!并不是画个结构关系图那么简单。一个公元纪年与三国年号纪年对照表(两页纸,4列不到100行),化为ontology,就是数十页纸的篇幅:不但要为每个年号做框架(如“甘露”),还要做出其中的每一年(如“甘露一年”“甘露二年”……);为每个公元纪年做;还有国别、皇帝……(参见第四章”三国时期历史年代本体的建立“)。

    看了此文,课上举的那个例子也就可以理解了:
    Adam和Beth生了Charlie、Donna和Ellen三个孩子,要描述出其家谱,需要几个框架?如:
Adam
性别:男性
配偶:Beth
孩子:(Charlie, Donna, Ellen)
    答案是至少7个:5个人各做1个,另外还有2个?秦老师说,分别是:男性、女性。

什么时候用ontology?
    二种情况:当需要共享或者再利用某领域的知识时。
    秦老师语:有时候可以用成熟的、传统的、经济的方法,不一定非得用……

    远洋过客言:“以推理为目标和按逻辑和公理制作的本体(泛指词)只是可以利用的知识组织系统之一,不应是我们唯一的、也不应是最终的目标和手段。”
    不过,看三国纪年、家谱的ontology框架看得让人上火,如果不是为了让机器推理,我才不要做什么ontology呢!一个二维表岂不简单得多?

    以上是上完课后,对Ontology的认识,纯属外行胡言乱语,如有误导,概不负责;-)

推荐:远洋过客:
正确认识本体的功能和局限(1)(May 9, 2008 at 4:43am)
正确认识本体的功能和局限(2)- 概念显示实例 (May 9, 2008 at 11:35pm)
正确认识本体的功能和局限(3)- SWAD的例子 (May 11, 2008 at 3:13am)

数图研究笔记:“本体”或“实用分类系统”?(5月 21st, 2008 @ 00:51)
Keven对远洋过客博文的述评。

参见:
中美数图研讨班2008·数字资源长期保存 (2008-05-24)
中美数图研讨班2008·人机交互与数字化图书馆 (2008-05-24)