“Web/Lib2.0”第三次研讨会参会侧记(上午)

    到杭州过周末,实在是件很惬意的事。上午和超平在杨公堤闲逛了半日,下午回到上海,想起昨天的会议,好象已经很久远了。
    会上记了几笔,幸好还有PPT、视频帮我回忆。

    外出开会不喜欢带电脑,好不容易可以远离网络,乐得轻松。但去年会议是看网上直播的,此番既来参会,也有义务参与直播聊天,与远程网友互动。一大早在宾馆按要求装好了软件,到现场设置好网络,登录进直播,显示自家电脑少了DirectX 9,进不了视频现场,很被丫枝嘲笑了一通。由于网络问题,找了几个下载网址,下载进程永远是0%,只得放弃。手忙脚乱结束,专心听讲,偶而在QQ群中打几行字。

    主持人叶鹰讲话过后,李国新第一个致辞,讲自己第一次会议时即想参会,第二次会议参与网络直播,第三次终于亲临会场。由于是以中图学会学术委员会常务副主任身份讲话,后面的话……在晚宴时被竹帛斋主认为把功劳都记在自己帐上了。公平的说,李教授一开始就说本次会议学会只是名义上的主办单位。
    接下来程焕文上场。这是首次见到竹帛斋主,果然“眼花缭乱”,怪不得粉丝无数。开场白过后,斋主低头念他的284个图林博客名称大会串──图林博客礼赞。后来向斋主请教做此奇文费时多久,据称主要的时间花在找出这些博客名字上,接下来用图书馆的看家本领──分类就搞定了。斋主与2.0会特别有“缘”,第二次会议在广州机场滞留数小时,最终放弃而未与会;此次又在广州机场逗留若干小时,估计是在夜半过后才到的宾馆。
    第三位在日程上是刘炜/范并思,最终是老槐说了几句。

    九点不到,“技术报告”部分提前开始。每人限时20分钟,主持人叶鹰还展示了大大的黄牌、红牌,在其后的限时报告中出现过若干次。
    黄晨“2.0技术实践与数字图书馆”,介绍CADAL的一个原型──基于标签的自动分类与推荐系统,目前在某个孔子学院数字图书馆上试用,一万册书,目标是用于百万册图书项目。他的结论以本次会议副标题为题──论剑2.0,谈他的开发感想:尽可能简单;技术服从于功能;把自己当作使用者;多种专业素养
    赞助商Oracle发言,介绍他们的数据库网格技术。据称赞助商发言没有不超时的,这次也不例外。
    王军“Ontology和Folksonomy的融合──中文社会书签‘兜乐’的设计与实现”。可去兜乐一看,最主要的特色应当是把标签置于受控的概念之下,形成一个有等级的体系。用标签的都知道,标签多了,自己也不好找,所以美味书签会有把标签扎梱之举,但每个人都只对自己的标签进行操作。没听得很清楚,好象兜乐是用户在加标签的时候,会把自己的标签体系同时上传。PPT最后是研究小组5位年轻成员的照片,主持人还请到场的他们站起来亮相。有兴趣还可以去看看研究小组网站:http://KVision.pku.edu.cn

    茶歇过后“特邀报告”开始。主持人柯平先讲了一段,据称被网友亮了黄牌。听到他讲兼容草根研究与学术研究,想起前晚几位博友坐在宾馆大堂闲聊,等着尚未到会的万二、游园,一位大腕级人物从后面走过,对边上另一位称“这是些小鱼小虾”。
    郑巧英“上海交大图书馆2.0实践”,与11月上海会议相比,已经有了一些进展,如材料学科博客已经从设想到了总结经验阶段,开发中的MSN机器人似乎由对话查询更多地转向推送(广播与个性化的到期提醒……)。
    杨新涯“书斋剑法精要”,署名“可也斋”,介绍重庆大学重起炉灶的一个整合管理、业务与服务的图书馆自动化系统。前一天已经见到杨馆长演示过部分功能,具有很多流行的2.0网站功能。当PPT上放出“第一剑 有凤来仪”,掌声四起。
    陈光华“台湾大学图书馆2.0实践”,谈到Web2.0可能的应用,即整合与分散的资讯服务。如重大当属整合,而台大开发了一些分散的服务,“把服务送到读者的个人环境,让读者很方便地使用图书馆的服务”,如Widget、API……。今晨早餐遇到陈教授,询问有关服务何时推出,指点去看他们的BLOG。

[update 2008-4-16] 今天看蓝天白云讲到“总结报告的柯平教授激动地赋诗一首”,想起自己没把在会场上记下的那首诗录在此,主要原因是想不起来此诗是柯教授何时所赋。现补上:

    草根又逢春、杭州2.0、烟酒大PK、谁敢占图林

数字、字母、符号,都入五言绝句──真绝!

(下午会议明天继续写,不过不建议所有人继续看,因为……不太严肃或太不严肃)

参见:

老槐也博客:图书馆2.0会场速记
凯瑟琳的家园:网络全程参会Lib2.08
蓝天白云:2.0会议的“1.0会议”后记(后附开幕辞)[update 2008-4-16]

会议官方网站:http://lib2.zju.edu.cn(本次会议由厦大直播)
上海交通大学:“浙江大学Lib2.0会议视频”(含PPT下载)

开源的链接解析器前端Umlaut

Umlaut是一个开源软件,被称为“链接解析器前端”(link-resolver front end)或“中间层链接解析器”(middle-tier link resolver),而其本身其实就是一个链接解析器,接收OpenURL请求(通常代表学术作品的引用)、回答与引用相关的可用服务信息(最重要的是电子可用性)。与典型的链接解析器产品(如SFX)不同的是,它不管理自己的“知识库”(knowledge base)──有关一个机构拥有的某供应商所提供题名的信息及其链接。它通过SFX API获取这些信息。

Jonathan Rochkind花8个月时间为约翰·霍普金斯大学(JH)的SFX配置了Umlaut作为前端,于1月初上线。选用Umlaut的最初原因是为了方便处理用户界面,更重要的是有了一个增加功能与服务的平台。
目前的功能有:
1、直接链接:在有电子全文的情况下,点击"Find It"后直接链接到文章,而不需要经过菜单层。
2、物理馆藏:在没有电子全文的情况下,直接显示物理馆藏的位置与可得信息(通过ISSN或ISBN匹配,如无则显示OPAC关键词检索链接);同时处理MARC 856字段的链接。
3、相关链接:在侧栏显示相关链接,期刊是Ulrich、WorldCat,图书是Amazon、WorldCat、isbndb(在线购书最优价),只显示有命中结果的链接。[这点对链接服务而言是最重要的,否则足以令用户对其丧失信息]
4、检索开放存取库:以作者/题名关键词检索IndexData的OAISter及开放内容联盟(OCA)的免费访问文本。目前还不完善,因为没有受控的元数据匹配点。
5、集成到OPAC:除全文链接外,侧栏还有“参见”,显示Ulrich、WorldCat、Amazon、isbndb等。

希望增加的功能包括:
· 如Rochester的直接跳到全文
· 增加Google图书搜索
· 连接到OCLC身份(OCLC Identities)
· 使用xISBN/thingISBN
· 用Bowker的ISSN服务强化元数据
· 无全文时集成本地文献传递服务到可选菜单[SFX无此功能?]

Umlaut目前还是一个完善中的平台,Jonathan Rochkind希望有感兴趣者加入作为开发伙伴。对于相关产品的期许是:有人为其它链接解析器提供API,这样也可用Umlaut;未来可以有商品化的链接解析器知识库可以购买。有关技术细节见:http://findit.library.jhu.edu/resolve

Umlaut原是Ross Singer在佐治亚州理工大学(GT)时开发的。Ross Singer觉得JHUmlaut需要改进的是解析速度过慢。但他很高兴JH用上Umlant,也希望由此有更多的SFX及其它链接解析器用户加入此行列。因为GT刚在近四周前撤下此应用,其原因除了他本人的离去外,主要是EBSCO的bug──其OpenURL加了<<SomeIdentifier(具体原因:Since this is injected into the location header via JavaScript (EBSCO sends their OpenURLs via a JavaScript popup), Internet Explorer and Safari don’t escape the URL which causes Mongrel to explode (these are illegal characters in HTTP, after all),而GT有差不多一半的电子资源来自EBSCO。
如果对技术细节感兴趣,Ross Singer此文绝对值得一看(12/17/07 – Resurgens – 1/11/08)。

参见:
Bibliographic Wilderness:(Re-)Introducing the Umlaut (1/14/08)
用(Re-)?对JH来说是引入Umlaut,但对于Umlaut来说,是再一次被引入。

Dilettante’s Ball:12/17/07 – Resurgens – 1/11/08

SKOS:简单知识组织系统

[DIGLIB]2008-2-27消息:
SKOS Primer征求意见(Call for Comments: SKOS Primer: W3C Working Draft 21 February 2008):SKOS Primer 将取代SKOS Core Guide (2 November 2005)。
看SKOS Primer一过,稀里糊涂。收集些SKOS的资料。

SKOS Home(http://www.w3.org/2004/02/skos/
SKOS: Simple Knowledge Organisation Systems

SKOS是一个工作领域,致力于制定规范和标准,支持在语义网(Semantic Web)框架中利用知识组织系统(KOS)如叙词表、分类法、标题表系统和系统分类法。
SKOS提供标准方法、使用RDF表达知识组织系统。

维基百科中的SKOS(http://en.wikipedia.org/wiki/SKOS)[上述官方网站提供的唯一外部链接]

SKOS是设计来表达叙词表、分类法、系统分类法、标题表系统或任何其他种类结构化的受控词表的正式语言家族。SKOS建立在RDF及RDFS基础上,其主要目标是方便为语义网出版受控结构化词表。SKOS目前在W3C框架内制定。

历史
SWAD-Europe (2002-2004)
  欧洲语义网高级开发项目。2003年底SKOS核心与SKOS映射首次出版。
Semantic Web Activity (2004-2005)
  W3C主义网活动。
Current Status and Roadmap (2006-2008)
  SKOS的主要出版文献均处于W3C工作草案状态:
    SKOS Core Guide (2 November 2005)
        [计划由SKOS Primer取代,并与新的SKOS Reference配套]
    SKOS Core Vocabulary Specification
    Quick Guide to Publishing a Thesaurus on the Semantic Web

社区与参与
正式参与:语义网部署工作组(Semantic Web Deployment Working Group)http://www.w3.org/2006/07/SWD/
非正式讨论:public-esw-thes@w3.org邮件组

SKOS组成
SKOS被设计为模块化、可扩展语言家族,其使用与实施应尽可能简单。其组成为SKOS Core, SKOS Mapping, SKOS Extensions。
SKOS核心定义标准叙词表中表达通用特征的类与性能,它基于以概念为中心的词汇观,其原始对象不是术语(词),而是术语所代表的抽象概念。每一概念具有所附的RDF特性,包括:
· 一个或多个优选索引词(每种自然语言最常用)
· 交替词或同义词
· 定义与注释,以其语言的规范
概念可以使用属-分关系以等级方式组织,也可以非等级(相关)关系链接。

应用
AGROVOC与GEMET升级到SKOS格式
SWED环境目录使用SKOS作为叙词表语言
阿姆斯特丹Vrije大学将MeSH转换到SKOS
IBM开发了使用DITA与SKOS的主题分类
GeoNames本体采用SKOS表达地理特性类别(geographical feature types)

工具
· ThManager:Java开源应用
· RDF-OWL编辑器如 Protégé或SWOOP
……

与其他标准的关系
· SKOS与叙词表标准
  SKOS开发有来自RDF及图书馆界专家参与,SKOS拟准许方便迁移由NISO Z39.19-2005和ISO 5964:1985标准定义的叙词表。
· SKOS与其他语义网标准
  本体语言OWL的简化版。