Our Space:元数据的新世界

    OCLC总裁们近来喜欢用Our Space命名自己的PPT。上回总裁Jay Jordan在上图的报告用此名,后来得知还有其他同名版本。这回WorldCat和元数据服务副总裁Karen Calhoun在IFLA年会上的报告也用此名:OUR Space: the new world of metadata。这个our很暧昧,OCLC抑或图书馆界?

    当年还在康奈尔大学的Karen曾受LC委托,于2006年发布研究报告“改变目录性质并与其他发现工具集成”,引起轩然大波。在本PPT中,Karen举出LC在馆庆二百年之际召开的新千年书目控制会议后的行动计划LC Action Item 6.4:“支持改变目录性质的研究与开发,考虑与其他发现工具集成的框架”(p.3),可见当初也是师出有名的。
    图书馆目录被视为第一个自助服务的信息工具(p.2)。按“地心说”,图书馆界以为本地目录是太阳;而据“日心说”,本地目录不过是颗行星(p.5)[此图已在OCLC的PPT中出现过多次,托勒密的地心说不知为何成了亚里斯多德的]。联机目录只是最终用户信息环境中的一个节点(p.4)。
    引用两部名著,说明信息业对元数据的认识:Tim O’Reilly在“什么是Web2.0”中认为,“数据是下一个Intel Inside”;David Weinberger在《Everything Is Miscellaneous》中说,“数字世界……从不会遇到丁点它不喜欢的信息”(p.7)。
    三个实例:
· ebay用复杂的Web模板与索引支持用户提供的元数据(p.8);
· HousingMaps利用Google地图与craigslist做房屋租售,采用复混、重用、混搭的Web2.0元数据管理(p.9);
· 亚马逊联机阅读使用元数据+全文检索(p.10)。

    对于什么是“完整”记录,编目员与亚马逊显然有不同理解(p.11)。
    元数据的基本模式已经改变,除了图书馆元数据实践中的题名等等,还有其他属性:如何获取、版权、销量、流通量、禁书、获奖、引用、评论(出版者、读者)、作者信息、其他版本、技术元数据、标识号、相关作品、博客谈论、用户标签、衍生作品等等(p.12)[不就是亚马逊的元数据么]。
    要改变图书馆元数据的内容。模仿公元前后,分为Web前后(B.W.和A.W.),Web后,要松散耦合的元数据管理,在多个存储间重用及交换服务混合手工和自动创建、元数据抽取、转换、映射、摄入与传递服务(p.13)。

    馆藏已然改变(p.14-15),研究图书馆协会成员馆2004-2006在电子期刊上的支出逐年超过印刷专著,2006年电子期刊占资料费36.6%,专著占21.6% (p.16)。几个其他类型的实例:
· 机构库,如魁北克大学蒙特利尔校区的archipel (p.17);
· 学术门户,如开放存取的arXiv.org (p.18);
· 开放的科学研究,如巴西科技部的IBICT电子学位论文,也收录于WorldCat(p.19);
· 新数字馆藏,如欧洲数字图书馆、博物馆、档案馆Europeana(p.20);
· 图书馆特藏开始见天日(p.21-22),LC书目控制未来工作组报告On the Record提出“强化对珍稀及其他不可见特藏的访问”(p.23-24)。

    信息搜索已然改变(p.25),大学的研究、教学内容正在改变(p.26),学术交流形式改变(p.27),而今后的学生……(p.28)

    瑞典Lund大学调查,新学术图书馆用户的五大期望,总结下来就是远程、独立使用(p.29)。

    由此得出结论:元数据、馆藏、信息搜寻者均已改变。这对图书馆的元数据传统与实践意味着什么(p.30)?图书馆元数据面临的挑战:搜索引擎篡夺图书馆目录?Google图书篡夺图书馆目录?如果图书馆不改变,如何支持其馆藏的发现与传递?(p.31)

    共64页PPT,接下来基本上是OCLC广告时间。
    本博曾为OCLC做过不少广告,可参见,不再重复。

Via Metalogue: OUR Space: The New World of Metadata
PPT浏览/下载:OUR Space: the new world of metadata / Karen Calhoun. IFLA, 13 August 2008     

关于OCLC产品参见:
Our Space──OCLC总裁在上海图书馆的报告 (2008-6-16)
OCLC的新一代编目产品 (2008-06-23)
网络级编目/Web范围编目(Network Level/Web-Scale Cataloging) (2008-01-31)

关于Karen Calhoun参见:
最新研究报告:改变目录性质、与其他发现工具集成 (2006-4-11)
美国国会图书馆正在发生什么――要数字资源还是实体资源?(2006-07-24)
OCLC的新副总裁:Karen Calhoun (2007-03-27)

图书馆在信息社会中的成功故事

    IFLA的“图书馆成功故事”数据库版本升级(IFLA Libraries Success Stories Database)。旧版应该在这里:LIBRARIES SUCCESS STORIES DATABASE。新版可以联机提交本馆的成功故事(2.0方式不可阻挡),限英、法、西、德四种语言(作为工作语言的汉语?),翻译小组于将于2008下半年将翻译。提交需在线注册,审核后发布。
    这是IFLA为落实信息社会世界首脑会议(WSIS)的原则声明和行动计划,保持图书馆的长期存在而汇集的图书馆成功案例,作为展示图书馆社会价值的橱窗。

    可以从不同角度选择检索图书馆的成就与项目。虽然目前只有132项,但假以时日,绝对会是个寻找素材的宝库:

六个方面(首页只显示五个):
    * Libraries as access point(图书馆作为接入点)
    * Libraries for cultural heritage(图书馆对于文化遗存)
    * Libraires for continuing education(图书馆用于继续教育)
    * Libraries as e-learning centres(图书馆作为E学习中心,e原用术语ICT)
    * Libraries for cultural diversity(图书馆对于文化多样性,首页说明无此项)
    * Libraries for specific needs(图书馆对于特定需求)
领域:包括各类型图书馆、图书馆各项工作……
目标人群:不同的读者对象
各洲
国家
WSIS行动方面(Action Lines)(译文取自《信息社会世界峰会执行秘书处关于信息社会世界峰会清点工作的报告》(PDF))
    * 各国政府和所有利益相关方在信息通信技术促发展方面的作用(C1)
    * 信息通信基础设施:信息社会的根基(C2)
    * 信息和知识的获取(C3)
    * 能力建设(C4)
    * 树立对使用信息通信技术的信心并确保安全(C5)
    * 有利的环境(C6)<有利环境>
    * 信息通信技术应用:体现在生活方方面面的益处(C7)
    * 文化多样性和特征、语言多样性和本地内容(C8)
    * 媒体(C9)
    * 信息社会的道德内涵(C10)
    * 国际和区域性合作(C11)
    
    根据2006年3月27日联合国大会第74次全体会议对于WSIS的决议(PDF),“在2015 年对首脑会议成果的实施情况进行一次全面审查”。在这之前,IFLA一定会想办法弄到足够的故事。
    目前中国的“百万图书项目”在列,还有很大的潜力呢。向中国图书馆学会建议多提交些我们的“成功故事”?

Via: [IFLA-L] Multilingual IFLA success stories database / Danielle Mincio

参见:IFLA的WSIS网页
    汇集IFLA与WSIS相关的文件,如指导文件:“图书馆与WSIS行动方面”(Libraries and the WSIS Action Lines):Guideline for international, regional and local advocacy for libraries in relation with implentation of the WSIS by Action Line 2005-2015(现有俄译本)
    相关文件内容丰富,研究数字鸿沟数字记忆信息素养information commons(不是物理的“信息共享空间”)……推荐一看。

相关:本数据库应该曾是国际电信联盟(ITU)的“信息与电信技术成功故事”的图书馆部分:
ITU的ICT Success Stories:看信息与通信技术如何用于跨越全球数字鸿沟。
可按论题浏览;可通过表单在线提交。

IFLA的“数字对象元数据工作组”

    为应对日益增加的数字出版物的编目工作,国际图联编目组在2005年成立了“数字文本文献书目标准工作组”(Working Group on a Bibliographic Standard for Digital Text Documents),2006年该工作组改名“数字文本文献书目建议工作组”(Working Group on Bibliographic Recommendations for Digital Text Documents),2007年再次改为“数字对象元数据工作组”(Working Group on Metadata for Digital Objects)。工作组计划在2008年IFLA加拿大魁北克年会前提交最终报告,作为编目指导委员会在年会上的一项活动。
    名称的不断更改,体现着工作组应对形势变化而对工作目标的改变:1、从文本型数字对象扩大到任意数字对象;2,从狭义的书目扩大到广义的元数据(也从图书馆扩大到了更广阔的领域);3、从强势的标准转为较温和的建议、指南。真是一年一个样,三年大变样。

工作组主要任务(Charge)
    为需要创建、共享与管理元数据者推荐一份指南,包括元素、工具、格式、协议。
基于以下原则开展工作:该指南是高层次的指南,意即[方括号后为本人理解]:
* 应当作为语义映射的轴心(a pivot for semantic mapping),也即作为一部数据元素词典,不同的社区可以映射他们自己的书目数据集
* 应当作为关于如何在文本文件中处理书目数据的指南[应当是纯文本数据]
* 不应当预设任何特定的标记系统[MARC也罢、XML也罢],但
* 应当作为一个针对可能采用的不同标记系统的模型,并且
* 应当适用于最通用的文本编辑程序
* 应当定义一个属性集,包括如语言、字体、大写规则等(language, script, capitalisation practice)[?],以方便进一步处理

    小组已经召开了三次会议,但没有关于这份指南的更详细信息,可能要到2008年3月第四次会议以后,才能看到草案。

    目前小组成员均来自欧洲:丹麦(主席)、法国、瑞典、荷兰、挪威。2006年时还有一位代表IT组的中国人(张智雄),据称由于未提出任何建议而不再作为成员。

参见:
IFLA. Cataloguing Section. Working Group on Metadata for Digital Objects

第一次会议:2006/8/23,韩国首尔第72届IFLA年会期间(会议报告
第二次会议:2007/2,丹麦哥本哈根(?)
第三次会议:2007/8,南非德班第73届IFLA年会期间(会议报告
第四次会议:2008/3/17-19,法国巴黎