BIBFRAME2.0词表更新、相关组件公布

2016年4月,LC发布了BIBFRAME 2.0词表(bf2)(BIBFRAME词表2.0发布,2016-4-23)。此后,为准备进行BIBFRAME第2阶段试验,LC一直在为录入bf2格式的数据而努力。过了差不多一年,LC在本月发布了BIBFRAME 2.0相关组件,分享内容包括:1、更新的词表,2、MARC到BIBFRAME转换规范,3、MARC到BIBFRAME转换程序(BIBFRAME Vocabulary updated, MARC to BIBFRAME conversion specifications and programs released, March 10, 2017))。消息发布在BIBFRAME邮件组:
BIBFRAME specifications and conversion programs made available / McCallum, Sally (13 Mar 2017)

摘译如下:
LC正把整个书目数据文档转换到BIBFRAME,由MARC书目记录转换为BIBFRAME作品和实例描述,并与由MARC规范中的题名和名称/题名规范记录转换而来的作品描述集成。此次发布的组件即由上述工作形成,供大家使用BIBFRAME2.0词表实施开发,或者调查关联数据环境。

– BIBFRAME 2.0 词表更新:包括增加、改变、删除。
另外,在bf:之外新增命名空间bflc:,收录BIBFRAME的LC扩展,有些是为MARC转换而临时设置【类6个、属性9+20个】
先前版本:https://github.com/lcnetdev/bibframe-ontology
当前版本:http://www.loc.gov/bibframe/docs/
【在当前版本的清单页面,各元素的Change Notes注明变化情况:包括New新增、修改revise/fix等,其中2017年新增或修改37个
删除类2个:WorkTitle、InstanceTitle,删除属性3个:barcode、otherEditionOf、contributor,不以元素区分创作者、贡献者

MARC到BIBFRAME2.0规范MARC 21 to BIBFRAME 2.0 Conversion Specifications
共有依MARC字段块划分的20个转换对照表及说明文件,为所有MARC字段、指示符、子字段到bf2元素的对照,分别映射到I实例、W作品和Item单件。少数未使用的元素标记为“nac”(不尝试转换),在MARC环境外无意义的标记为“ignore”。

MARC到BIBFRAME转换程序
Index Data公司为LC编制。用XSLT写成,由MARCXML转换为BIBFRAME2.0
LC目前用这些转换程序开发试验项目,期望随工作进展加以调整。LC的Github页有详细使用说明。

即将提供的其他BIBFRAME工具:能够看BIBFRAME描述的工具
LC使用Index Data的Metaproxy工具,配合其图书馆自动化系统Voyager的OPAC,实现使用Z39.50或SRU搜索,搜索结果可以MARC、MODS、马上会有BIBFRAME2.0获取。其他工具将在完成后宣布。
BIBFRAME Implementation, Tools, and Downloads页面目前标记着3个coming soon:MARC到BIBFRAME比较观看器BIBFRAME2.0编辑器BIBFRAME演示数据集/BIBFRAME样例】

McGraw-Hill教育白皮书:图书馆作用正在改变

麦格劳希尔教育公司在2016年7-8月间对近千名图书馆员和以教师为主的图书馆用户进行了一项调查,形成白皮书《图书馆作用正在改变》(8页)。调查结果显示了馆员和教师对图书馆认识上的一些差异,比如尽管“获取信息”的需求都占首位,但教师表明的需求2倍与馆员的认识。可惜白皮书没有附原始调查问卷,有些“发现”也没有提供数据依据。
除数据可供参考外,最后的结论也很有意思(原文后附)。换一种说法是这样的:参加调查的馆员们抱怨一再被要求自证价值, 表明决策者和用户对馆员价值的认知与馆员本身的认知不一致,图书馆需要能为决策者和用户接受的绩效测度,才能得到更多资源。想起来有时会看到本馆图书馆发布的绩效测评结果,不免有自说自话的嫌疑,正是这种现状的体现。
本白皮书在填写个人相关信息后可免费下载。摘译附后【方括号中为本人认识/推测】。

The Changing Role of Libraries

执行摘要:先前研究【Library Philosophy and Practice 2010】表明图书馆和教师需要更加合作,相比之下,麦格劳希尔教育对约1000人所作的新调查表明,图书馆-教师关系是强大的。但是,在教师感受到的图书馆作用,与图书馆利用统计所示两者之间【应该出自问卷,所以是馆员认识而非利用统计,尽管馆员认识很可能出自利用统计】,存在分离现象。在感受到的价值与实际利用中的不符是个实际问题:在什么令图书馆最有用上不一致,因此在其成功应当如何测量、预算应当如何分配上不一致

主要发现
教师和馆员的分歧没有先前报告的那么大
– 中小学图书馆比高校图书馆更少得到来自所属机构的帮助
– 某些教师和学生对无法获取实体资料和媒体感到灰心
– 无法访问数据库导致教师较少利用
馆员和教师在重视哪些图书馆服务上存在差异
– 中小学强调获取技术4倍于高校
– 缺少员工是馆员主要关心的
– 预算问题最受关注
– 增加员工不在馆员愿望单之首
教师所认为的图书馆目的与馆员报告的最通常请求之间存在矛盾
教师感觉到的参考请求2倍于馆员指出的【馆员感觉到的是参考咨询请求量不断下降?】
馆员评估的获取资料请求比教师高28%【馆员接收到的馆际互借/文献传递量不少?】
馆员排序技术请求2倍于教师【馆员认为提供更多技术帮助?】
馆员报告的对活动的兴趣2倍于教师【馆员对举办program兴趣更大?或者活动更多针对学生,教师较少参与?】
【另外,从下面的数据看,教师对空间的需求远大于馆员所估计】

结论
馆员们在评论中一致指出,感觉需要一再证明其价值。此问题实际上可能是决策者和用户不认同馆员的价值所在。由于图书馆在教育中的作用改变迅速,如此应该并不奇怪——难以取悦所有各方。不过,没有对绩效测度的支持和认同,图书馆将继续为获取更多资源而努力。

关于本研究
本研究有996位参与者,大致含400位馆员,450位教师,150位“其他人”(学生、教辅、管理者),调查时间从2016.7.19到8.10。参与者单位:
45.83% 高教
14.93% 医学院、教学医院等
24.51% 中小学
7.31% 公共图书馆
0.31% 专业图书馆
7.11% 其他

——— 调查结果 ———
【来自全部5个图表/正文,按百分比高低重新排列】

– 图书馆实现的最大需求
教师:
获取信息 88% (2倍于馆员)
研究空间 27%(比馆员高76%)【排序明显高】
服务与支持 25%
获取技术 19.5%
研究机会 11%
无 4%

馆员:
获取信息 43%
获取技术 34% (比教师高74%)【排序明显高】
支持与服务 27%
研究空间 15%
研究机会 10%
无 约1%

– 如何花费增加预算【量值有差别,排名近似】
教师
增加资源 51%(比馆员高73%)
技术 14%
交由馆员决定 13%
空间 11%
员工 7%
服务 1.2%

馆员
资源 29%
技术 24%(比教师高74%)
空间 15%
员工 14.6%(比教师高73%)
家具 10%
维护 约2%
服务 约1%

– 图书馆的最大关注问题(所有参与者)
预算 47%
空间 约13%
缺少员工 约11%
缺少利用 约8%
不确定 约7%
服务社群 约5%
缺少技术 约4%
来自管理与教辅的支持 约3%

TextExt:DBpedia开放文本抽取挑战赛

TextExt – DBpedia Open Extraction Challenge

DBPedia日前宣布举办持续性的开放文本抽取挑战赛,目的在于解决从维基百科文章文本(而非信息盒)中抽取三元组问题,并进而使相关技术普遍化,以及开发更细粒度的质量测度与准则,帮助判断是否信任这些数据。摘译网站信息如下:

背景
DBPedia和Wikidata目前主要专注于表达维基百科信息盒(infobox)中包含的事实知识。但是,大量信息包含在非结构化的维基百科文章文本中。通过“DBpedia开放文本抽取挑战赛”,我们旨在促进由维基百科文章文本的知识抽取,以显著扩大和深化结构化DBpeida/维基百科数据的数量,并为评估不同抽取工具提供一个基准平台。

使命
维基百科已经成为无处不在的世界知识来源,使人类能够查找定义、快速熟悉新论题、研读新闻事件的背景信息……。DBpedia的总使命是收割维基百科的知识,加以提炼与结构化,然后为IT用户和业界,以自由和开放的方式在网络传播

方法
“DBpedia开放文本抽取挑战赛”与语言技术和其他领域的其他挑战赛有很大不同,它不同一次性的,而是持续增长和扩大的,关注*可持续地*推动现状,超越*系统化*方法的边界。DBPedia协会及本次挑战赛主办者承诺提供必要的基础设施,无限期地推动本挑战赛,同时有可能扩展该挑战赛到维基百科以外。

我们定期提供由9种不同语言的维基百科文章抽取并清洗过的全文文本供下载,并作为机读NIF-RDF格式的Docker。要求挑战赛选手以Docker images容纳其NLP(自然语言处理)及抽取引擎,然后提交给我们。我们将定期运行参赛者工具以抽取:
1、事实、关系、事件、术语、本体为RDF三元组(三元组追踪)
2、有用的NLP注释,如位置标记、依赖关系、共同参照(注释追踪)

【每年举办多次会议】允许在所选会议前2个月前提交。实施技术要求、提供充分描述的参赛者将能出席会议,并加入年度会议录。每次会议,挑战赛委员会将在参赛者中选择一位获胜者,可得1000欧元。

成果
每年12月,我们将发布参赛者提交的文章摘要和会议录。首个会议录计划在2017年12月发布。

对参赛者的要求
三元组Track(知识抽取)
提交的主要目标是N-Triples格式的一个或多个文档,内容为由维基百科文章文本抽取的事实。三元组将按以下准则评介:
– 抽取数据的数量
– 抽取数据的质量(正确性,适用性,一致性和简洁性)
– 抽取类型:除了事实,也希望术语和词典、本体知识(新类型、分类法、格言/原理、定义域/值域)
语言多样性:抽取自多种语言
– 能够在所要求的NIF格式中保持适当的出处

文章指引
附4-10页文章……不要求方法原创,作者只顺专注于简洁、独立描述再现结果的所有必须信息。尽管强烈鼓励所用工具或系统是免费、公开可访问的,但这不是必要条件。