LC提供2500万书目记录免费批下载(附LC在Library.Link)

2017年5月,美国国会图书馆(LC)宣布免费提供2500万条书目记录批下载。时间段为1968-2014年,应该就是2014年前LC制作的所有MARC记录。很多年前LC的书目记录就可以通过Z39.50逐条获取,但批量数据以前是付费订购的。虽说“主要供研究与开发利用”(MARC Open-Access),但因为并未限制使用目的,估计很多书目服务商听到消息第一时间就去下载备用了。
根据LC网站的 MARC Distribution Services (data set) 网页上的FAQ说明,本次免费提供的数据截止到2013年12月,以后可能每年更新。订购数据则更及时,目前截止2015年12月底,同时提供每日、每周更新。
开放MARC数据的目的是希望书目数据得到原有目的之外的、更广泛的利用。LC采访与书目访问部主任Beacher Wiggins在报道中说:“为了更有效的信息分享、更方便可视化与其他不可预知的分析,我们希望社会科学家、数据分析师、开发者、统计学者及其他人在工作中使用数据,对大数据集做创新工作,强化新知识的学习与生成”。
via Fortune: The Library of Congress Just Made 25 Million Records Available for Free (2017-5-17)

——— Library.Link中的LC书目数据 ———
今天看到Library.Link中,对LC书目记录经关联数据转换后发布。LC宣布开放数据是2017-5-17,数据被载入Library.Link是2017-6-12,发布是2017-6-15,可谓反应迅速。不知道是不是最早的公开发布应用。
关于Library.Link,参见:2016 ALA年会BIBFRAME更新论坛(2016-8-27)

LOC.Library.Link
LC像其他加入Library.Link的图书馆一样,有一个主页。如果有帐号,可以看访问统计。
右栏是“资源”,即由MARC记录转化后的Bibfra.me类(共16个)及数量,字顺排列:
Agent 2338223
Collection 667912 (由相关题名字段转换而来?)
Concept 6546780
CopyrightEvent 564
Family 25860
Form 9336
Instance 12898932
Meeting 228118
Organization 1200225
Person 4891149
Place 634135
ProviderEvent 6005730
Series 958273
Temporal 8906
Topic 303503
Work 13649505

每次在新形态下看发布的书目数据,总不免看到一些原本埋没着不知道的原始数据错误,如以前看分面OPAC,现在看关联数据。选择“个人”随意浏览,本当为人名,但排序在前几页的都是非字母开头的(标点符号、数字),有些可能是非拉丁字母转化的字符问题,还有相当部分应该是原始数据有问题。
比如有个”16 juli 1993″,根据题名返回到LC目录查原记录,LCCN=94124897(https://lccn.loc.gov/94124897),果然有:
7001_ |a “16 juli 1993.”
本书1993年出版,可能把500误作700了。

接下来还有不少以冠词A起始的,很有意思,比如:A 1st class boy, A British officer, A Californian, A lady of this city …
比如:A lady of this city
LC目录中查到原记录LCCN=16009701(https://lccn.loc.gov/16009701)
245 04 $a The life of the beautiful and accomplished danseuse, Mademoiselle Fanny … $c … Selected and comp. by a lady of this city.
700 0# $a A lady of this city.
原来还有这样直接用题名页上称呼做个人名称检索点。

D-Lib Magazine停刊:一个时代的终结

D-Lib Magazine最新期 July/August2017(v.23, no.7/8)发表编者按:The End of an Era,宣布本期(第265期)后停止正常出版。
D-Lib可说是本学科最有影响力的开放获取电子期刊。创刊于距今整整22年的1995年7月,在当年无疑是激进之举。准月刊(有时双月合刊),定期在网上发布,累计发表文章过千(不包括短文)。
对于停刊,编者Laurence Lannom说明的理由有三:财务支持减弱,高质投稿量文章减少,“数字图书馆”一词从听着是创新到变得有点多余。因而“是时候功成身退了”。最后一个理由恐怕在前几年就已经日益明显。

听到D-Lib停刊,我的第一个反应是,那些文章怎么办?编者按称,在可预见的将来,主办机构CNRI(Corporation for National Research Initiatives)仍将维持整个D-Lib档案在线(也就是说不会影响其访问与引用),也欢迎长期存档的建议。
D-Lib目前还有4个全内容镜像站点,分别在澳大利亚国立大学,德国下萨克森州立图书馆和格廷根大学图书馆,台湾中央研究院,葡萄牙国家图书馆(ABOUT D-LIB MAGAZINE),但愿也能保留。

——— 那些D-Lib上的文章 ———
不同人会有不同的印象深刻的D-Lib文章,我的几篇围绕RDA:
尤记RDA编制过程中,2007年初Karen Coyle, Diane Hillmann发表的那篇语出惊人的“20世纪的编目规则”(Resource Description and Access (RDA): Cataloging Rules for the 20th Century)。文章不仅影响到RDA,也影响到整个图书馆界的关联数据应用。
同期(v.13, no.1/2 (Jan/Feb 2007))还有现任RSC主席Gordon Dunsire介绍RDA/ONIX框架的文章(Distinguishing Content from Carrier: The RDA/ONIX Framework for Resource Categorization)。
当RDA尘埃落定后,几位作者(Diane Hillmann, Karen Coyle, Jon Phipps, Gordon Dunsire)又在2010年1/2月合期发表了宣传RDA词表的文章(RDA Vocabularies: Process, Outcome, Use)。与RDA作为编目规则关系不大,继续的是其关联数据应用。

最后看下1995年第1卷第1期,有3篇文章。第1篇是OCLC的Stuart Weibel介绍都柏林核心元数据的文章:Metadata: the foundations of resource description ,这是第1届DC会议(DC1: OCLC/NCSA Metadata Workshop)报告概要。如今,DC/DCTerms名列被用最多的关联数据用词表。

时间飞逝,“数字图书馆”时代终结了?

谷歌学术计量2017版发布(附图情档中文期刊排名)

谷歌学术计量(Google Scholar Metrics)近期发布2017版,基于谷歌学术2017年6月收录论文,提供期刊在2012-2016年的h5计量排名,即最近5年该刊有h5篇文章被引大于等于h5次,h5指数相同的,按h5中位数排序。5年间发文量少于100篇的期刊不在统计之列。
排名包括总排名(前100期刊)和分类排名(前20期刊),分类排名有8个大类:商业、经济和管理;化学和材料科学;工程和计算机科学;健康和医学;人文、文学和艺术;生命科学和地球科学;物理和数学;社会科学。大类下还有众多细分子类
总排名还有分语种的,目前有12种语言,依次是:英语、汉语、葡萄牙语、西班牙语、德语、俄语、法语、日语、韩语、波兰语、乌克兰语,印尼语。不知道是否与这些国家更热衷期刊排名有关。
点击入榜期刊的h5指数值,可以看到该刊被引次数大于h5值的文章列表;文章列表有其被引次数,点击被引次数,又可看到引用文章列表

总排名(h5指数):Nature 366第1,新英格兰医学杂志352第2,Science 320第3,第4-100名h5值在111-273之间。
汉语总排名:经济研究47第1,中国电机工程学报44第2,中国社会科学39第3。
图情档学科有4种入围前100名:图书情报工作28第37、中国图书馆学报28第38、大学图书馆学报25第61、图书馆学研究25第66。令人意想不到的是第4种《图书馆学研究》,与《大学图书馆学报》h5指数相同,只是h5中位数低而排名略后。

谷歌学术计量的主要意图,是为作者提供简易途径,快速估计学术出版物中近期论文的可见性与影响力,帮助了解到何处发表其新研究。因此除提供前述排名名,还支持通过题名关键词检索,定制更多不同语言的排名。(Google Scholar Metrics
对研究者来说,可通过此法了解感兴趣主题的期刊排名。采用关键词法,分别检索“图书”“情报”和“档案”,拼合出了图情档领域中文期刊排名如下(h5>=10):

排序 刊名 h5指数 h5中位数
1. 图书情报工作 28 43
2. 中国图书馆学报 28 37
3. 大学图书馆学报 25 40
4. 图书馆学研究 25 33
5. 图书与情报 22 32
6. 情报资料工作 21 34
7. 图书馆论坛 21 27
8. 图书馆杂志 20 42
9. 图书馆建设 20 26
10. 情报杂志 19 22
11. 现代情报 18 32
12. 图书馆工作与研究 18 24
13. 图书馆 17 24
14. 情报科学 17 20
15. 图书情报知识 16 26
16. 国家图书馆学刊 16 25
17. 现代图书情报技术 16 25
18. 情报理论与实践 16 22
19. 档案学通讯 15 18
20. 图书馆理论与实践 14 19
21. 新世纪图书馆 14 19
22. 情报学报 14 17
23. 图书馆学刊 14 17
24. 中国档案 14 16
25. 中华医学图书情报杂志 13 15
26. 高校图书馆工作 12 17
27. 图书馆研究 12 14
28. 农业图书情报学刊 11 17
29. 档案学研究 11 14
30. 地质科技情报 11 14
31. 大学图书情报学刊 10 12
32. 情报探索 10 12
33. 科技情报开发与经济 10 12
34. 档案管理 10 10

via Google Scholar Blog: 2017 Scholar Metrics Released (July 5, 2017) (以上均有墙不语)