MARC字段使用统计及可视化展示

MARC Usage in WorldCat(WorldCat中MARC使用)是OCLC研究部的一个项目(活动),由Roy Tennant主持,统计WorldCat中约3亿条书目记录所用MARC字段及子字段的出现频次,研究向WorldCat质量控制提供报告,结果也向美国国会图书馆的书目控制框架计划(Library of Congress Bibliographic Framework Transition Initiative)提供。
目前数据已公布在OCLC的实验网页(MARC Usage in WorldCat),可以从该项目页右侧的Try the online demo链接进入。
该网页主要是按字段列出WorldCat数据库中各字段(及部分子字段、指示符)的出现次数,有2013年1月1日、4月1日、7月1日和10月1日四个时间段。001字段应该是所有记录都有的,可以由此推知1月1日时书目记录为289,294,984条、馆藏为1,933,291,143条,10月1日时书目记录为305,793,670条,馆藏为2,063,992,259条——今年年中WorldCat实现了书目超3亿、馆藏超20亿。
可下载各字段的数据,也可在线请求未公布子字段的数据,但未见提供全部字段数据的下载。让人逐个字段下载实在比较无聊,各字段同时提供的数据图(Chart this Data)也没多大意思,但全部字段的可视化图做得很好,有按格式按字段两个图,前者从不同类型文献角度看各字段的出现次数及在其中所占比例,后者从字段角度看不同类型文献的出现次数及在其中所占比例(鼠标移到相应位置显示数值)。

All Formats: Zoomable Starburst - By Formats

All Formats: Zoomable Starburst – By Formats

 

 

 

All Formats: Zoomable Starburst - By Tags
All Formats: Zoomable Starburst – By Tags

 

 

 

 

 

 

 

 

 

via hangingtogether.org: Visualizations of MARC Usage (2013-12-2)

参见:OCLC Research to Study MARC Tag Usage in WorldCat to Determine Best Use of Data Encoded Using MARC Standard (2013-2-8)