密歇根大学图书馆拥有近300个数字馆藏,很好奇如此多的馆藏是如何建立的。
University of Michigan Library – Digital Collections
仔细看该馆数字内容和馆藏部(Digital Content & Collections, DCC)网站,该部下设有数字转换组(Digital Conversion Unit, DCU),专门从事数字化工作,由用户提出需求、图书馆操作(具体实施时数字化工作可能外包):
其一,请求数字化本馆图书。此按需数字化服务免费,之前是作为馆际互借文献传递工作的一部分,现在相当于由读者代替馆员选择需要数字化的图书,完成后放在HathiTrust中提供服务(HathiTrust源自谷歌图书项目)。
其二,要求建立一个在线馆藏。读者提出项目建议、提供资料(已数字化或有待数字化),图书馆审核后实施并上线。
想来数百个数字馆藏,会有一定比例来自教学科研人员吧。
在《TEI图书馆最佳实践》第4版中,5级编码中第1-3级样例都是密歇根大学图书馆的数字馆藏(第3版第1-2级),当然都是2011年以前的。
1级项目:Making of America Books (MoA)
含约1万种19世纪出版物,由安德鲁 W 梅隆基金资助(密歇根大学和康奈尔大学)。2007年在某校友资助下数字转换了百余种有关纽约的文献【看清单不少是20世纪的】。
样例:Baby world: stories, rhymes, and pictures for little folks
在常见问题中提到TEI:简单的SGML形式(40个符合TEI指南的元素)。部分是经验证的HTML文本,部分仍是原始图像,因为这部分OCR尚未验证,由该馆人文文本创始计划(Humanities Text Initiative)承担校对和改进标记。
2级项目:SPO Scholarly Monograph Series
SPO学术专着系列是由密歇根大学图书馆的前学术出版办公室(现为密歇根出版社的一部分)于2001年至2006年出版的跨学科的原创开放获取学术专着和论文集。在此期间,密歇根大学教师和图书馆成员共同探索新的出版模式和方法。 这些电子书是这种合作的一些成就。【从目次看,电子书格式同印刷版,应该是以TEI对目次及文前、文后进行了描述】
样例:Sports Culture Among Undergraduates: A Study of Student Athletes and Students at the University of Michigan
3级项目:Travels in Southeastern Europe(2004年)
从4种早年的波黑旅行出版物开始,根据扫描和审核四4个原始文本时收集的信息,另外扫描了本馆100多个其他品种,完成本项目。有目次(区分文前、章节、文后);但OCR未更正、不可替代图像(根据View entire text说明)。
样例:Bosnie et Herzégovine : souvenirs de voyage pendant l’insurrection
参见:《TEI图书馆最佳实践》第4版发布(附5级编码详解)(2018-10-6)