《国际图联期刊》:隐私专辑(附抄录汉译摘要)

《国际图联期刊》(IFLA Journal)最新一期发布:隐私专辑。
想随便浏览下,无意中发现竟然有IFLA官方语言的摘要(阿拉伯语、汉语、法语、德语、俄语、西班牙语),大大方便了浏览。往前回溯,实际上多语种摘要从2010就开始有了,阿拉伯语和汉语摘要则从2012年开始。只是本刊对摘要格式没有要求,现有摘要大多是指示性而非报道性的,不能部分取代阅读全文。
抄录本期汉译摘要附后【增加若干题名外的关键词】。比较有意思的是本专辑最后那篇文章的结论:隐私保护注定要失败,我们应该停止从道德的角度进行保护隐私的尝试。

via IFLA News: Out Now: October 2018 issue of IFLA Journal (3 October 2018)

—— IFLA Journal, Vol.44, No.3 (October 2018) Special Issue on Privacy ——
Privacy awareness issues in user data collection by digital libraries / Elaine Parra Affonso, Ricardo César Gonçalves Sant’Ana
数字图书馆采集用户数据中的隐私问题 【附加关键词:南美,巴西】
该研究的目标是探究南美各国的国家数字图书馆在数据收集中与隐私相关的问题,所采用的研究方法是基于数字图书馆的探索性研究,以此来识别所收集的与用户意识和隐私政策的清晰呈现相关的数据。我们也使用了Wireshark软件来研究巴西国家图书馆收集的数据。我们发现,南美只有两个数字图书馆会提供隐私保护指导。关于数据的收集,在用户未知的情况下收集的数据和在用户清楚知道的情况下所收集数据形成对比。最后我们得出结论,隐私问题会受到用户对何时、怎样以及在哪收集数据的意识较低影响,这让隐私政策在数字图书馆中成为必需,以此来提高对数据收集这一过程的意识。

Delisting and ethics in the library: Anticipating the future of librarianship in a world that forgets / Katie Chamberlain Kritikos
图书馆的数据撤销和职业道德:期待在一个遗忘的世界中图书馆事业的未来【附加关键词:被遗忘权(RTBF),信息过滤,内容监控,言论自由,法律和政策】
【传】统的图书馆员职业道德保护个人隐私并且促进信息获取。被遗忘权(RTBF)和数据撤销有可能会创造一个新的网络信息生态系统,来打破旧的图书馆员道德标准并且重新定义图书馆员的角色。被遗忘权和数据撤销,还有互联网信息过滤,都是即将转变为内容监控和网络信息获取的先兆。图书馆员现在开始应当接受被遗忘权和数据撤销,为将来可能出现的图书馆信息流动中断,以及世界范围的与信息相关的政策法规的改变做准备。这篇文章阐述了与数据撤销相关的法律和道德问题,为数据撤销的国际对话奠定了基础,并且指出了未来对相关问题研究的需要。针对被遗忘权和数据撤销的相关问题,国际图书馆界需要进行一次更大规模的讨论,尤其是关于言论自由和隐私的相关法律和政策的讨论。

Encouraging patron adoption of privacyprotection technologies: Challenges for public libraries / Monica G. Maceli
鼓励读者使用隐私保护技术:公共图书馆的挑战【附加关键词:美国】
读者隐私所受到的威胁一直以来都是图书馆的担忧,而且我们所能尽到的责任也很大程度上被图书馆的物理空间所限。如今,随着新技术的发展,情况也变得完全不同,读者的隐私反而受到更多快速增长的事物的威胁。在这种复杂的情况下,图书馆继续致力于隐私保护,现在公共图书馆也尝试教育读者隐私威胁、隐私保护措施,和他们能使用的一些工具。这篇文献综述力图识别美国公共图书馆在教育和推动读者使用隐私保护技术工具中所面临的挑战,从其它相关学科的研究中吸取借鉴,并启发未来的研究方向。我们发现的问题包括:读者、图书馆管理员和图书馆员工在技术相关方面潜在的知识差距;支持使用大量技术工具和技能的需求;以及加深我们对这些工具潜在创造者视角的理解。

Information disclosure and privacy behaviours regarding employer surveillance of SNS / Deirdre McGuinness, Anoush Simon
关于社交网站用户监控的信息泄露和隐私行为【附加关键词:威尔士,大学生】
这篇文章研究了一所威尔士大学中学生群体使用社交网站(SNSs)的情况,其中特别关注了信息共享和隐私行为,以及社交网站的用户监控对他们未来使用这些网站的潜在影响。该研究采用了定量和定性方法相结合的混合研究方法来对上述议题进行探究。研究结果显示,参与者对在网络上的隐私保护表示担忧,并且对在社交网络上发帖和保护个人信息都十分注意;但是通常由于人为失误及系统错误,保护措施仍存在缺陷。绝大多数的参与者都知道社交网站的监控,很多人也指出这会对他们未来的使用产生影响,但是社交网站用户会综合使用网站隐私设置和按情况分等级的发布信息等方法来积极保护他们的隐私。

Privacy and libraries in the case of Japan / Yasuyo Inoue 井上安代
以日本为例的图书馆与隐私研究
这篇论文从东亚国家日本的角度来介绍隐私的概念。首先,该文就整个国家是如何看待隐私的,进行了背景信息介绍,然后讨论了日本隐私保护的相关法律途径。接着文章探讨了与图书馆相关的隐私问题,介绍了两个案例研究。最后得出结论,为日本未来发展提出建议。

Privacy, obfuscation, and propertization / Tony Doyle
隐私、模糊化和财产化【附加关键词:大数据】
伴随着数字化时代的余波,大数据已经准备好取而代之,将其数据分析用于对我们个人性格、偏好和未来行为的推断中,这让我们紧张不安。这篇文章阐述了大数据给隐私带来的挑战。我探析了两种可能是最有希望对抗大数据对个人隐私冲击的尝试,即个人信息的模糊化和财产化。模糊化是采用迷惑或者误导的方式,在数字化的过程中摆脱数据收集方。财产化则是将个人信息视为一种知识产权,需要数据持有者在对数据的任何二次利用中给予数据主体以补偿。我在文中尽力阐明这两种抵抗的尝试都在很大程度上失败了。我从而得出结论,隐私保护注定要失败,我们应该停止从道德的角度进行保护隐私的尝试。文章的最后,我就这些在图书馆领域的影响提出几点想法。

《TEI图书馆最佳实践》第4版发布(附5级编码详解)

TEI除指南外,还有针对不同应用场景的多种专题指引,《TEI图书馆最佳实践》是其中之一,用于依据TEI对大规模数字化(扫描)图像进行编码。第1版发布于1999年,由数字图书馆联盟(DLF)资助的TEI工作组(TEI Task Force)制订,第3版起由TEI联盟旗下的TEI图书馆特殊兴趣小组(TEI SIG on Libraries)承担修订职责。
上月《TEI图书馆最佳实践》发布4.0版,加了一个副标题或说明语:大规模数字化、自动化工作流程以及促进使用TEI的XML互操作的指南。
Best Practices for TEI in Libraries: A guide for mass digitization, automated workflows, and promotion of interoperability with XML using the TEI
Editors: Kevin Hawkins, Michelle Dalmau, Elli Mylonas, and Syd Bauman
Version: 4.0.0 (published September 2018)

本最佳实践最初为在基于图书馆的大型数字化项目中使用TEI而创建,作为一种从整体上达成数字化和编码的方式。由于不同的文本数字化项目目的各异,本最佳实践设置了5个编码级别以尽可能包容不同需求。5个级别有各自的编码样例,图书馆数字化项目实例链接,建议使用的元素和属性(并且不建议使用其他),适用项目,工作流程等。以下摘录第4版的5级编码目的、样例和工作流程【组成为个人理解概括】。

——— 5级编码:目的、样例、工作流程 ———
Level 1: Fully Automated Conversion and Encoding 全自动化转换与编码
目的:创建电子文本的主要目的是搜索关键字并链接到页面图像。在这种非常严格限制的编码级别使用TEI的主要优点是TEI标头附加到文本文件。【组成:标头/书目信息+扫描图像+未经审核OCR+页码标记】
样例:密歇根大学Making of America Books (MoA)
工作流程:可通过全自动方式创建和编码1级文本。使用OCR扫描和处理页面图像,但文本通常未经校正(“脏OCR”),并且从OCR输出生成XML。如果需要,可以通过标记各个页面元素来增强这种自动输出,以指示关键文本特征,例如题名页、文前内容或新章节的开始。

Level 2: Minimal Encoding 最小编码
目的:创建用于全文搜索的电子文本,链接到页面图像,以及识别简单的结构层次结构以改进导航(例如,可以根据此类编码自动生成目次)。【组成:标头/书目信息+扫描图像+未经审核OCR+章节标记/目次】
样例:密歇根大学Scholarly Mongraph Series (SPO)
工作流程:通常可以通过自动化手段创建和编码2级。分页在级别1中标识,并且可能基于页面图像创建文本分区的元数据。文本划分元数据可能包含划分开始的页码和该划分标题的转录。此元数据在适当的位置插入OCR,形成有效的XML文档。2级文本在章节级别下不需要任何特殊知识或人工干预。

Level 3: Simple Analysis 简单分析
目的:创建独立的电子文本并识别层次结构(逻辑结构)和排版,而无需内容分析是最重要的【组成:标头/书目信息+经审核OCR+文本结构标记(文前文后、排版样式),页面图像可选】
样例(第3版):印第安那大学Victorian Women Writers Project(VWWP)
样例(第4版):密歇根大学Travels in Southeastern Europe
工作流程:可通过电子来源(如HTML文件或文字处理文档)或印刷来源(通过OCR或键盘输入)进行半自动转换来创建;可能需要一些人为干预。

Level 4: Basic Content Analysis 基本内容分析
目的:要创建可以单独作为电子文本的文本,识别层次结构和排版,指定文本和结构元素的功能,并描述内容的性质而不仅仅是其外观。但是此级别无意编码或识别文本的所有结构、语义或书目功能。【组成:标头/书目信息+全文文本+文本内容标记】
样例(第3版):北卡罗来纳大学教堂山分校Oral Histories of the American South
样例(第4版):印第安那大学Victorian Women Writers Project
工作流程:文本通过录入生成(可能是外包的使用TEI Tite从页面图像中双录入),或者可能是使用识别拼写错误的软件更正OCR文本,或者从OCR软件查询日志以找到OCR文本中的不确定区域。如果从TEI Tite转换,应添加最少的额外标记,如TEI Tite附录A中所述。[附录A:TEI Tite与TEI图书馆最佳实践。TEI Tite介于3级与4级之间]

Level 5: Scholarly Encoding Projects 学术编码项目
5级文本是需要具有学科知识的编码者进行大量人为干预的文本。 这些文本可能包括语义、语言、韵律或其他特征的编码,远远超出上面1-4级中讨论的基本结构元素。它们还可能包括编辑、批评或分析添加的元素;手稿描述;译文;或其他文字设备。
目的:创建可能适合特定研究目的的深度分析编码文本,作为学术出版项目的一部分,或基于图书馆的文本编码中的其他编码实践。
样例:印第安那大学The Chymistry of Isaac Newton
工作流程(无)

———- 版本备记 ———
TEI官方版:1990.6 P1(首个草案),1994.5 P3版指南(首个官方版),2002.6 P4版指南,2007.11 P5版指南。
TEI图书馆最佳实践版本:1999年第1版(TEI Text Encoding in Libraries: Guidelines for Best Encoding Practices),确定了沿用至今的5级编码。2005年第2版,2011年第3版改名(Best Practices for TEI in Libraries)。2015.11决定修订第3版,2017.11发布3.1版、2018.1.15公示,2018.9.10发布4.0版。
从官网看,在TEI特殊兴趣小组中,负责本文件第3、4版的图书馆特殊兴趣小组归在不活跃之列(Dormant SIGs)。而TEI本身版本在此期间(2011-1018年)并未更新,不知道为何却有兴趣更新图书馆最佳实践文件。第4版中未找到与第3版在内容上差异的说明,大致浏览也未看出太多修订内容,不知为何由3.1版一下变成了4.0版。

参见:
TEI中的书目描述及其他(2018-8-10)
TEI笔记:语音转录(2018-8-27)
TEI笔记:手写本和印刷古籍的编目(2018-8-28)
TEI笔记:数字化文本的文字转录(2018-8-30)
TEI笔记:人物、机构、地点相关信息的标识(2018-9-13)

《国际图书馆学期刊》及其他OA图书馆学期刊

《国际图书馆学期刊》(International Journal of Librarianship, IJoL,ISSN 2474-3542,开放获取(OA)期刊,由美国图书馆协会(ALA)下属华人图书馆员协会(Chinese American Librarians Association, CALA)主办。收录于DOAJ,双盲同行评审。创刊于2016年,目前已出4期:
2016, vol 1, no 1
2017, vol 2, no 1, no 2
2018, vol 3, no 1(关联开放数据专辑)
《国际……期刊》本来是很好的刊名,著名出版集团旗下也有不少这样的期刊。但受科学出版集团(Science Publishing Group)大量出版刊名高大上的垃圾OA期刊的影响,现在我看到 International Journal of … 这样的OA期刊,本能地感觉就是同类期刊:
在Science Publishing Group网站期刊表中查 International Journal of …,有143个结果(不少刊在不同学科下重复)。好在没有题名含library或librarianship的期刊。但有一些含information的,比如这种:
American Journal of Information Science and Technology,乍一看,会觉得很像美国著名的JASIST:
Journal of the Association for Information Science and Technology
在开放获取期刊目录DOAJ(https://doaj.org/)查主题为Library science的期刊,有137个结果,数量真的不少。
另外在搜索引擎查到2种未被DOAJ收录的图书馆学OA期刊,均称同行评议。非机构主办,但发文量不多,应该不属于吸金OA刊:
Journal of New Librarianship(一年2期,2016-)
此刊前不久发博文称被收入乌利希和 Freely Accessible Arts and Humanities Journals,表明已得到认可(The Journal of New Librarianship gains recognition as a refereed journal, June 29, 2018
最后的问题是:本学科在OA刊上发文的动力是什么?