ADLS2016会后对话

准备入行的UU同学参加了第十三届数字图书馆前沿问题高级研讨班(ADLS2016)。UU之前参加过南开大学的图书馆学实证研究培训班,这是他首次参加本行的学术性会议。UU这一年大部分时间都在一家大数据公司实习,作为乙方帮助实现甲方的各种需求,很多时候从零开始找解决方案。认真听了两天,会议结束时,UU说觉得哪里不对,主要质疑是大多数报告只有中间部分,没有前后:没有之前的需求评估,不考虑使用者(怎么用的),不考虑实施效益(有没有人要用);没有之后的获取、填充数据(以及使用?)。我力图做出解释(很多时候以关联开放数据为例),有时就只是很苍白的辩解了。

UU:不知道有没有人用,有多少人用,就开始做,不考虑效益。【作为佐证,可参见杨九龙“图书馆技术绩效评价”报告】
我的解释:图书馆的特藏很多,之所以选某些做(比如上图的家谱和盛宣怀档案),就是因为有使用需求。当然特藏总体上都是很小众的,用的人肯定不多,因此也希望项目完成可以扩大使用。
UU:图书馆是为大众服务的,应该承担社会责任,为小众服务是不公平的。
我的解释:学术图书馆和研究图书馆与公共图书馆不同,为研究人员服务正体现其社会责任。如果有效益企业会做,企业不愿意做的需要由图书馆来承担。

UU:都不知道用户会不会用、怎么用,就这么做了,感觉就是告诉领导我在做事。
我的辩解:使用者不知道图书馆资源可以这么用呀。不是说汽车没出现时没人知道自己需要汽车吗?
UU:用户需要的不是汽车,而是尽快从一个地方到另一个地方。【嗯,高铁也行】
我承认,我有时会从资源建设角度,想着图书馆可以做什么,没有考虑使用者需求。但对于数据开放,应该是另一个层面,我的解释:图书馆有大量未被揭示的暗资源,揭示然后开放出来,可以提供给其他人,根据不同需要做开发。就像政府开放数据,有人用来做犯罪地图之类,上图也开放家谱数据,做了开发应用竞赛。【参见陈涛“政府开放数据”、董行“家谱开放数据”报告】

UU:没有需求评估,不考虑使用者是不是这么用。
我的解释:设计系统时也是会考虑用户需求的。比如家谱,设计框架词表有服务一线的专家参与。
UU:报告中大都不提及这些方面,也体现出导向性问题。【提高到“导向性”层面,真得小心】
我的解释:因为这是个偏技术的会议,技术人员更关心在技术上如何实现。
UU:技术实现不是问题。
我的解释:对IT公司实现可能不是问题,对图书馆技术人员是最关注的问题。本次会议有报告提到很多中科院的实践,没有说怎么实现的,听起来就觉得不解渴。【参见张晓林“基于数据与分析驱动的知识服务”报告】
UU:这个报告没有问题呀。
我的解释:图书馆技术人员不能和IT公司比。有能力有条件的图书馆(如上图、重大等)也会做甲方提需求,委托IT公司实现。【参见夏翠娟“数字人文平台”、杨新涯“数字资源管理+门户+服务联盟”报告】

UU:很多报告都是在圈地,建立自己的标准。【知道标准“牙刷说”吗?】
我的解释:按关联数据最佳实践,确实应该复用已有词表(查LOV)。但较小的专题通常没有现成词表可用,只好在已有词表基础上扩展。【会上有“关联数据能力指标”培训,提及LOV】

UU:感觉主要关心中间这块(建词表),数据怎么填充就不管了。【如何借助计算机完成项目,是IT界最关注的问题】
我的解释:就目前来说,没有办法实现计算机自动获取,就只能靠人工。图书馆界一直以来都是人工做的(编目、标引),这部分从研究角度没什么可说的。

会议报告中可视化是个热点,甚至有“没有可视化就是耍流氓”这样的调侃。
UU(今年做了不少可视化工作):可视化是给领导汇报用的,真正的使用者需要实际数据。

UU的感受准确吗?大领导认为,可以做下实证研究。

———- 另外话题:基于核心期刊论文及被引作人才引进评估的局限性 ———
张晓林“基于数据与分析驱动的知识服务”报告中提及这种人才评估方式不靠谱,一是时滞(被引高的都是多年前论文),另一个更重要的是不能反映个人研究能力——可能在很牛的实验室、跟了一个很nice的导师。作为高端人才引进,在原来的研究做完后,就再也出不了成果了。
没想到这个观点今天就被我验证了。中午下班碰到同事,说到现在开始进入课题申报准备高峰,本来就忙,前一天光为一位老师就讲了一下午的课题检索。这个毕业于欧洲某国的博士,现正带着博士生,竟然需要同事从最基础的检索知识教起——因为TA之前从研究内容到研究资料,全部都是导师提供的,自己完全不会。呜呼!