编目精灵III

12月3-4日在广州参加“知识组织与检索语言学术研讨会”。第一天15个报告，每个报告40/25分钟，内容丰富又排得很满，有难得请到的大咖（头衔都是一长串的），以下选择若干报告概述个人听后感（省略头衔，姓名前数字为报告序号）。第二天是《中图法》编委会工作会议，有幸蹭会，不方便分享内容。
特别有感触的一件事是，第一天晚上5点半，会议还在进行中，会场投影率先罢工。于是体验了一把前电脑时代的学术会议：随薛春香老师报告，努力在头脑中再现内容——实际感受是，PPT可视化确实极大地改变了人的思维方式，弱化了人的具象能力。其实这种现象在电视代替广播时就已经开启，虚拟现实/增强现实必将加速推进这种趋势。

——— 知识组织与检索语言学术研讨会：听后感 ———
1 马费成（武汉大学）：大数据环境下用户需求信息组织
对“用户信息需求”加以组织，很新鲜的概念。通过什么方式？“用户需求信息词表”吗？没有提到，并且从报告看本体方法被排除在外。提到DC、SKOS、FOAF甚至FRBR，似乎与用户需求并无直接关系。报告立意很高，但感觉目前还是初步框架，没提供太多实质性内容。

3 李广建（北京大学）：用网络数据揭示非正式交流过程
从公开的网络信息（学术新闻）分析人文社会科学领域的线下/现场的非正式交流，包括不同领域的活跃度、专家所在高校分布、交流的政府机构、跨省交流……可视化展示。由于时间所限，似乎没有说明哪些属于“非正式交流”，比如到政府机构算非正式交流？

5 黄水清（南京农业大学）：古文信息处理：概念、现状与趋势
报告涉及古文信息的数字化、智能处理和人文计算（数字人文），但数字人文部分只是一带而过，没有展开说明。个人很赞同其中观点：（图情界）选择人文计算问题，应当是研究者有想法但无法实现的，而不是研究者也无法解决的，比如《红楼梦》的作者。

8 常春（中国科学技术信息研究所）：知识组织生态系统研究进展
报告内容比较学术化。我关注的是作为研究对象的《汉语主题词表》。一直觉得国家投入巨资编制词表，应该开放才能最大化其利用，终于听到好消息，《汉语主题词表》服务系统刚上线（中信所主页有显著链接）。不提供批量下载，但有很丰富的服务，目前有6个版块：术语服务、文本分词、自动标引、主题分析、学科分类、知识树DIY。可以对用户提供的1.5万字以内文本提供分析。
据说里面不但含有词表中的词，还有其他来源的400万词汇（用于辅助分词）。有兴趣可以去探索一番：http://ct.istic.ac.cn/

9 贾君枝（中国人民大学，今年刚从山西大学转会）：数据起源描述框架及其应用
数据起源（或来源）的3个描述框架：开放起源模型、W7模型和Prov。之前关注过W3C的Prov，但并不了解其使用。报告介绍了2个案例：2014美国国家气候评估报告和欧洲起源项目-器官移植。
查了下几个链接：
PROV-Overview (W3C Working Group Note 30 April 2013)
Open Provenance Model Vocabulary Specification (6 October 2010) ：文件格式很像W3C文件，作者：Jun Zhao (Image Bioinformatics Research Group, Department of Zoology, University of Oxford)
W7 model 似乎出自一篇文章：Sudha Ram, Jun Liu. A New Perspective on Semantics of Data Provenance http://ceur-ws.org/Vol-526/InvitedPaper_1.pdf: In the W7 model, provenance is conceptualized as a combination of seven interconnected elements including “what”, “when”, “where”, “how”, “who”, “which” and “why”.

11 章成志（南京理工大学）：基于全文内容分析的算法使用行为与影响力研究
针对“计算机算法”这一特定问题的“全文”文献计量分析，依据专业词典等做数据标注，目标之一是可以根据要求推荐算法。有技术含量，又有实用价值，很高大上。
不免联想到评审时经常看到的文章：找个数据库、用关键词搜一堆文章，做一堆没有任何悬念、意义不明的统计分析+可视化；换一组关键词，又是一篇文章……如此循环往复，可至无穷。

12 范炜（四川大学）：《情报语言学辞典》语义化进展
张琪玉《情报语言学辞典》的语义化，是对词条的深度结构化，而不只是简单地标注为：术语、解释、见/参见。计划2019中发布beta版，期待。

14 卜书庆（国家图书馆）：《中图法》的发展历程与发展方向探讨
中图法发展史的很好总结（后两阶段应该更多是在试验与研究，还没有上线）：
1975-1999：创建、统一（多用户/多资源版）、一体化（分类主题）
1999-2009：机读化、电子化（光盘版）、网络化（Web版）
2010-2013：语义化、关联化、可视化
2014- ：自动化（智能化），最终用户服务化
今年10月曾给内蒙中小学图书馆员曾介绍过《中国分类主题词表》网站，可以免费注册使用3级类目，支持分类法全文及主题词检索。早年试用情况参见：中国分类主题词表Web版试用记（2010-3-4），网址现为：http://cct.nlc.cn/

15 曹树金（中山大学）：大数据环境的知识组织
其中“面向（用户）情景的知识组织”很有意思，情景如何描述和组织？没讲答案，可关注。
因为会议安排太满，又临时增加14《中图法》报告，作为会议协办者，曹教授只能牺牲自己的报告了，讲5分钟实在太短。

归档

“知识组织与检索语言学术研讨会”笔记