百度AI开放平台和24小时智能图书馆

最近人工智能发展迅猛。听说百度上线了AI开放平台,去看了下:http://ai.baidu.com

百度AI开放平台上产品相当多,包括:语音(语音识别、语音合成、语音唤醒)、视频(内容分析、封面选取、比对检索、内容审核),文字识别、图像识别、人脸识别,增强现实,自然语言处理、机器翻译,数据智能(推荐、舆情、商情……),知识理解(实体标注)、知识图谱等等。还提供解决方案,介绍案例和应用场景,有文档中心、教学视频、SDK下载,似乎很可以玩玩。可惜本人已经无心尝试了。
本想试试通用文字识别效果,没仔细看,点击“立即使用”要求登录百度帐号。其实页面上是有功能演示,可以提供网址或上传图片检测结果。
登录帐号后显示,文字识别这一块,通过API每天可免费调用50-500次不等,超过0.0025元/次-0.005元/次不等;SDK开发语言有JAVA、PHP、Python、C#、C++、Node.JS、IOS、Android。
由于昨天登录帐号,然后稀里糊涂激活了开发者帐户,今天接到应该是来自百度的电话(竟然是手机),询问我需要什么产品。营销还真积极得出乎意料。

百度AI网站首页的新闻资讯,介绍24小时智能图书馆,应该是百度的人脸识别+江苏感创的RFID+其他智能电器(如空调、通风、灯光的智能调节)。以下介绍根据报道:
24小时智能图书馆 “AI”不只是刷脸开门(2018-3-29)

苏州工业园区图书馆·星海馆(位于星海广场)
试运营:2018年3月24日-4月22日,开馆时间 10:00-19:00
正式开馆:2018年4月23日世界读书日,24小时不间歇运营

星海馆历时197天搭建完成,采用透明玻璃盒设计,占地30平方米,内含2000册图书、2000种电子书、500种有声读物。
结合百度 AI 人脸识别技术,绑定个人信息,可以刷脸开门、刷脸借书,2秒人脸识别,15秒借还,30秒自助办证。
百度 AI 人脸识别技术,可以检测画面中的人脸,并为人脸标记出边框。然后对人脸进行分析,获得眼、口、鼻轮廓等72个关键点定位,准确识别多种人脸属性,如性别、年龄、表情等信息。该技术可适应大角度侧脸,遮挡,模糊,表情变化等各种实际环境。同时,其活体检测功能,能把照片、视频、倒模中的人脸统统筛掉,只有“活生生”的人脸,才能通过检测!
和现在十分普遍的指纹识别相比,被相同指纹破解的概率是五万分之一,而被相同面部破解的概率则是一百万分之一,安全性提升了20倍。

战略图书馆技术:当前现实与未来可能

Wiley于3月22日请Marshall Breeding做了一个网络报告,报告时长40多分钟,标题为:战略图书馆技术:当前现实与未来可能。会前需注册,现在视频应该是公开的:
Strategic Library Technologies – Current Realities and Future Possibilities

图书馆自动化系统】内容从图书馆自动化系统开始。有不少来自他的Library Technology Guides 网站数据作成的图表,比如:历年选择或放弃Symphony图书馆数量柱形图,2017年升级到Alma的图书馆之前所用系统饼图,澳大利亚公共图书馆所用系统分布饼图,多个系统的地理分布地图,自动化系统厂商员工数量统计等。
图书馆服务平台】也有他对图书馆自动化系统的总结。相对于原来图书馆集成系统(ILS或LAM)和图书馆服务平台(LSP)二分法,现在增加了介于两者之间的“进步ILS”。LSP只有3个,即OCLC的WorldShare、Alma和尚在开发中的FOLIO。其他如Sierra、SirsiDynix蓝云等都被归在中间这一类——尽管在“产品开发时间线图”中Sierra与其他LSP并列。从他总结的“资源管理模型”看,LSP与ILS/进步ILS的区别主要在于,其技术平台是多租户SaaS、具有知识库(电子馆藏与书目)、只通过API互操作(没有批传输)、采购方式是许可证。之前ILS与电子资源管理(ERM)是分列的,LSP将两者结合在一起。
支持研究与教学】如果说上面是现实,那么未来将超越LSP。报告指出,大学管理者不在意图书馆内部工作流程,LSP之后的技术与服务,要能让图书馆可以支持对大学有战略利益的领域,即研究与课程(教学)。新领域包括:研究数据管理,研究服务支持(展示研究与出版物、资助课题),教学支持(课程阅读列表、降低学生资料费用、版权管理)。(国内目前普遍比较重视研究服务支持即展示这一块(比如学者库),也体现了这一发展趋势)
学术出版转变】图书馆的上游,学术出版社有什么新服务?报告列举了3家企业及其相关工具:
Elsevier:引文库Scopus;索引6900万出版物;分析工具SciVal, PlumX;文献管理Mendeley;研究信息管理系统Pure;机构文章存储库bepress;科学协作网络SSRN
Digital Science:引文库Dimensions;索引8900万出版物;分析工具Altmetric;研究信息管理系统Symplectic;研究数据存储库FigShare
Clarivae:引文库Web of Science(6800万出版物);分析工具InSites;文献管理EndNote;期刊管理系统ScholarOne;同行评议追踪与识别Publons
没想到数字科学公司的引文库竟然数量最多,可谓后来居上。该公司为麦克米伦创立,孵化致力于科学工作流和研究生产力的初创公司如Symplectic、FigShare、Altmetric。

酷URI、内容协商与解引

BIBFRAME还没开发完成,关联数据/语义网中的URI有可能在MARC记录中率先使用?至少美国合作编目计划(PCC)已经开始实质性行动。参见:
创制和获取URI的常用词表和参考源指南(2018-3-2)
编目常见URI问题:什么时候开始用?RWO又是什么?(2018-3-7)

在PCC的《URI常见问题》(URI FAQs, 2018-2-6)中,几次提到W3C文件《语义网的酷URI》。为更清楚地理解URI,找来仔细阅读。然后发现此文件中其实并没有解释《URI常见问题》中提到的dereference,因此又找到另一个W3C文件(见后)作为补充。以下为若干摘译(括号中数字为《语义网的酷URI》小节号)。

Cool URIs for the Semantic Web (W3C Interest Group Note, 03 December 2008)
摘要:资源描述框架RDF允许用户以计算机可处理的方式描述Web文档真实世界中的概念——人物、组织、论题和事物。在Web上发布这样的描述会创建语义Web。URI(统一资源标识符)非常重要,既提供了框架本身的核心,又提供了RDF和Web之间的链接。本文件提供了其有效使用的指南;讨论了两种策略,称为303 URI和散列URI;给出了使用这些解决方案的几个网站的指针,并简要讨论了为什么其他几个方案有问题。

URI】(1)
在语义网上,所有的信息必须表达为关于“资源”的陈述资源由“统一资源标识符”(URI)标识。这种建模方法是“资源描述框架”(RDF)的核心。

内容协商】(2.1)
Web客户端和服务器使用HTTP协议请求Web文档的表示并发回响应,HTTP具有强大的称为“内容协商”的机制来提供相同Web文档的不同格式和语言版本
当用户代理(如浏览器)发出HTTP请求时,会随某些HTTP标头发送,以指示它喜欢的数据格式和语言。服务器然后从其文件系统中选择最佳匹配或按需生成所需内容,然后将其发送回客户端。
内容协商往往是一种扭曲的实现:服务器不是直接回答,而是重定向到找到适当表示的另一个URL。重定向由一个特殊的“状态代码”[响应码]表示。

酷URI】要求(3)
1、在网上:给一个URI,使用标准Web传输协议HTTP,机器应该获得RDF数据,人类应该获得可读的表示如HTML。
2、无歧义:Web文档的标识符与其他资源的标识符之间不应混淆,一个URI不能同时代表一个Web文档和一个真实世界对象。

Web文档 vs 真实世界对象】(3)
Web文档 = 信息资源】根据《万维网的体系结构》第一卷,如果其所有基本特征都可以在消息中传达,则我们有一个Web文档(称为“信息资源”),如网页、图像或产品目录。
真实世界对象 RWO = 事物 Thing】如人和汽车,甚至抽象的想法和不存在的事物,如神话中的独角兽。

酷URI】设计要求(4.5)
1、简单性:简短助记。
2、稳定性:尽可能持久不变。
3、可管理性:如URI路径包含年份、可以每年更改URI模式而不影响旧URI;再如保留所有303 URI在专用子域上以简化未来迁移。

真实世界对象URI的2种解决方案】(4):
1、Hash URI(#):如 http://www.example.com/about#alice
适用于相当小而稳定的资源集合,如RDF Schema词表和OWL本体。只需简单上传静态RDF文件到Web服务器、无需任何特殊配置,适合快速发布RDF。
2、303 URI(303 See Other 重定向):
转发到通用文档,如:http://www.example.com/id/alice
重定向到:http://www.example.com/doc/alice,再经内容协商,
向机器提供:http://www.example.com/doc/alice.rdf
向人提供:http://www.example.com/doc/alice.html
转发到不同文档,如:http://www.example.com/id/alice(Alice这个人的标识符),重定向经内容协商,
向机器提供:http://www.example.com/data/alice(描述Alisce的RDF文档)
向人提供:http://www.example.com/people/alice(Alice的主页,Web文档)
以上3个文档在内容中当提供互相链接、揭示文档间关系(4.6)

内容协商 Content negotiation vs 解引 dereference】(译自:Best Practice Recipes for Publishing RDF Vocabularies, W3C Working Group Note 28 August 2008)
[按PCC的URI FAQ 5:解引,即检索由URI标识的资源的一种表示] 当一个HTTP客户端尝试解引一个URI时,可以指定优先接收响应哪类内容,通过在请求讯息标头中包含Accept:字段……。当服务器接收一个请求,它能使用Accept:字段的值,选择最合适的可用响应,尝试尽可能满足客户端的首选。这个过程即内容协商的一个实例

——— 附:响应码(response code)、Cool URI ———
关于HTTP URI消除歧义的简单规则,转引本文件之参考文献中的建议:
[httpRange-14] Resolved, Roy Fielding. 18 June 2005. http://lists.w3.org/Archives/Public/www-tag/2005Jun/0039.html.
a)如果一个“http”资源对一个GET请求的响应码是2xx,那么被那个URI标识的资源是一个信息资源;【Web文档】
b)如果一个“http”资源对一个GET请求的响应码是303(See Other),那么被那个URI标识的资源可以是任何资源
c)如果一个“http”资源对一个GET请求的响应码是4xx(错误),那么这个资源性质未知

为什么称“酷URI”?源自Tim Berners-Lee的文章:
Cool URIs does not change Cool URIs don’t change, Tim Berners-Lee, 1998. http://www.w3.org/Provider/Style/URI.
什么让URI很酷?
酷的URI是不变的URI
什么样的URI会变?
URI本身不变:是人改变了它们。

via Cool URIs in a RESTful World / by Thomas Bandholtz on Apr 08, 2008
中译版:RESTful世界里的Cool URI / 译者 王锐 发布于 2008年4月16日【上述译文略有修改】