首页 > 语义产业 > 语义网的公司(6)Siri

语义网的公司(6)Siri

Siri是iPhone上的一个应用。主要的用处是你对着iPhone说一句话,比如“MIT附近的意大利餐馆”,它会做语音识别+自然语言理解,然后查一些数据库(比如OpenTable, Yelp, Tickets.com),把结果以友好的方式,比如地图,展示给你。

下面这个视频演示了Siri的基本用法:

这家公司成立于2007年12月,到2010年4月就被Apple给买了。Siri的背景很强大,她的母体是SRI International(原斯坦福大学研究所),成果部分产生自CALO(Cognitive Assistant that Learns and Organizes)工程(主页在此,RPI也参与了CALO,见此)。CALO是一个军方资助的项目(SRI大部分项目都是政府或者军方的,这也是为什么它被迫从斯坦福大学独立出来),目的是开发Personalized Assistant that Learns (PAL),钱特别多,足足养了300多人,先后发了500多篇文章。最后附带产生一个Siri,那是小儿科——尽管它最后的产业化还是花了5年并让开发团队平均每人长了14磅肉

另外注意, Tom Gruber 是Siri的CTO和co-Founder。早期写语义网学位论文的,哪个不引用他对本体的定义:“An ontology is a specification of a conceptualization”?Tom在ISWC2004的主题发言中,说他正在做一个旅游有关的语义网站。Siri虽和他说的不完全一样,思路还是一贯的。感兴趣的,去看他在SemTech09的忽悠或者这个podcast

为什么说Siri是一个语义网的应用?不在于它内部有没有用到RDF(我想是没有),那在于它打破了网站之间的数据壁垒(data barrier),让许多不同类型的网站的信息集成起来用。有人会说,这有什么稀奇,不就是Priceline十年前就会做的吗?我同意,而且补充说,Priceline也可以算原始态的语义网应用。Siri单从数据集成的角度,比一般的聚合网站更进一步,针对每个用户个人的偏好和环境(context)做集成,提高了数据的质量。做Linked data,并不是说要大家去把数据都包装成RDF,而是要许多服务之间可以对话,可以相互查询并做简单的“理解”(比如分类树推理)。重要的是精神,而不是形式。

Siri在语音识别(似乎是用Nuance的技术——另一个SRI的spinoff)、自然语言理解和用户界面方面的工作,也是出彩的。如何分析句子中的“语义”,想必有很多可以和IBM沃森比美的技术秘诀。能把许许多多的技术集成在一起(具体看这里),也是极需要下狠功夫的。

那Siri到底成功不成功?现在还很难讲。在AppStore上,目前的评分是3星,有1.2万个评分。作为对比,Skype有31万评分,3.5星; Yelp有9万评分,3星;TripIt有1.1万评分,3星。所以成绩还是不错的。

我个人的Siri体验并不太好,主要是它不适应我的英语口音。有些句子,我敲进去它也不知道如何处理(我比较坏,问一些偏门的问题比如从MIT CSAIL到BBN怎么坐车?)如果人来看看Wikipedia,那是可以把这背后的知识勾出来的,Siri还不行。我看,Siri要面临的挑战比IBM沃森还大。因为沃森不需要会回答所有的问题——它只对70%的问题有80%的正确率,它可以不回答那些它没有把握的问题。可是对个人用户,如果我回答的问题十个里有三个Siri回答不出来,至少对我,很快就会丧失用它的兴趣。

语义网的应用,面向企业(比如银行或者药厂)的和面向个人用户的,那是大大的不一样。现在面向个人用户的的应用还实在太少,界面方面的工作还太少。(iPhone好在哪里?第一个就是界面)

最后我套用马克思评价货币的话:RDF天然是语义网,但语义网并非天然是RDF。Siri为我们提供了另一种思路。

P.S.  (2011-05-13) 问了一个CALO的参与者。他说,SIRI里只用了CALO里很少的成果。比如CALO里原来有自动service discovery and composition (“join”),在SIRI都没有用。Tom有一个忽悠Gigantic Join,其实CALO试图做过,不过现在还不scalable。

P.S 2. (2011-10-08 针对有些人说IPhone 4S不过是语音识别) SIRI背后的人工智能,哪里仅仅是语音识别。语义分析,结构化数据,机器学习,情景感知,数据集成,服务集成,等等。不夸张的说,这个东西是过去十年人工智能技术的大综合,背后有几百个研究人员(早在SIRI被Apple收购之前),经历数代才发展到今天的地步。当然,人工智能从来都是“傻”的,所以SIRI能不能成功,又是另一回事。在IPhone 4S推出来之前至少两年,其他公司也在搞类似的东西了,但谁都没Apple搞得快。相信不远的将来,Android上类似的软件也会出来。

Advertisements
分类:语义产业
  1. 2011/10/15 @ 00:36

    Siri 是把语音转换到文字,然后把文字发给 wolframalpha …

    http://www.wolframalpha.com/

    我觉得后者才是重点

  2. 2011/10/18 @ 02:10

    哦?

    搜索了一下发现:
    Apple’s Siri Teams Up With Wolfram Alpha
    http://www.readwriteweb.com/archives/apples_siri_teams_up_with_wolfram_alpha.php

    不过就目前的报道,Wolfram Alpha提供的数据,应该只是SIRI的一小部分

  1. 2011/05/01 @ 04:43
  2. 2011/05/01 @ 14:48
  3. 2011/10/05 @ 08:48
  4. 2011/11/16 @ 04:24
  5. 2012/04/16 @ 01:32

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s

%d 博主赞过: