首页 > 语义网 > 温故而知新:重读Clay Shirky对语义网的批判

温故而知新:重读Clay Shirky对语义网的批判

Clay Shirky在2003-11-07发了一篇文章,The Semantic Web, Syllogism, and Worldview。我还记得这个文章刚出来的时候,一石激起千层浪,吵得不不亦乐乎。两年前在ontolog上有人又贴出来,又叽叽喳喳吵了一阵(不过在ontolog上什么不会被吵呢?)。当然,对很多人,这题目已经不需要吵了,语义网已经被工业界采用了,你还怀疑不过是无知而已。对其他一些人,认为语义网整个就没戏的,“I told you!”,看,过了八年了,Shirky没说错吧。这些话,十有八九是屁股决定脑袋,取决于paycheck的来源。

总结起来,Shirky说了这么几个问题

  • 推理没什么用(Syllogisms are Not Very Useful)
  • 现实世界中我们说话都是模糊的,没有逻辑的精确性(We Describe The World In Generalities;Meta-data is Not A Panacea)
  • 语义网的应用例子是简单问题复杂化,没有语义网也可以解决(The Semantic Web’s Proposed Uses)
  • 本体是屠龙之技,一般人不需要(Ontology is Not A Requirement )
  • AI过去50年不能解决的问题,SW就能解决了?(Artificial Intelligence Reborn)
  • 这个世界是乱七八糟的,鸡同鸭讲,试图用一种语言,一种语义一统江湖,那是扯(Worldviews Differ For Good Reasons)
  • 要现实一点,承认现实数据的乱七八糟性,循序渐进,等元数据多了,一点点推进语义网的建设。语义网迟早会来,但不是有人设计它(Worse is Better)

我相信,这里面每一条,尽管过去8年了,尽管技术进步了,现在拿出来都可以再吵上一千回合。这种争吵,我已经没有兴趣看了。BTW,我特别喜欢关于简单问题复杂化的这段话

This example sets the pattern for descriptions of the Semantic Web. First, take some well-known problem. Next, misconstrue it so that the hard part is made to seem trivial and the trivial part hard. Finally, congratulate yourself for solving the trivial part.

当然,这个话可以用在几乎所有的“研究”领域,不仅是语义网。

关于语义网好不好的问题,我觉得要分清几个层次

  • 能不能的问题(科学层次)
  • 容易不容易的问题(工程层次)
  • 经济不经济的问题(商业和社会层次)

大家站在不同的角度来吵这个问题,毫无意义。语义网能不能做这个,做那个?能?如果不能,我们还可以借用A算法来让它能,比如大学B的教授C做的那样…得,又变成学术讨论了。那工程师就会问,你这么做,代价怎么样?活人会按你想的做吗?如果他出错怎们办?如果他懒得连手指头动一动都不干怎么办?最后,VC和商人会问:搞这个要投入多少钱?预期的回报是多少钱?多长时间能回报?用别的技术会不会省钱?政治家和社会活动家也会问:我说我支持这个技术这个会不会促进改进我的形象,拉到更多的选票?这个会不会有助于社会控制?保护或者打探隐私?会不会让别人不知道我是一条狗,blah blah blah

我觉得,语义网作为一个技术规范,没有什么好吵的了,该有的都有了(除了天边的几朵小小乌云)。工业上,要的是应用,要的是效率。达到市场的要求,我看还要10年。什么标志?什么时候维基百科(wikipedia)自己变成语义维基了,这个事就算是真成了。语义维基比语义网要简单多了——语义维基搞不成,为什么会认为语义网搞得成呢?搞语义维基的几个人,向维基百科的头头脑脑进言要把语义加进来,维基百科一直没有被说服。换了是我,也不会被说服,第一,用户素质不行,数据质量保证不了;第二,慢,等你的系统稳定了再来。(BTW,关于语义维基的问题,好题目,以后再讲)。慢慢完善,要时间。

我觉得,W3C的规划(比如层次蛋糕),有点象共产主义——不奇怪,TBL是神一般的存在,大家都觉得他迟早会得图灵奖。W3C规划了一个干净的数据的和谐社会,希望大家都这样去做。可恼的是,俗人偏不这样做。就好象计划经济竞争不过市场经济,W3C这只看得见的手,搞不过市场这个看不见的手——虽然W3C的人都是极聪明的。其实,我心里一直以为,计划经济是优于市场经济——只要我们有足够好质量的数据,足够快的计算机,和足够听话的生产/消费者。这一点,现在还满足不了,所以,我们只好搞乱七八糟的市场经济。语义网的成败,大概也是一样的道理。

P.S. 有人向我推荐看下面的文章

P.S. 2011-11-16: “语义网”的成功,我看取决于“语义网”的重定义是否成功。现在成功的“语义网”应用,比如SIRI,和传统定义的语义网应用,相差甚远。那种应用,大概还要10年?现在重定义的“语义网”,和“有中国特色的xx主义”,有异曲同工之妙。
P.S. 2012-04-17:  维基百科的语义问题,现在有了WikiData,如果顺利的话,过两年左右就算实现了。
Advertisements
分类:语义网
  1. 还没有评论。
  1. 2011/04/24 @ 01:29
  2. 2012/04/16 @ 01:29

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s

%d 博主赞过: