首页 > 语义网, 旧文, 流水帐 > 语义Web的前景如何?(1)语义是什么[2003]

语义Web的前景如何?(1)语义是什么[2003]

【初学时在水木清华站上的讨论记录,主要是和minc】

2003-11-25

==语义是“理解”,或者“约定”?==

ChinaNci:

目前好像很少有应用出来,会不会只是一个停留在纸上的设想?

minc:
现在什么都不好说,因为还有一些关键问题没有得到解决

jiebao:
语义网的研究是阶段性的
首先解决syntax层面的问题,就是xml
然后是基本资源描述问题就是 rdf
然后是对资源间关系的形式化描述, 就是owl, daml_oil
这三步已经差不多做好了

下一步就应该是对 owl-based的数据进行推理和查询
当然, 基于rdf或者owl的数据挖掘和ontologgy管理(如合并,映射, 进化)

按TIM BERNERS-LEE的构想, 这个工作大概到2008左右可以完成

在商业上, 我认为很快就会在知识管理, 数据挖掘, 数据集成方面出现一些企业,
http://boole.cs.iastate.edu/semanticweb/topic.cgi?forum=24&topic=1&show=0

这里有两个例子

总的来说, 我觉得机会还是多的很

minc:
rdf当然也是用来对资源之间的关系进行形式化描述的

这三步可以说还差得比较远 因为即使有了描述
很多在这些描述基础上的推理并不能很好的实现 进行这样的描述又有什么用处呢?
而且其中的有些问题已经很久都没有得到解决了

rdf是99年提出的 daml+oil和OWL的逻辑模型基本相似 也是很早就提出了
但是到现在这么多年过去了 面对的问题还是那些 没有什么进展

至于ontology的合并,映射,进化 根本就不是纯机械能够完成的任务

商业上的事情 谁也不好说 有和没有是一回事 有没有前途是另外一回事

jiebao:
具体的说, 需要解决的是什么问题?

如果说是逻辑问题, 语义网的逻辑基础无非是Frame-based logic, or Desription Logic

它具有有限的逻辑推理能力, 原则上说, 并不会比FOPL强, 但完美的推理并不是语义网的核心思想, 关键是机器”可理解”, 是有限制的达到机器之间的对资源描述的”共识”.

语义网并不追求完美的人工智能, 而在追求Web主体间相互通信的一种”语言”和相关词汇

rdf提出到现在, 基于rdf的推理工具和查询系统已经有很多例子了, 感兴趣的话可以看看

SWRL: A Semantic Web Rule Language (http://www.daml.org/2003/11/swrl/)
RACER :Renamed ABox and Concept Expression Reasoner http://www.cs.concordia.ca/%7Efaculty/haarslev/racer/

以及Sesame http://sesame.aidministrator.nl/
TRIPLE http://triple.semanticweb.org/

Ontology Merging, Mapping, Evolving自然不是纯机械可以完成的任务, 但是机器可以极大的提高工作效率, 比如Clio ,GLUE , OntoMapper, PROMPT这些系统.

minc:
首先有一个问题
什么叫做“可理解”?

对于机器来说 理解终究还是基于一定逻辑基础上的推理
这个逻辑基础就是DL DL是FOL的子集
但是我希望你看一下DL中的推理的几个基本任务
几乎有一半的任务都不能解决 也就是计算复杂度太高 而没有优化的算法

如果你的推理是rule-based的 那么是达不到DL推理的complete and sound的要求的和传统的AI也没有什么区别

你说的这些工具我都用过的 尤其是sesame和racer
sesame是非常简单的一个基于rdf的东西 rdf本来的逻辑能力就非常弱
sesame甚至有一个可以取消inference的选项

我还report过racer中的一个bug 但是目前不管什么工具都超越不了几个障碍

minc:
还有就是你说的prompt是protege中的那个plugin吗?

如果是的话应该是frame-based的东西
现在的语义网中应该已经不再使用frame-based的东西了

jiebao:

我认为语义网的研究重点, 还不在于追求比FOPL更强大的推理机制, 甚至machine understandable的重点也不是追求强大的逻辑推理能力, 那是人工智能中更深层次的研究问题. SW的重点是放在”约定”,就是网上的主体在通信时相互知道所说的”资源”是同一个东西, 以及这个东西和别的东西的关系. 即使推理能力是弱的, 也可以满足目前的应用. 对于SW的期望, 本来就不是要求它绝对智能, 而是解决”鸡同鸭讲”的巴别塔问题的.

minc:
你说的这种问题 用一个wordnet项目基本上就可以解决了
理解的基础应该是逻辑 而不是单纯的“约定”
况且这也是由semantic web的几层结构决定的
semantic web最高层的trust的基础就是logic和proof

jiebao:
prompt(or smart)只是一个ontology alignment的算法, 原始的描述确实是frame-based的,不过我认为那个算法很容易可以转变DL的描述, 毕竟两者中都有concept和concept的牯性, 并不会影响到prompt的核心流程.

FL也不是绝对和DL不能共存.Protege的OWL接口示范了一个很好的FL和DL兼容的范例. http://protege.stanford.edu/plugins/owl/concepts.html

jiebao:
Wordnet当然不能解决问题, 那只是一种对自然语言的general的ontology. 对具体的应用, 都需要具体的ontology

所谓的理解, 并不是要求机器去解几何题或者进行辩论, 而是象网络协议一样, 对”资源” (在TCP/IP里就是地址, 握手协议,缓冲等)达成共识, 然后软件代理就可以理解网页上的资源到底在描述什么概念.

说实话, 我一直对Tim的那个trusted SW的概念很怀疑. 这个要求对实践中的SW是不是太高了? 或者说, 绝对的trusted的logic并不是SW所必须的?

minc:
protege确实已经开发了自己的owl的plugin
但是第一:里面有很多还没有完善的地方
第二:为了实现从Frame到现在OWL的转变 protege对自己的改动大家都是有目共睹的

我的感觉 几乎从头到尾做了一个新的Protege。。。
把原来的描述kb的clips基本上已经改的面目全非了

而且基于frame的知识库和基于DL的知识库的推理机制是截然不同的
基于frame的知识库的推理大部分都是match的方法
而DL就不一样了 它是取代frame的方法 而且要复杂的多

minc:
类似于wordnet的项目我没有怎么研究过
但是我觉得UMLS基本上也是做这个的

把自然语言中的各种词汇进行统一 并且再描述这些叙词之间的关系

还有就是 那么你认为软件代理要做到什么才能算是“理解”了网页上的资源
或者是概念了呢?

jiebao:
不仅仅对自然语言, 你说的UMLS是Unified Medical Language System吗?

很多行业都有自己的ontology, 比如生物信息学, 现在有了对蛋白质功能的gene ontology, 还在开发对核酸的ontology. 有了这个ontology(颇甑是一个taxonomy), 再有了它对其他数据库的ontology(说的简单点就是数据库结构schema), 比如对PDB, SwissProt, Prosite, 的相互映射, 一个软件代理就可以自动完成诸如”请告诉我所有在PDB中的蛋白质三维结构, 其中包含有和prosite中指定的一类motif功能相似的motif”这样涉及多个异质网络数据库的查询.

用传统的方式, 当然可以手工完成, 也可以用wrapper实现, 但是必须知道每个数据库cgi接口的很多细节. 如果这些数据库在ontology上达成了协议, 那软件代理就可以无歧意的在多个数据库间(并不是传统意义上的关系数据库)建立联系, 完成复杂的曷物处理.

这或许并不很智能, 比如说, 这里用到的ontology根本没有DL里所说的那样复杂, 只是DAG甚至taxonomy, 但是它能解决大多数问题. 我想实现中的SW, 至少在其初级阶段, 就是为了类似的问题的解决而出现的. 复杂的推理能力当然是很好的特征, 但没有它SW也一样可以解决很多现实问题.

minc:

这和数据库查询有什么区别呢?

或者说是复杂的多个数据库共同查询

知识库应该是可以完全包括数据库的
并且知识库是建立在一定的逻辑模型的基础之上的

而且在知识库中推理和查询是紧密的结合在一起的 相辅相成的
查询的同时必然存在着推理 而这里的推理就必须要建立在一定的逻辑模型的基础上

nobodyelse:
确实目前没有什么应用
因为ontolgy实在太难建立了
目前都是在一个极狭窄的领域内
做的应用
没有普遍性

【forum=10&topic=106】

Advertisements
  1. 还没有评论。
  1. 2012/04/16 @ 01:28

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s

%d 博主赞过: