首页 > 语义网 > 语义网是NonRDF: not only RDF

语义网是NonRDF: not only RDF

为什么会有人认为仅仅做个d2rq,rdf就能解决关系数据库不能解决的问题呢? 这种对rdf的迷信,恰恰是语义网迄今普及不利的原因。技术之间的竞争,往往不仅是能力的竞争,而是整个工具系统之间的竞争。语义网的rdf阵营,在工具系统上的劣势,不是几年能弥补上的

过高的期望自然导致失望。语义网的核心是结构化数据,高质量结构化数据,可以产生新数据的高质量数据(即推理)。在从其它格式到rdf的转换中,如果没有数据质量的提升,就期望解决诸如数据集成,语义理解之类的问题,那很典型的,一年以后项目就被砍掉或死撑。

工具系统的竞争,是一个复杂的系统工程,绝不是一个标准化组织能组织和规划的。而工具的产生和演进,又是和用户与工程师的需求,理解能力和使用习惯密切相关的。基于w3c规范的工具系统,往往有太浓厚的学术性,不太贴合普通web工程师的需求。其实广义上讲,语义网已经是现实了: 大家不都用json吗?

分类:语义网
  1. kaixinbuy
    2012/10/18 00:18

    花了几天时间来通读这上面所有关于语义网相关的博文,收益颇丰,非常感谢博主。
    有以下一些疑问:
    语义,或者元数据的来源,(1)机器学习或者NLP得来的语义粒度较粗,(2)从用户那里得来的元数据质量也较低,现实社会中的数据是杂乱无章的。(3)让用户或者专家添加标注的方式更不可取。
    那么我就很困惑了,没想清楚这个语义信息到底应该怎么来。如何得到足够质量和规模的可用的元数据?
    我现在思考到的解决办法是,元数据,知识,要区分一下粒度,不同粒度的语义信息,实现不同的应用和功能。(1)信息抽取,NLP,机器学习自动计算得来语义信息(2)关注用户体验,在不打扰用户的情况下,从用户那里获取元数据。例如分类树,标签。
    不知道是否还有其他更有效的产生语义信息的方式?我比较关心这个问题,我认为语义网的本质在于可用的语义元数据该如何产生。

  1. No trackbacks yet.

留下评论