首页 > 随感, 语义网, 历史, 工程创业 > 语义网与国学

语义网与国学

我长久以来有一个理想,就是把国学经典给形式化了,比如二十四史。我曾经试图做过《史记五帝本纪》的语义化,和《论语》的语义化,都是用semantic wiki来做。AURA似乎也是这个思路。

这个思路很难做下去。因为,第一,你要看得懂问题域,对知识背景要求高,成本一下就上来了。第二,随着标注的增多,词汇表越来越大(先不论公理axioms),管理很麻烦。第三,如果很多人搞,那基本不可能用统一的建模方法——三五个人你还可以用行政命令强迫他们用一个词汇表;人多了,词汇混乱那是一定的。

Watson走了另一条路,就是不试图去理解自然语言(文言文可以机器理解吗?呵呵),也不做人工建模,而是走统计的路。但对国学这样的,似乎也不适用。

我觉得,最终的路,还是介乎其间。NLP和机器学习获得一般知识shallow knowledge,放在wiki上,让人去进一步优化。也可以参考captcha,利用闲散人脑资源来计算。说到底,不光是要做人工智能,而且是要搞一个平台去利用人的智能。也就是所谓的Social Machine

Advertisements
  1. 还没有评论。
  1. No trackbacks yet.

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s

%d 博主赞过: