首页 > 逻辑, 语义网 > 手工创建知识库的一些问题

手工创建知识库的一些问题

今天咨询了一个专门做知识库系统测试的专家(某君)。某君参与的一个大型项目,是用人工从文本中建立基于逻辑的知识库。某君说了这个方法的一些问题。

1)按照构想,知识库专家(KE)要按照文本,逐句翻译成逻辑句子——通过一些可视化的界面。不过,在实验中发现,很多KE不这么做,也就是逻辑句子不是文本句子的直接翻译。KE会按照自己的理解选择词汇,和词汇间的关系(公理)。

2)KE有一个工具使用的训练过程。但是规定的训练时间其实是不够的。训练结束后,KE还是觉得不熟悉,要在后来的翻译过程中不断加深对工具的认识。

3)KE常会加入新的知识使旧的知识无效。理论上,这是一个单调的逻辑系统。但实践中,知识编码常会出错。KE感觉需要经常回到以前做过的页,去修正和改进。也就是,和我们一般的学习过程一样,知识库的创建是一个对领域知识加深认识的过程,需要反复、逐步修正。不是看了一遍就不用看第二遍的。

4)不同的领域对知识的编码大不一样。有些要求强的过程建模,有的要求数值关系。每个领域都需要专门的训练。

5)对知识库的查询,前向问题(三段论之类)比后向问题(如查询)要容易被解答。

6)KE是人,所以会困惑。[我问:这一件事干上几个月,会不会觉得烦躁和无聊?会不会更容易出错] 随着知识库的增大,KE感觉效率会下降,因为错误被发现的频率越来越大,需要反复纠正。所以认为开发时间和项目规模呈线性的假设是错误的。

7)成本:业余的KE的每小时工资至少是20$,专业的更高。外包到其他国家可能会便宜些。

8)其他问题:外部知识是否有用?初始本体价值如何?是否需要对推理结果排序(而不仅是YES/NO两类)?这里略过。

续:手工创建知识库的一些问题2[语音]

Advertisements
分类:逻辑, 语义网

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s

%d 博主赞过: