Archive

Archive for the ‘自然语言处理’ Category

通信的语法,语义和语用层次:一封推荐信

2012/11/22 留下评论

以前在研究“语义信息论”(Semantic Information Theory)的时候,涉及到通信的三个层次:技术的,语义的和效果的。这个层次划分是(Weaver 1949)说的。香农的传统信息论只涉及技术这个层面。

从语言学的角度,这三个层次可以大致对应于语言的语法Syntax、语义Semantics和语用Pragmatics三个层次

今天在看《语言本能》(The Language Instinct)这本书,里面举了个很有意思的例子,可以做这三个层次的范例

一封推荐信:

亲爱的平克教授:

我非常高兴能向你推荐厄文×史密斯先生。史密斯先生是一个模范学生。他衣着整齐,而且非常守时。我认识史密斯先生已经三年了,我觉得他在各方面都是最合作的人。他的太太很迷人。

真诚的约翰×琼斯教授

语法层面:用某种NLP工具,比如Stanford parser,可以分析句子结构。比如这样的语法树

(ROOT
  (IP
    (IP
      (NP
        (NP (NR 史密斯))
        (NP (NN 先生)))
      (VP (VC 是)
        (NP
          (QP (CD 一)
            (CLP (M 个)))
          (NP (NN 模范) (NN 学生)))))
    (PU 。)
    (IP
      (NP (PN 他))
      (VP
        (VP
          (ADVP (AD 衣着))
          (VP (VA 整齐)))
        (PU ,)
        (CC 而且)
        (VP
          (ADVP (AD 非常))
          (VP (VA 守时)))))
    (PU 。)))

语义层面:基于背景知识,我们知道史密斯先生是个男人,他已婚,他至少已经三岁了(呵呵)。所谓的语义信息论,就是不仅局限于句子本身出现的符号(如“先生”),而是把它们与未出现的符号(如”男人”)也关联起来,通过出现的符号来推导出未出现的符号的一些信息。

语用层面:琼斯教授在使坏,在说史密斯的坏话,虽然一个负面的词都没有用。因为推荐信理论上是要讲被推荐人的专业素养,琼斯教授只说了一堆不相干的话。在这个特定的通信实例里,其实有一个“封闭世界假设”:如果推荐人没有说到专业素养,那说明这个专业素养是不值得提的。这种语用的信息,是基于信源和信宿共用的背景知识(如文化)和一些约定的规范(如推荐信的内容)。一些特定的场合,语用应该也是可以数学描述或近似的。留待以后有空来捣捣浆糊。

Advertisements