自然语言计算机形式分析的理论与方法笔记(Ch10)

第十章:语用自动处理的形式模型

语用学是对语言与使用环境之间关系的研究。使用环境包括像人和物这样的本体,也包括话语的上下文。研究主要涉及修辞结构理论、文本连贯、言语行为理论和会话智能代理等方面。

Mann 和 Thompson 的修辞结构理论

1987 年,W. Mann 和 S. Thompson 提出修辞结构理论(RST),一种基于文本局部之间关系的关于文本组织的描述理论。

RST 对语言使用的性质和如何理解这种性质的基本观点:

  • 如果想说明话语本身,就必须对说话者和听话者的参与有明确的解释
  • 话语的结构比其他任何事物都更反映说话者的意图,意图是有层次的
  • 注意和意图被认为是文本中相互独立又相互作用的方面;语言形式、语言功能和话语结构互相联系的方式是一种松散的相互制约的方式,而不是某种类似于 “一一映射” 的方式。因此并不总有什么特定的词汇或语法形式唯一地标记结构特征。

RST 的核心是修辞关系的概念,修辞关系是存在于两个互不重叠的文本跨段之间的关系,一个叫 “核心单元”,一个叫 “卫星单元”,这种区分来自经验观察。根据文本分析经验,他们对文本结构做了基本假设:组织性、统一性和连贯性、统一和连贯的功能目的、层级性、层级的同质性、关系组合、关系的非对称性、关系性质的 “修辞” 功能。他们总结出了 25 种修辞关系,分为 “核心-卫星关系”(21 种)和 “多核心关系”(4 种),分别表示为 N-S 和 N-N(…N)。用来描写文本结构的 RST 只辨识结构的三种主要类型:整体结构、关系结构和句法结构,并主要研究中间一层的关系结构。

常用的 RST 关系:

  • 详述:卫星单元给出的是与核心单元内容有关的一些额外细节
  • 对比:核心单元表示的事物尽管在某些方面具有相似性,但在某些重要方面又不同,这种关系具有多个核心
  • 条件:卫星单元给出的某些事件必须在核心单元给出的情形出现之前就已经发生
  • 目的:卫星单元给出的是实施核心单元所表示行为的目的
  • 序列:这种关系是多核心的

RST 提出了文本的树结构模型,从根节点开始的树形图可以代表整个文本的修辞关系结构。RST 将各种修辞关系概括成五种基本图式:

他们认为对文本的一个典型分析是应用一套图式使下列限制成立:

  • 完整性:有一个图式(根节点)可以覆盖整个文本
  • 联系性:除根节点外,每一个分析中的文本跨段要么是一个最小单元,要么是分析中另一个图式应用的一个成分
  • 唯一性:每一个图式应用都涉及不同的一套文本跨段
  • 邻接性:每一个图式应用的文本跨段都组成一个邻近的文本跨段

以上条件使 RST 分析形成树形结构,成为一个树图,用来代表文本的 RST 结构。在树图中,每一条竖线从被图式分解的文本跨段中延伸下来,一直到这一图式应用的核心单元(详见 P505 例子)。树图中各子结点代表各个互不重叠但又相互邻接的文本跨段。一个文本跨段是任何一部分从文本组织的角度上看有功能整体性的一个文本片段。关系存在于两个不重叠的文本跨段之间,由关系定义来确认。文本结构的概念是用一层层更大的文本跨段的网络关系来定义的。

RST 文本分析一般采用自底向上剖析过程:

  • 将一个文本切分成多个单元:大小任意,理论上中立性,功能上整体性
  • 确定跨段和关系:要确定作者写作意图是否适用于关系定义
  • 除去非良构的图:根据上面的四个限制
  • 进行排歧

RST 提供了一种讨论书面独白文本的联系性和整体性,以及文本如何为作者的目的服务的方法。从渊源上,它采用的是语用功能主义思想,受 Halliday 系统功能语法影响很大。

利用 RST 开发出文本自动剖析器的:

  • Marcu:用 13 条公里描写了该系统运作中的各种限制,并使用数字和谓词逻辑的传统运算符对由每个文本跨段的四类信息所组成的结构进行运算,推导出一个文本的所有可能的修辞-意图树。
  • Corston-Oliver:通过将提示短语与回指、指示词和指称连贯整合,改进了算法。
  • Reitter:使用 SVM 指派文本片段间的修辞关系和核心单元。
  • O’Donnell:RSTTool

RST 并不具有显著的跨语言可转移性,它的优点是提供了完整的分析而不是选择性解释,可以应用于很多种不同的文本,允许不考虑语类对文本结构做一种统一的描写,有助于区分文本中那些真正是语类特殊的方面与那些相对而言更独立于语类的方面。不足包括:没有对各种关系如何实现做出系统描写;没有将它的理论与各种文本特性的理论(如信息流、主题结构、词汇结构等)联系起来。

汉语研究中,2002 年香港城市大学的卫真道利用 RST 进行了案例分析;2000 年同校的邹嘉彦等利用 RST 对 DM 自动标注系统做了改进。

文本连贯中的常识推理技术

语言通常并不是由孤立无关的句子组成,而是由搭配在一起的相关句子群组成的,这种句子群称为 ”话语“。话语包括独白、对话和人机交互。本节主要讨论独白,即参与者是一个说话人和一个或多个听话人的单向交流。

话语的话段之间所有可能的连接称为连贯关系的集合。常见的连贯关系(S0 和 S1 分别表示两个相关句子的意义):

  • 结果:S0 所声明的状态或事件导致或可能导致 S1 所声明的状态或事件
  • 说明:S1 所声明状态或事件导致或可能导致 S0 所声明的状态或事件
  • 平行:S0 所声明的 P(a1,a2……)和 S1 所声明的 P(b1,b2……)对所有 i a b 是类似的
  • 详述:S0 和 S1 所声明的是同一命题
  • 时机:推测从 S0 所声明的状态到 S1 所声明的最终状态的状态变化,或反过来

每个连贯关系与一个或多个约束有关,符合约束才能维持连贯关系。如何应用这些约束?推理。演绎(向前推出隐含的关系)是一种可靠的推理,但在许多语言理解系统中所依赖的推理是不可靠的,这类推理方法称为 ”溯因推理“(从结果中寻找可能的原因)。

一个给定的结果可能有许多潜在原因,通常需要最佳解释。有三种策略可以采用:

  • 概率模型:计算正确空间和缺少相关语料时会有问题
  • 启发式策略:比如优先选择假设最少的解释,过于脆弱和有限
  • 基于代价策略:上面两者结合

在确定话段间最合理的连贯关系时,需要利用世界知识和领域知识,但这是个 AI 完全问题(NP 完全),因为需要人类拥有的所有知识。详见 P514-517 的例子。

句子间连贯关系导致话语结构,一组局部连贯话段的节点被称为 ”话语片断“。话语结构的计算所涉及的 ”话语语法“ 只牵扯两个规则:把一个片断改写为两个较小的片断的规则,以及判断一个句子就是一个片断的规则。话语结构对于所指判定很有用,代词常常表现出一种 ”新近“ 的优先关系,即更倾向于指向附近的对象。根据话语层级结构的 ”新近“ 判定代词所指效果比根据话语线性顺序的 ”新近“ 判定好得多。

言语行为理论和会话智能代理

语用学中关于言语行为的理论由哲学家提出。

哲学基础

维特根斯坦:

  • 哲学的本质是语言
  • 哲学的本质应该在日常生活中解决
  • 凡是能够说的事情都能够说清楚,凡是不能说的事情就应该保持沉默
  • 意义即使用

奥斯汀:

  • 把言语行为分为 ”施行式“ 和 ”表述式“,施行式的话语有得体和不得体之分。得体的六个条件:
    • 必须存在公认的、确实有约定效果的约定程序,该程序包括由一定的人在一定的情境中说出的一定的话语。违反的不切当叫作 ”无用“。
    • 在某一确定场合,那些特定的人和情景对于被援引的特定的程序的执行必须是合适的。违反的不切当叫作 ”误用“。
    • 所有的话语参与者必须正确实施这样的程序。违反的不切当叫作 ”缺陷“。
    • 所有的话语参与者必须完全实施这样的程序。违反的不切当叫作 ”障碍“。
    • 参与者或实施者,必须具备一定思想或感情,并且自己有意去执行。违反的不切当叫作 ”非诚“。
    • 参与者自己后来确实这样去执行。违反的不切当叫作 ”背诺“。
  • 对话具有一个重要特征:对话中的话段是一种由说话人实施的行为。但他没找到关于施行式话语的统一标准,于是又从 ”说事“ 和 ”做事“ 角度分析言语行为。他认为,在真实的言语中,发出的任何句子不外乎三种言语行为:
    • 以言表意行为:发出一个带有特殊意义的句子
    • 以言行事行为:发出一个句子时带有询问、回答、承诺等行为
    • 以言取效行为:发出一个句子对听话人的感情、信念或行为产生一种特定效果
  • 区分这三种言语行为是为了强调以言行事行为。他认为,如果要检验明显的施行式动词,最好区分出那些说出施行式话语时具有明显行事语力的动词。于是,根据不同的行事能力,以言行事分为五类:
    • 判定式:说话人对某事发出的裁决、估计、推断或评价,是判断的运用。
    • 执行式:说话人对某事做出的执行、命令、指导或催促,是返回影响或运用能力。
    • 承诺式:说话人对于某一行动方案做出的承诺、保证、意向或支持,是承担义务或表明意向。
    • 表态式:说话人对于他人的行为做出的反应,如道歉、祝贺、感谢等,是表明态度。
    • 阐述式:说话人阐述观点、做出论证、说明用法,是阐明原因、论点或意见。
  • 言语行为通常用于描述以言行事行为

塞尔:

  • 对奥斯汀的言语行为分类进行了修改,分为五类:
    • 断言式:说话人对某事是某种情形的表态(建议、提出、宣誓、自夸、推断等)
    • 指令式:说话人的目的是使听话人做某事(询问、命令、要求、邀请、建议、乞求等)
    • 承诺式:说话人对将来的行为做出承诺(承诺、计划、发誓、打赌、反对等)
    • 表情式:表达说话人对一些事情的心理状态(感谢、道歉、欢迎、悲痛等)
    • 宣告式:由说话人说出而使外在世界产生新情景

三个特性

自然语言处理中,人与计算机之间的对话与会话叫作 ”会话智能代理“,包括六个组件:语音识别组件、自然语言理解组件、自然语言生成组件、文本-语音合成组件、对话管理组件和任务管理组件。

会话分析与书面独白三个不同的重要特性:话轮转换、会话的共同基础和会话中的隐涵。

  • 话轮轮换
    • 1974 年,Sacks 等指出,至少在美国英语中,话轮转换的行为是受一组话轮转换规则制约的。这些规则被应用于 ”合适转换位置“(Transition-Relevance Place,TRP)。话轮转换规则由三个子规则组成:
      • 如果在该话轮,目前说话人已经选择 A 为下一说话人,则下一个讲话人一定是 A
      • 如果当前说话人没有选择下一说话人,其他说话人可以在下一轮说话
      • 如果没有其他人参加下一个话轮,当前的说话人可以接着参加下一个话轮
    • 话段切分要根据边界线索设计:
      • 线索词:倾向于出现在话段首尾
      • N 元词或词性标记序列:特定单词或词性标记序列往往预示边界所在
      • 韵律
  • 会话的共同基础
    • 对话是说话人和听话人共同的行为,共同基础就是被双方都认可的事物的集合
    • 1998 年,Clark 和 Schaefer 讨论了五种接续的方法,按从弱到强为:
      • 继续关注
      • 相关邻接贡献
      • 确认
      • 表明
      • 展示
    • 对会话的理解不仅仅是字面意义:说话人交流的信息大于话段单词的字面所给出的信息
  • 会话隐含
    • 会话隐含意味着在会话中对允许的推理需要进行特殊分类。Grice 提出听话人之所以能够推出结论,是因为会话都需要遵循一套普遍准则,这些通用的启发式准则在会话话段的解释中起指导作用。
    • 四个普遍准则:
      • 数量准则:提供与需求正好一致的信息(一定不要提供多于需求的信息)
      • 质量准则:尽可能提供真实的信息(不要提供你认为虚假或缺乏足够证据的信息)
      • 相关准则:提供切题的信息
      • 方式准则:提供清楚的信息(避免模糊表达;避免歧义;简短,避免啰嗦;有序)

对话行为多层置标语言

对话行为(或会话行动)建立在奥斯汀和塞尔的言语行为理论基础之上,是被丰富了的言语行为。对话行为多层置标语言(Dialogue Act Markup in Several Layers,DAMSL)是一个对话行为标注方案,包括向前功能和向后功能,是对言语行为的扩展,扩展了毗邻对这样的对话结构概念以及对话共同基础和对话修复的概念。

如何确定一个给定的输入是 QUESTION,STATEMENT,还是 SUGGEST,还是 ACKNOWLEDGEMENT 呢?

  • 一种解决方法是使用连续的习语集。但有个问题是:实施一个间接请求的方式可能有很多种,而每种方式表面的语法结构可能会有细微的差别,于是不得不把 REQUEST 的意义添加给许多不同的表达。
  • 另一种方法是使用推理。通过推理方法解释对话行为有两种模型:基于计划推理和基于习语提示。

BDI 模型

Gordon 和 Lakoff 以及 Searle 最早提出,他们注意到存在一种对应于事件类型的结构,通过这些事件类型说话人可以发出间接请求。特别是,说话人可以提及或询问所期望行为的各种非常特定的属性以发出间接请求。

关于推理方法的建模问题,Allen,Cohen 和 Perrault 提出了 ”信念-期望-意图模型“(Belief,Desire and Intention Model,简称 BDI 模型),一个建立在言语行为理论基础上的语用自动处理形式模型。BDI 对信念和期望的形式化定义如下:

  • 信念
    • 把 ”S 相信命题 P“ 表示为二元谓词 B(S, P),B 即为信念。
    • 知识被看成 ”真的信念“,知识就是一种信念:S 具有知识就等于 S 知道某种命题,这样就可以用 ”知道“ 描述信念。”S 知道命题 P“ 表示为 KNOW(S, P),含义是 ”存在某个命题 P,并且 S 相信 P“。即:KNOW(S, P) = PΛB(S, P)。
    • ”知道是不是“ 定义为:KNOWIF(S, P) = KNOW(S, P) V KNOW(S, !P)
  • 期望
    • 用 WANT 或 W 定义,”S 期望 P 为真“ 可定义为:WANT(S, P),P 可以是行为的状态或实施动作,如 W(S, ACT(H)) 表示 ”S 想要让 H 实施行为 ACT“。

BDI 需要对行为和计划进行形式化描述,因此需要使用公理化方案,最简单的公理化方案要根据 ”行动方案“ 来建立。每个行动方案都有一个参数集,包括对于每个变量类型的 ”约束“ 以及行为的 ”前提“、”效果“ 和 ”实体“。这样的行动方案既是 ”以言表意“ 的言语行为,也是 ”以言行事“ 和 ”以言取效“ 的言语行为。这是 ”言语行为理论“ 的形式化描述。详见 P538 的例子(包括 INFORM,INFORMIF 和 REQUEST 三种与间接请求有关的言语行为方案的形式化定义)。

  • 前提(precondition):表示成功地实施某种言语行为必须为真的那些条件
  • 效果(effect):表示成功地实施某种言语行为之后结果变为真的那些条件
  • 实体(body):表示在实施某种言语行为的过程中,必须达到的部分有序的目标

基于计划推理

以上定义只涉及 ”表面层的行为“,还需要推导出隐藏在 ”字面意义“ 之后的 ”真实意义“。推导过程中的推理链是一种 ”貌似合理的推理链“,采用基于 ”计划推理“ 的启发式规则来实现。具体规则如下:

  • 行为-效果规则(Action-Effect,PI.AE):对所有行为人 S 和 H,如果 Y 是行为 X 的效果,并且如果 H 相信 S 想实施 X,则 H 相信 S 想获得 Y 是合理的
  • 前提-行为规则(Precondition-Action,PI.PA):对所有行为人 S 和 H,如果 X 是行为 Y 的前提,并且如果 H 相信 S 想获得 X,则 H 相信 S 想实施 Y 是合理的
  • 实体-行为规则(Body-Action,PI.BA):对所有行为人 S 和 H,如果 X 是 Y 的实体的一部分,并且如果 H 相信 S 想实施 X,则 H 相信 S 想实施 Y 是合理的
  • 知道-期望规则(Know-Desire,PI.KD):对所有行为人 S 和 H,如果 H 相信 S 想 KNOWIF(P),则 H 相信 S 相认 P 为真
  • 扩展推理规则(Extended Inference,EI):如果 B(H, W(S, X)) => B(H, W(S, Y)) 是一个 PI 规则,那么 B(H, W(S, B(H, (W(S, X))))) =>B(H, W(S, B(H, (W(S, Y))))) 也是一个 PI 规则。意味着可以把 B(H, W(S)) 放在任何计划推理规则之前。

基于习语提示

计划推理虽然强大,但耗费太高,实际上是 AI 完全问题。对许多应用来说,较简单的数据驱动方法就能满足需求,其中一种就是基于习语提示的对话行为解释模型。基于提示的模型之间的不同在于辨别对话行为时采用提示知识源的不同,比如可以采用词汇、搭配、句法、韵律或对话结构等不同的提示知识源。

其实就是我们平时用的有监督模型,准确来说是分类模型。

比如 Jurafsky 等的对话行为解释系统使用了如下信息源:

  • 单词和搭配:如 please 或 would you 是 RQUEST 的有效提示
  • 韵律:比如上升音高 YES-NO-QUESTION(是非疑问句)是有效提示
  • 会话结构:比如 SUGGEST 之后的 yeah 可能是 AGREEMENNT

意图方法

可以把意图方法看成是 BDI 模型的一个组成部分。根据意图方法,话段被理解为言语行为,需要听话人推测基于计划的说话人的意图,这是确立连贯关系的基础。意图方法主要应用于研究对话。

Grosz 和 Sidner 认为话语可以表示为三个相互关联的部分:语言结构、关注状态、意图结构。话语是这三个部分组成的混合体。

  • 语言结构包括话语中的话段,分成话语片断的层级结构。
  • 关注状态是话语在每一点具有显著性的对象、属性和关系的动态变化的模型
  • 意图结构的基本思想是把话语与该话语行为的发起人所持有的潜在目的联系在一起,这个目的称为 ”话语目的“(DP);话语中每个话语片断也有一个相应的目的,称为 ”话语片断目的“(DSP)。

Grosz 和 Sidner 给出的一些可能的 DP/DSP:

  • 某些行为人企图实施某些实际任务的意图
  • 某些行为人相信某些事实的意图
  • 某些行为人相信一个事实支持另外一个事实的意图
  • 某些行为人企图识别一个对象(物理对象、虚构对象、计划、事件和事件序列)的意图
  • 某些行为人知道一个对象的某些属性的意图

Grosz 和 Sidner 只用了两种连贯关系:支配、优先满足。如果满足 DSP2 的目的是为 DSP1 的满足提供部分基础,就说 DSP1 支配 DSP2;如果 DSP1 必须在 DSP2 之前被满足,就说 DSP1 优先满足于 DSP2。

对话可以据此导出为话语结构,话语片断分别与意图联系,形成 ”意图集“。意图集及它们之间的关系要根据它们在被推理出的说话人在整个计划中所充当的角色,才能够形成连贯的话语。

辅助话语片断也叫 ”子对话“:

  • 其中 ”知识前提子对话“ 是被行动者发起以帮助实现满足更高层目标的前提,也叫信息共享子对话。
  • 另一种类型是 ”修正子对话“,又叫 ”磋商子对话“。

对话中意图结构的推理算法与对话行为的推理算法很相似,很多都是 BDI 模型的变体。

除了意图连贯还有信息连贯,意图连贯取决于对话参与者识别彼此的意图并使这些意图适合于他们的计划的能力;信息连贯取决于确立话段之间内容所承担的某些类型关系的能力。Moore 和 Pollack 认为意图连贯和信息连贯两个层次的分析必须共存,它们相辅相成。

会话智能代理系统

最简单的对话管理组件的架构是基于有限状态自动机的。许多基于语音的问答系统都是以用于旅行航线的计划 GUS 系统为基础的,并引入了基于框架或模板的较新的 ATIS 系统以及其他的旅行和饭店向导系统。基于模板的系统本质上是一个生成规则的系统,不同类型的输入可以激发不同的生成规则,每个生成能够灵活地填入不同的模板。生成规则能够基于一些因素进行转换控制,这些因素包括用户的输入和一些简单的对话历史。

数理逻辑学家 R. Carnap 在 1942 年提出要区分语言研究的三个领域:

  • 如果在一种语言中,明确地指称涉及说话人(或语言的使用者),可归于语用学领域
  • 如果抽去语言的使用者,仅仅分析语言的表达形式及其所指,就处于语义学领域
  • 如果再抽去所指,仅仅分析语言表达形式之间的关系,就处于逻辑句法学的领域

小结

  • Mann 和 Thompson 的修辞结构理论
    • 1987 年,W. Mann 和 S. Thompson 提出修辞结构理论(RST),一种基于文本局部之间关系的关于文本组织的描述理论。
    • RST 的核心是修辞关系的概念,修辞关系是存在于两个互不重叠的文本跨段之间的关系,一个叫 “核心单元”,一个叫 “卫星单元”,这种区分来自经验观察。
    • 他们总结出了 25 种修辞关系,分为 “核心-卫星关系”(21 种)和 “多核心关系”(4 种),分别表示为 N-S 和 N-N(…N)。
    • 用来描写文本结构的 RST 只辨识结构的三种主要类型:整体结构、关系结构和句法结构,并主要研究中间一层的关系结构。
    • RST 提出了文本的树结构模型,从根节点开始的树形图可以代表整个文本的修辞关系结构。他们认为对文本的一个典型分析是应用一套图式使下列限制成立:
      • 完整性:有一个图式(根节点)可以覆盖整个文本
      • 联系性:除根节点外,每一个分析中的文本跨段要么是一个最小单元,要么是分析中另一个图式应用的一个成分
      • 唯一性:每一个图式应用都涉及不同的一套文本跨段
      • 邻接性
    • RST 文本分析一般采用自底向上剖析过程,它提供了一种讨论书面独白文本的联系性和整体性,以及文本如何为作者的目的服务的方法。从渊源上,它采用的是语用功能主义思想,受 Halliday 系统功能语法影响很大。
    • RST 并不具有显著的跨语言可转移性,它的优点是提供了完整的分析而不是选择性解释,可以应用于很多种不同的文本,允许不考虑语类对文本结构做一种统一的描写,有助于区分文本中那些真正是语类特殊的方面与那些相对而言更独立于语类的方面。不足包括:没有对各种关系如何实现做出系统描写;没有将它的理论与各种文本特性的理论(如信息流、主题结构、词汇结构等)联系起来。
  • 文本连贯中的常识推理技术
    • 语言通常并不是由孤立无关的句子组成,而是由搭配在一起的相关句子群组成的,这种句子群称为 ”话语“
    • 话语的话段之间所有可能的连接称为连贯关系的集合。常见的连贯关系有结果、说明、平行、详述和时机
    • 每个连贯关系与一个或多个约束有关,符合约束才能维持连贯关系。如何应用这些约束?推理,语言系统由于所依赖的推理是不可靠的,这类推理方法称为 ”溯因推理“(从结果中寻找可能的原因)。
    • 在确定话段间最合理的连贯关系时,需要利用世界知识和领域知识,但这是个 AI 完全问题,因为需要人类拥有的所有知识。
    • 句子间连贯关系导致话语结构,一组局部连贯话段的节点被称为 ”话语片断“。话语结构的计算所涉及的 ”话语语法“ 只牵扯两个规则:把一个片断改写为两个较小的片断的规则,以及判断一个句子就是一个片断的规则。
  • 言语行为理论和会话智能代理
    • 哲学基础:维特根西坦、奥斯汀、塞尔
    • 会话分析与书面独白三个不同的重要特性:话轮转换、会话的共同基础和会话中的隐涵。
    • 对话行为(或会话行动)建立在奥斯汀和塞尔的言语行为理论基础之上,是被丰富了的言语行为。对话行为多层置标语言是一个对话行为标注方案,包括向前功能和向后功能,是对言语行为的扩展,扩展了毗邻对这样的对话结构概念以及对话共同基础和对话修复的概念。
    • 通过推理方法解释对话行为有两种模型:基于计划推理和基于习语提示。
    • 关于推理方法的建模问题,Allen,Cohen 和 Perrault 提出了 ”信念-期望-意图模型“(Belief,Desire and Intention Model,简称 BDI 模型),一个建立在言语行为理论基础上的语用自动处理形式模型。BDI 需要对行为和计划进行形式化描述,因此需要使用公理化方案,最简单的公理化方案要根据 ”行动方案“ 来建立。每个行动方案都有一个参数集,包括对于每个变量类型的 ”约束“ 以及行为的 ”前提“、”效果“ 和 ”实体“。这样的行动方案既是 ”以言表意“ 的言语行为,也是 ”以言行事“ 和 ”以言取效“ 的言语行为。这是 ”言语行为理论“ 的形式化描述。
    • 除此涉及 ”表面层的行为“ 之外(通过 BDI),还需要推导出隐藏在 ”字面意义“ 之后的 ”真实意义“。推导过程中的推理链是一种 ”貌似合理的推理链“,采用基于 ”计划推理“ 的启发式规则来实现。具体规则包括:行为-效果规则(Action-Effect,PI.AE)、前提-行为规则(Precondition-Action,PI.PA)、实体-行为规则(Body-Action,PI.BA)、知道-期望规则(Know-Desire,PI.KD)和扩展推理规则(Extended Inference,EI)。
    • 计划推理虽然强大,但耗费太高,实际上是 AI 完全问题。对许多应用来说,较简单的数据驱动方法就能满足需求,其中一种就是基于习语提示的对话行为解释模型。基于提示的模型之间的不同在于辨别对话行为时采用提示知识源的不同,比如可以采用词汇、搭配、句法、韵律或对话结构等不同的提示知识源。
    • 可以把意图方法看成是 BDI 模型的一个组成部分。根据意图方法,话段被理解为言语行为,需要听话人推测基于计划的说话人的意图,这是确立连贯关系的基础。意图方法主要应用于研究对话。Grosz 和 Sidner 认为话语可以表示为三个相互关联的部分:语言结构、关注状态、意图结构。话语是这三个部分组成的混合体。Grosz 和 Sidner 只用了两种连贯关系:支配、优先满足,对话可以据此导出为话语结构,话语片断分别与意图联系,形成 ”意图集“。意图集及它们之间的关系要根据它们在被推理出的说话人在整个计划中所充当的角色,才能够形成连贯的话语。
    • 会话智能代理系统主要基于有限状态自动机和基于模板的,都有很明显的局限性。

本章主要介绍了语用自动处理的形式模型,主要有两个模型:RST 和 BDI。

第三节通过会话智能代理系统说明 BDI 的使用,我的理解是基于 DAMSL,BD+ 计划推理是一类,习语提示是一类,I(意图)+ BD是一类。第一类 BD 主要负责字面意义,计划推理负责真实意义;第二类直接通过有监督学习确定;第三类意图为核心,BD 起辅助作用。(注:BD 实际指基于它的行动方案)。

理解不一定正确,最后一节内容感觉有点混乱。感觉各种形式模型貌似都是理论上看起来不错,实际操作还是有监督学习,虽然简单粗暴但效果并不差。