关键词:Agent
一、系统思想与技术基础
Multi-Agent系统(MAS)是一些自主的Agent通过协作完成某些任务或达到某些目标的
计算系统。
Herbet Simon的有限性(Bounded Rationality)和Marvin Minsky的"Society of Min
d"奠定了MAS的思想基础。Simon在"Administrative Behavior"一书中认为:一个大的机构
把许多个体组织起来,可以弥补个体工作能力的有限;同样,劳动的分工和每个个体负责一
项专门的任务,可以弥补个体学习新任务能力的有限;社会机构间有组织的信息流动,可以弥
补个体知识的有限;精确的社会机构和明确的个体任务,可以弥补个体处理信息并运用信息
作出决策能力的有限。尽管Simon的理论是针对人类社会而言的,但它却为一类新的计算系
统的结构奠定了基础。单个Agent的智能是有限的,但我们可以通过适当的体系结构把Agen
t组织起来,从而弥补各个Agent的不足,使得整个系统的能力超过任何单个Agent的能力 。
1986年,MIT的著名计算机学家及人工智能学科创始人之一M.Minsky出版了一本题为"
Society of Mind"的书。这本书的主题就是试图将"社会"与"社会行为"这些概念引入计算
中。这是一个十分大胆的假设。社会机制和传统意义上计算的本质区别在于:在问题求解中
,传统的计算是封闭的,这意味着传统的计算需要满足一致性的要求;相反,"社会机制"是开
放的,不能满足一致性的条件,而是在有矛盾的条件下,社会中的一部分个体通过某种协商机
制获得一个可接受的解。Minsky把这样一些计算社会中的个体称为Agent。在1994年 ,Min
sky在《Communication of ACM杂志》上对Agent这个概念作了更明确的说明:"Agent是一些
具有特别技能的个体",对计算机系统而言,Agent是指"当你试图说明完成一些任务的机器而
无需了解它是如何工作时,即将其处理为黑箱时,就称其为Agent"。这个说明是从社会与社
会中的个体两个方面来规定的。对社会而言,Agent是能完成一些特定任务的个体,社会不关
心它是如何工作的;而对个体而言,则要求它们具有一定的技能,否则将不为社会 所接受。
分布式人工智能的产生和发展为MAS提供了技术基础。分布式人工智能(DAI)的研究始
于70年代末期,当时主要研究分布式问题的求解,其目的在某种程度上是为了解决计算效率
问题。分布式问题求解研究的缺点在于假设系统都具有自己的知识与目标,因而不能保证它
们相互之间不发生冲突。由于分布式问题求解不能处理这种情况,人们就提出了MAS这个概
念。80年代中期以后,DAI的研究重点逐渐转到MAS的研究上,并出现了如下几个新特点:1MA
S不仅研究单个Agent复杂的体系结构以及这样的Agent之间的简单交互,而且研究大量相对
简单的Agent之间的复杂交互,即建立复杂的社会模型,而不是复杂的个体模型。人们现在更
关注MAS中社会层次上的知识和行为。2由于实践证明在复杂的系统中一致性的要求很难满
足,MAS必须考虑如何处理冲突、欺骗以及不同观点和目标的集成。
实际上,随着Internet的出现和发展,MAS的研究已经不局限于DAI,而是渗透到计算机
网络、软件工程以及人机交互等领域。
二、环境与协作
1.环境
环境可以分为自然环境和社会环境。自然环境是指Agent所处的物理世界(对机器人而
言)或软件环境(对软件系统而言),而社会环境则是指各个Agent之间的相互关系。
在处理Agent和环境的关系上,以往Agent的研究重点是对应问题,即Agent的内部表示
与外部环境的对应关系。这种方法的不足之处在于:1假定Agent准确地预见世界在某一点的
状态,当其采取了某一动作后,它如何推理出世界的下一个状态,这就是Frame问题。2这种方
法具有脆弱性及不灵活性,当环境变化时,Agent的内部表示不能作出相应的变化以适 应新
的环境。
为了避免这个问题,研究者转而研究所谓的演变问题。这种方法侧重Agent和环境的交
互关系并以某种方式刻划这些关系,特别是其中的不变量及Agent和环境的演化。此方法的
特点是:1Agent是物理环境的一部分,这就意味着世界本身就是自己最好的模型,Agent并不
需要做很多的建模。事实上,环境可以看作是Agent的外部存储器。2Agent是社会环境的一
部分,Agent可以和其它Agent协作而不必独自处理每一件事情。3Agent可以随时间和环境的
变化而演化,它对一个问题的解决是逐步递增的。
目前,在考虑演变的情况下,对环境的刻划已有了初步的研究,大致可以分为两种:1有限
状态机器。在这种环境中,Agent的行为将导致环境状态的变化,同时Agent的输入也将相应
变化,但环境状态可以变化的数目是有限的。环境的下一个状态和Agent的下一个输入,都是
当前状态和Agent的行为函数。它的缺点是忽略了环境的不确定性。2感觉状态机器。
在这种环境中,Agent的下一个输入与当前的输入及Agent的行为有关,但下一个输入是
不确定的。
研究Agent与环境交互作用的思想有两种,一种是规划,另一种是反应。在研究初期,研
究者并未有意识地区分两者,而是笼统地把两者统称为规划,指用来控制一系列操作执行顺
序的层次过程。长期以来,人们都把研究重点集中在前者,其中著名的系统包括Newell和S
imon的GPS以及Nillson的STRIPS等等。
规划假定环境基本上是稳定的,Agent是改变环境的唯一重要因素,Agent和环境的交互
作用可以通过某种搜索过程来预测。但是规划的一个缺点是它没有真正地考虑行为如何适
应环境的问题,因此规划只适用于系统完全了解并可控制的环境,因而系统在规划被执行前
就预知其行为后果。而反应则强调系统与环境的交互作用,特别是感知-行为的作用。正如
规划不提供系统与环境实时的、鲁棒的交互,反应也不保证系统行为一定能达到预期的目标
,甚至不能保证其行为是理性的。由于这两者都有各自的优缺点,目前,人们便尝试着把两者
结合起来,于是产生了所谓的混合体系。
Multi-Agent系统(MAS)是一些自主的Agent通过协作完成某些任务或达到某些目标的
计算系统。
Herbet Simon的有限性(Bounded Rationality)和Marvin Minsky的"Society of Min
d"奠定了MAS的思想基础。Simon在"Administrative Behavior"一书中认为:一个大的机构
把许多个体组织起来,可以弥补个体工作能力的有限;同样,劳动的分工和每个个体负责一
项专门的任务,可以弥补个体学习新任务能力的有限;社会机构间有组织的信息流动,可以弥
补个体知识的有限;精确的社会机构和明确的个体任务,可以弥补个体处理信息并运用信息
作出决策能力的有限。尽管Simon的理论是针对人类社会而言的,但它却为一类新的计算系
统的结构奠定了基础。单个Agent的智能是有限的,但我们可以通过适当的体系结构把Agen
t组织起来,从而弥补各个Agent的不足,使得整个系统的能力超过任何单个Agent的能力 。
1986年,MIT的著名计算机学家及人工智能学科创始人之一M.Minsky出版了一本题为"
Society of Mind"的书。这本书的主题就是试图将"社会"与"社会行为"这些概念引入计算
中。这是一个十分大胆的假设。社会机制和传统意义上计算的本质区别在于:在问题求解中
,传统的计算是封闭的,这意味着传统的计算需要满足一致性的要求;相反,"社会机制"是开
放的,不能满足一致性的条件,而是在有矛盾的条件下,社会中的一部分个体通过某种协商机
制获得一个可接受的解。Minsky把这样一些计算社会中的个体称为Agent。在1994年 ,Min
sky在《Communication of ACM杂志》上对Agent这个概念作了更明确的说明:"Agent是一些
具有特别技能的个体",对计算机系统而言,Agent是指"当你试图说明完成一些任务的机器而
无需了解它是如何工作时,即将其处理为黑箱时,就称其为Agent"。这个说明是从社会与社
会中的个体两个方面来规定的。对社会而言,Agent是能完成一些特定任务的个体,社会不关
心它是如何工作的;而对个体而言,则要求它们具有一定的技能,否则将不为社会 所接受。
分布式人工智能的产生和发展为MAS提供了技术基础。分布式人工智能(DAI)的研究始
于70年代末期,当时主要研究分布式问题的求解,其目的在某种程度上是为了解决计算效率
问题。分布式问题求解研究的缺点在于假设系统都具有自己的知识与目标,因而不能保证它
们相互之间不发生冲突。由于分布式问题求解不能处理这种情况,人们就提出了MAS这个概
念。80年代中期以后,DAI的研究重点逐渐转到MAS的研究上,并出现了如下几个新特点:1MA
S不仅研究单个Agent复杂的体系结构以及这样的Agent之间的简单交互,而且研究大量相对
简单的Agent之间的复杂交互,即建立复杂的社会模型,而不是复杂的个体模型。人们现在更
关注MAS中社会层次上的知识和行为。2由于实践证明在复杂的系统中一致性的要求很难满
足,MAS必须考虑如何处理冲突、欺骗以及不同观点和目标的集成。
实际上,随着Internet的出现和发展,MAS的研究已经不局限于DAI,而是渗透到计算机
网络、软件工程以及人机交互等领域。
二、环境与协作
1.环境
环境可以分为自然环境和社会环境。自然环境是指Agent所处的物理世界(对机器人而
言)或软件环境(对软件系统而言),而社会环境则是指各个Agent之间的相互关系。
在处理Agent和环境的关系上,以往Agent的研究重点是对应问题,即Agent的内部表示
与外部环境的对应关系。这种方法的不足之处在于:1假定Agent准确地预见世界在某一点的
状态,当其采取了某一动作后,它如何推理出世界的下一个状态,这就是Frame问题。2这种方
法具有脆弱性及不灵活性,当环境变化时,Agent的内部表示不能作出相应的变化以适 应新
的环境。
为了避免这个问题,研究者转而研究所谓的演变问题。这种方法侧重Agent和环境的交
互关系并以某种方式刻划这些关系,特别是其中的不变量及Agent和环境的演化。此方法的
特点是:1Agent是物理环境的一部分,这就意味着世界本身就是自己最好的模型,Agent并不
需要做很多的建模。事实上,环境可以看作是Agent的外部存储器。2Agent是社会环境的一
部分,Agent可以和其它Agent协作而不必独自处理每一件事情。3Agent可以随时间和环境的
变化而演化,它对一个问题的解决是逐步递增的。
目前,在考虑演变的情况下,对环境的刻划已有了初步的研究,大致可以分为两种:1有限
状态机器。在这种环境中,Agent的行为将导致环境状态的变化,同时Agent的输入也将相应
变化,但环境状态可以变化的数目是有限的。环境的下一个状态和Agent的下一个输入,都是
当前状态和Agent的行为函数。它的缺点是忽略了环境的不确定性。2感觉状态机器。
在这种环境中,Agent的下一个输入与当前的输入及Agent的行为有关,但下一个输入是
不确定的。
研究Agent与环境交互作用的思想有两种,一种是规划,另一种是反应。在研究初期,研
究者并未有意识地区分两者,而是笼统地把两者统称为规划,指用来控制一系列操作执行顺
序的层次过程。长期以来,人们都把研究重点集中在前者,其中著名的系统包括Newell和S
imon的GPS以及Nillson的STRIPS等等。
规划假定环境基本上是稳定的,Agent是改变环境的唯一重要因素,Agent和环境的交互
作用可以通过某种搜索过程来预测。但是规划的一个缺点是它没有真正地考虑行为如何适
应环境的问题,因此规划只适用于系统完全了解并可控制的环境,因而系统在规划被执行前
就预知其行为后果。而反应则强调系统与环境的交互作用,特别是感知-行为的作用。正如
规划不提供系统与环境实时的、鲁棒的交互,反应也不保证系统行为一定能达到预期的目标
,甚至不能保证其行为是理性的。由于这两者都有各自的优缺点,目前,人们便尝试着把两者
结合起来,于是产生了所谓的混合体系。