关键词:智能体
3 对智能体行为理性、博弈与效用的重新考察
下面,我们仅从经济学及社会学出发,简要地讨论智能体的逻辑理发和作为描述其社会互动作用重要理论工具的博弈论(对策论)方法及其理性基础等相关论题,并指出其中可能存在的某些问题:
(1)智能体的逻辑理性要求它没有自我冲突的目标,主要由“合乎逻辑”的信念、意图、揄机制等组成。并为此提出了各种基于模态要领的逻辑体系,即所谓的 BDI模型。这样,从概念的角度看来,逻辑理性实现了理性的推理环节,但对于一个明显地处于动态环境中,资源扔限的智能体来说,不仅需要这种理性的推理, 更重要的是值得去做这种推理并能获得其最大收益(效用)。这就很自然地将严格的自利理性假设引入到智能体研究中,并被视作智能体参与社会互动的“理性基 础”。在智能体的博弈论方法中,这咱理性是在个人自利的假定与给定的约束条件下达到个体效用的极大化,其效用值则根据信念、愿望和偏好通过赋与不同的概率 数值而得到。
(2)如果智能体仅以效用原则从严格自利的理性假设出发通过社会博弈来实现其整体效用,那么,根据同一假设,个体在互动中又必然会首先以优化它自己的效用 来采取策略。这样,就可能会产生某些问题。首先,在传统方法中,出于个体智能的特征,其决策原则可以是单一的、完备的。但在一个开放的智能体社会中,它的 决策原则更应根据多元准则而不仅仅是一个单一的效用原则来进行。其次,在现实的博弈过程中,智能体如果按照完全理性来进行博弈,则往往达不到社会效用的帕 累托最优。另外,即便这种整体最优能够实现,其博弈次数将十分惊人,而无法在一个有限与有效的次数内完成。同时,博弈者的数量也受到相当的限制,无法达到 智能体系统所预设的规模,而且,这种博弈始终要求是同一群博弈者,而不是多智能体系统中数量在不断变化的开放的博弈群体,同时,它还会出现许多个均衡,而 无法实时地提供惟一的最优解,尤其需要注意的是,其博弈规则和策略变量是内生的、历史的、演进的,不是外生的、预设的,静态的(抑制智能体的策略能动性) 这样一个重要问题,在现有的理论框架中是很不清晰的,而当智能体的委托一代理问题大量出现,从而造成很难准确地界定合作中的冲突性和博弈类型等问题时,就 会使得博弈论方法的“刚性框架”和智能体理论灵活的“柔性要求”一再发生矛盾,很难兼顾。
再次,现实世界中的协商大多是在动态的、非对称、非完全信息下进行的。因而对任何个体来说,其知识都是一种局域性知识,而社会智能的实现却总是有赖于社会 互动中知识与信息的共享及能力的协调,那么由何种(合作性)博弈才能在诸多不对称条件下实现由个体局域知识到社会整体的知识共享(即共同知识,在这里,我 们对共同知识仅作狭义上的直观理解)――进而能够克服一直困扰着诸多研究者的“共同知识”难题并最终获得最优解?此外,社会中的个体理性大多是以综合其自 身微观效用和社会宏观效用的复杂的“折衷”理性来进行决策。那么,实际博弈中的个体理性要比目前的理论描述复杂微妙得多,且完全无法由目前狭隘的“理性” 所能够包容和处理,那么从自利理性出发又达不到共同知识的群体博弈又臬才能达到整个社会效用的完美均衡而不至于陷入到类似于囚徒困境的结局中呢?依照古典 经济学观点,在没有全局协调者的情况下,即使每个主体都严格按照自利的理性行动,也有可能出现如亚当斯密所谓的“看不见的手”的驱使,达到个人理性与集体 理怀的并行不悖。而按照当代集体选择理论,个体理性并非是实现集体理性的充分条件,在博弈中,如果发生现实中常常出现。因此,在描述这种大规模频繁合作的 社会行为时,除了其巨大的社会交易成本的制约外(在这里我们不做深入的讨论),现成的博弈论特别是其理性基础有着十分明显的不足。这样,除非我们对理性 (如有限理性、交互理性等)进行便为深入的探究并重新开发出更为有力的新理论,否则,将给智能体理论带来某些相当难以克服的问题。最后,当我们把逻辑理性 和经济理性联系起来看时,使有符号推理的逻辑理性无法使决策效用最优化,而使用数值计算的博弈理性又忽视了理性的逻辑推理,那么如何较好地协调这两种机 制,裨上是如何协调好逻辑推理的必然性与决策中的不确定性,显然又是一个十分艰难的问题。